Edby 0 H

edby0h
Université Joseph Fourier, Grenoble Maths en Ligne
Langage mathématique
Eric Dumas, Emmanuel Peyre et Bernard Ycart
Ce chapitre vous explique la règle du jeu mathématique. Rien n’est vraiment nou-
veau ni compliqué. Pour donner des exemples d’énoncés, nous ferons appel à quelques
notions de base sur les nombres entiers, que vous connaissez depuis longtemps.
Table des matières

1 Cours 1
1.1 Assertions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Quantificateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Cardinaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.7 Raisonnements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Entraînement 27
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.5 Corrigé du devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3 Compléments 52
3.1 La quantification des prédicats . . . . . . . . . . . . . . . . . . . . . . . 52
3.2 Ces longues chaînes de raisons . . . . . . . . . . . . . . . . . . . . . . . 54
3.3 Le Docteur Illuminé . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.4 Ramener l’infini au fini . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.5 Lettres à une Princesse d’Allemagne . . . . . . . . . . . . . . . . . . . . 58
3.6 Froid dans le dos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.7 Le rêve de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.8 La langue universelle de Peano . . . . . . . . . . . . . . . . . . . . . . . 62
3.9 Les cardinaux infinis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.10 Ensembles quotients . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.11 Démonstrations non constructives . . . . . . . . . . . . . . . . . . . . . 67
3.12 L’ensemble de tous les ensembles . . . . . . . . . . . . . . . . . . . . . 68
18 juillet 2015
Maths en Ligne Langage mathématique UJF Grenoble
1 Cours
1.1 Assertions
On peut voir le langage mathématique comme un jeu de construction, dont le
but est de fabriquer des énoncés vrais. La règle de base de ce jeu est qu’un énoncé
mathématique ne peut être que vrai ou faux. Il ne peut pas être « presque vrai » ou
« à moitié faux ». Une des contraintes sera donc d’éviter toute ambiguïté et chaque
mot devra avoir un sens mathématique précis.
Selon le cas, un énoncé mathématique pourra porter des noms différents.
• assertion : c’est le terme que nous utiliserons le plus souvent pour désigner une
affirmation dont on peut dire si elle est vraie ou fausse.
• théorème : c’est un résultat important, dont on démontre ou on admet qu’il est
vrai, et qui doit être connu par cœur.
• proposition : nous utiliserons ce terme pour désigner un résultat démontré, moins
important qu’un théorème.
• lemme : c’est un résultat démontré, qui constitue une étape dans la démonstra-
tion d’un théorème.
• corollaire : c’est une conséquence facile d’un théorème ou d’une proposition.
Dans ce cours les démonstrations se terminent par un carré blanc, plutôt que par le
célèbre CQFD (« ce qu’il fallait démontrer »). Pour écrire formellement des énoncés
mathématiques, on utilise des lettres représentant des concepts (nombres, ensembles,
fonctions, vecteurs, matrices, polynômes. . . ) avec des symboles logiques et des relations.
Le but de ce chapitre étant d’illustrer la manipulation du langage, il ne comportera
aucune difficulté mathématique. Nous en resterons à des énoncés très simples, que l’on
prendra soin de toujours traduire en langage courant pour bien les comprendre. Dans ce
qui suit les lettres m et n désignent des entiers naturels (0, 1, 2, . . .). Nous n’utiliserons
que les symboles de comparaison (<, >, 6, >) et de divisibilité ( | ). Rappelons que
m | n (« m divise n ») si n est égal au produit km pour un certain entier k.
n<5 l’entier n est strictement inférieur à 5

n>3 l’entier n est supérieur ou égal à 3
n | 12 l’entier n divise 12
2|n l’entier n est divisible par 2 (il est pair)
Pour combiner entre elles des assertions, on utilise les connecteurs de base suivants :
• la négation (« non »), notée ¬
• la conjonction (« et »), notée ∧
• la disjonction (« ou »), notée ∨.
Le tableau suivant est une table de vérité. Il décrit l’effet des connecteurs sur deux
assertions A et B, selon qu’elles sont vraies (V ) ou fausses (F ), en disant dans chacun
1
des 4 cas si l’assertion composée est elle-même vraie ou fausse.
négation conjonction disjonction

non et ou
A B ¬A A∧B A∨B
V V F V V
V F F F V
F V V F V
F F V F F
Le « ou » est toujours inclusif : A ou B signifie que l’une au moins des deux assertions
est vraie (peut-être les deux). Par opposition, le « ou exclusif » est vrai quand l’une
des deux assertions est vraie mais pas les deux. Voici quelques assertions composées et
leur traduction.
¬(n < 5) l’entier n n’est pas strictement inférieur à 5.
(n < 5) ∧ (2 | n) l’entier n est strictement inférieur à 5 et divisible par 2.
(2 | n) ∨ (3 | n) l’entier n est divisible par 2 ou par 3.
Observez l’usage des parenthèses qui permettent d’isoler des assertions simples au sein
d’une assertion composée.
À partir des connecteurs de base, on en fabrique d’autres, dont les plus importants
sont l’implication et l’équivalence. Par définition, l’implication A =⇒ B est vraie soit
si A est fausse soit si A et B sont vraies toutes les deux. L’écriture A =⇒ B est donc
une notation pour
(¬A) ∨ B (« non A ou B »). L’équivalence A ⇐⇒ B est une double
implication : (A =⇒ B) ∧ (B =⇒ A) (« A implique B et B implique A »). Voici
les tables de vérité des implications et de l’équivalence entre deux assertions A et B.
Constatez que l’équivalence A ⇐⇒ B est vraie quand A et B sont toutes les deux
vraies, ou bien toutes les deux fausses.
A B A =⇒ B B =⇒ A A ⇐⇒ B
V V V V V
V F F V F
F V V F F
F F V V V
L’implication et l’équivalence sont les outils de base du raisonnement mathématique.

Il est essentiel de bien les assimiler, et de comprendre toutes leurs formulations.
2
A =⇒ B
A implique B
A entraîne B
si A est vrai alors B est vrai
B est vrai si A est vrai
A est vrai seulement si B est vrai
pour que B soit vrai il suffit que A le soit
A est une condition suffisante pour B
pour que A soit vrai il faut que B le soit
B est une condition nécessaire pour A
Pour bien comprendre l’implication, reprenez chacune des formulations en remplaçant
A par « n > 3 » et B par « n > 2 ».
A ⇐⇒ B
A est équivalent à B
A équivaut à B
A entraîne B et réciproquement
si A est vrai alors B est vrai et réciproquement
A est vrai si et seulement si B est vrai
pour que A soit vrai il faut et il suffit que B le soit
A est une condition nécessaire et suffisante pour B
Pour bien comprendre l’équivalence, reprenez chacune des formulations en remplaçant
A par « n > 3 » et B par « n > 2 ».
Les principales propriétés des connecteurs sont résumées dans le théorème suivant.
Théorème 1. Soient A, B et C trois assertions. Les équivalences suivantes sont tou-
jours vraies.
• Commutativité :
A ∧ B ⇐⇒ B ∧ A . (1)
« A et B » équivaut à « B et A ».

A ∨ B ⇐⇒ B ∨ A . (2)
« A ou B » équivaut à « B ou A ».
• Associativité :
A ∧ (B ∧ C) ⇐⇒ (A ∧ B) ∧ C . (3)
« A et (B et C) » équivaut à « (A et B) et C ».

A ∨ (B ∨ C) ⇐⇒ (A ∨ B) ∨ C . (4)
« A ou (B ou C) » équivaut à « (A ou B) ou C ».
3
• Distributivité :

A ∧ (B ∨ C) ⇐⇒ (A ∧ B) ∨ (A ∧ C) . (5)
« A et (B ou C) » équivaut à « (A et B) ou (A et C) ».

A ∨ (B ∧ C) ⇐⇒ (A ∨ B) ∧ (A ∨ C) . (6)
« A ou (B et C) » équivaut à « (A ou B) et (A ou C) ».
• Négations :
¬(¬A) ⇐⇒ A . (7)
« non (non A) » équivaut à « A ».

¬(A ∨ B) ⇐⇒ (¬A) ∧ (¬B) . (8)
« non (A ou B) » équivaut à « (non A) et (non B) ».

¬(A ∧ B) ⇐⇒ (¬A) ∨ (¬B) . (9)
« non (A et B) » équivaut à « (non A) ou (non B) ».

Il est conseillé de remplacer A, B et C par des assertions sur les nombres entiers
pour bien comprendre les énoncés de ce théorème (par exemple A par (n 6 6), B par
(2 | n), C par (3 | n)).
Démonstration : Pour démontrer l’équivalence de deux assertions, nous n’avons pas
d’autre moyen pour l’instant que de vérifier que leurs tables de vérité coïncident : les
deux assertions sont équivalentes si elles sont toujours soit toutes les deux vraies soit
toutes les deux fausses. Voici la vérification pour (5).
A ∧ (B ∨ C) ⇐⇒ (A ∧ B) ∨ (A ∧ C) .
L’équivalence est vraie car dans la table ci-dessous, les colonnes correspondant aux
deux assertions sont identiques.
A B C (B ∨ C) A ∧ (B ∨ C) (A ∧ B) (A ∧ C) (A ∧ B) ∨ (A ∧ C)
V V V V V V V V
V V F V V V F V
V F V V V F V V
V F F F F F F F
F V V V F F F F
F V F V F F F F
F F V V F F F F
F F F F F F F F
4
Nous laissons au lecteur le soin de vérifier de même chacune des autres équivalences.
Rares sont les démonstrations mathématiques qui utilisent explicitement les tables
de vérité. Une démonstration typique est un enchaînement d’implications ou d’équiva-
lences, partant des hypothèses pour aboutir à la conclusion. Ces enchaînements utilisent
la transitivité de l’implication et de l’équivalence.
Proposition 1. Soient A, B et C trois assertions. L’énoncé suivant est toujours vrai.

(A =⇒ B) ∧ (B =⇒ C) =⇒ (A =⇒ C) . (10)
Si A implique B et B implique C, alors A implique C.
On en déduit facilement la transitivité de l’équivalence :
Corollaire 1. Soient A, B et C des assertions, l’énoncé suivant est toujours vrai.

(A ⇐⇒ B) ∧ (B ⇐⇒ C) =⇒ (A ⇐⇒ C) .
Si A équivaut à B et B équivaut à C, alors A équivaut à C.
Démonstration : Nous utilisons (une dernière fois) les tables de vérité, pour vérifier
que quelles que soient les valeurs de vérité de A, B et C, l’implication (10) est vraie.
Notons
• I1 l’assertion A =⇒ B,
• I2 l’assertion B =⇒ C,
• I3 l’assertion A =⇒ C.
A B C I1 I2 I1 ∧ I2 I3 (I1 ∧ I2 ) =⇒ I3
V V V V V V V V
V V F V F F F V
V F V F V F V V
V F F F V F F V
F V V V V V V V
F V F V F F V V
F F V V V V V V
F F F V V V V V

Nous utiliserons des enchaînements d’équivalences pour démontrer le résultat sui-
vant, qui décrit le comportement de l’implication par rapport à la négation.
Proposition 2. Soient A et B deux assertions. Les équivalences suivantes sont tou-

jours vraies.
5
1.
¬(A =⇒ B) ⇐⇒ A ∧ (¬B) . (11)
« L’implication A =⇒ B est fausse si et seulement si A est vrai et B est faux ».

2.
A =⇒ B ⇐⇒ ¬B =⇒ ¬A . (12)
« A implique B » est équivalent à « non B implique non A ».
Démonstration : Nous pourrions démontrer ces équivalences directement à l’aide des

tables de vérité (nous conseillons au lecteur de le faire). Nous allons plutôt les déduire
du théorème 1. Voici la démonstration de la première équivalence.
¬(A =⇒ B) ⇐⇒ ¬((¬A) ∨ B) par définition de l’implication

⇐⇒ ¬(¬A) ∧ ¬B par (8)
⇐⇒ A ∧ ¬B par (7).
Voici la démonstration de la seconde équivalence.

A =⇒ B ⇐⇒ (¬A) ∨ B par définition de l’implication

⇐⇒ (¬A) ∨ (¬(¬B)) par (7)

⇐⇒ (¬(¬B)) ∨ (¬A) par (2)

⇐⇒ (¬B) =⇒ (¬A) par définition de l’implication.

L’équivalence (11) est la méthode habituelle que l’on utilise pour démontrer qu’une
implication est fausse : il suffit d’exhiber une situation où A est vraie et B fausse pour
infirmer l’implication A =⇒ B. Par exemple, l’implication « (n 6 3) =⇒ (n | 3) » est
fausse, car on peut trouver un entier n tel que (n 6 3) soit vrai et (n|3) soit faux : 2 est
inférieur ou égal à 3 mais ne divise pas 3. On appelle cela « trouver un contre-exemple ».
L’équivalence (12) est aussi une technique de démonstration classique. L’implication
« (¬B) =⇒ (¬A) » (« non B implique non A ») s’appelle la contraposée de l’implication
A =⇒ B. Par exemple, la contraposée de « (n > 3) =⇒ (n > 2) » est « (n 6 2) =⇒
(n 6 3) ». Il est parfois plus facile pour démontrer une implication de démontrer sa
contraposée, nous y reviendrons.
1.2 Ensembles
Un ensemble peut être vu comme une collection d’objets mathématiques, appelés
éléments, comme l’ensemble N des entiers naturels. Contentez-vous pour l’instant de
l’idée intuitive d’un paquet d’éléments possédant une propriété commune, sur lequel on
6
a mis une étiquette rappelant cette propriété. Un ensemble n’est bien défini que si on
peut dire sans ambiguïté si un élément appartient ou non à l’ensemble. Les sommets
des Alpes ne forment pas un ensemble (comment décider qu’un endroit particulier est
un sommet ?). Par contre l’ensemble des sommets cotés sur une carte donnée est bien
défini. Deux ensembles sont égaux si et seulement si ils contiennent les mêmes éléments.
Le fait qu’un élément x appartienne à un ensemble A se note x ∈ A, et son contraire
√
x∈ / A (« x n’appartient pas à A »). Par exemple 2 ∈ N (2 appartient à N) et 2 ∈ /
N (racine de 2 n’appartient pas à N). Certains ensembles souvent utilisés ont une
notation propre, comme l’ensemble N des entiers naturels, l’ensemble R des nombres
réels, l’ensemble C des nombres complexes. Pour les autres, on utilise une définition,
que l’on écrit entre accolades pour dire qu’il s’agit de l’ensemble des éléments vérifiant
cette définition. On peut écrire un ensemble en extension, en donnant la liste de ses
éléments. Voici deux définitions de l’ensemble des entiers naturels strictement inférieurs
à 5.
{ n ∈ N ; n < 5 } = { 0, 1, 2, 3, 4 } .
Cet énoncé se lit « ensemble des n appartenant à N tels que n < 5 » ou « ensemble des
entiers strictement inférieurs à 5 ». Voici deux définitions de l’ensemble des diviseurs
de 12.
{ n ∈ N ; n | 12 } = { 1, 2, 3, 4, 6, 12 } .
On peut aussi définir des ensembles en extension par une liste infinie. Le plus souvent,
celle-ci se déduit de N. Par exemple l’ensemble des entiers supérieurs ou égaux à 5 :
{n ∈ N ; n > 5} = {n + 5 ; n ∈ N} ,
et l’ensemble des entiers pairs :
{n ∈ N ; 2 | n } = { 2n ; n ∈ N} ,
Les ensembles que nous définirons seront des sous-ensembles ou parties d’un ensemble
plus grand (comme l’ensemble des entiers N dans les exemples précédents).
Définition 1. On dit qu’un ensemble A est un sous-ensemble ou une partie d’un
ensemble E si tout élément de A est aussi élément de E.
Si A et E sont deux ensembles, on note E \ A l’ensemble formé des éléments de E
qui ne sont pas dans A.
E \ A = { x ∈ E ; x 6∈ A } .
Lorsque A est un sous-ensemble de E, on dit que E \ A est le complémentaire de A
dans E. On le note aussi cA lorqu’il n’y a pas d’ambiguïté.
Si E est l’ensemble de référence (l’ensemble des entiers dans nos exemples), l’en-
semble des parties de E se note P(E). Il contient toujours E lui-même, ainsi que
l’ensemble vide, noté ∅. Si A est un sous-ensemble (une partie) de E, on dit aussi que
A est inclus dans E, et on note A ⊂ E. On note aussi E ⊃ A pour « E contient A ».
7
Voici l’écriture en extension de P({0, 1, 2}), qui est l’ensemble des parties de l’ensemble
à trois éléments {0, 1, 2}.

P({0, 1, 2}) = ∅, {0}, {1}, {2}, {0, 1}, {0, 2}, {1, 2}, {0, 1, 2} .
Un ensemble qui ne contient qu’un seul élément, comme {0}, est un singleton. L’en-
semble P({0, 1, 2}) contient 8 éléments, dont chacun est lui-même un ensemble.
Il est fréquent (et souvent utile) de passer d’un ensemble A à l’assertion x ∈ A (vraie
ou fausse). Les connecteurs logiques entre assertions (« non », « et », « ou ») se tra-
duisent par des opérations ensemblistes : complémentaire, intersection, réunion. Nous
utiliserons cette correspondance comme définition des opérations ensemblistes.
ensembles assertions
A, B (x ∈ A), (x ∈ B)
complémentaire négation (« non »)
c
A x ∈ cA ⇐⇒ ¬(x ∈ A) ⇐⇒ x ∈ /A
intersection (« inter ») conjonction
(« et »)
A∩B (x ∈ A ∩ B) ⇐⇒ (x ∈ A) ∧ (x ∈ B)
réunion (« union ») disjonction
(« ou »)
A∪B (x ∈ A ∪ B) ⇐⇒ (x ∈ A) ∨ (x ∈ B)
Au travers de ce dictionnaire l’implication

(x ∈ A) =⇒ (x ∈ B), soit (¬(x ∈ A)) ∨ (x ∈ B) ,
devient x ∈ (cA ∪ B). Elle est toujours vraie si et seulement si le complémentaire de
(cA ∪ B), est vide, c’est-à-dire si A est inclus dans B. Les propriétés (x ∈ A) et (x ∈ B)
sont équivalentes si les deux inclusions A ⊂ B et B ⊂ A sont vraies, c’est-à-dire si les
deux ensembles contiennent les mêmes éléments. On dit qu’ils sont égaux, et on note
simplement A = B. Pour démontrer que deux ensembles sont égaux, on doit montrer
que chacun est inclus dans l’autre (tout comme pour démontrer une équivalence, on
doit montrer les deux implications).
On déduit du théorème 1 les propriétés suivantes des opérations ensemblistes. Les
démonstrations constituent un bon exercice de traduction, que nous laissons au lecteur.
Nous conseillons aussi de remplacer A par {n ∈ N ; n 6 6}, B par {n ∈ N ; 2 | n} et C
par {n ∈ N ; 3 | n} et d’écrire en extension tous les ensembles du théorème.
Théorème 2. Soient A, B et C trois ensembles. Les égalités ensemblistes suivantes
sont toujours vraies.
• Commutativité :
A∩B = B∩A . (13)

A∪B = B∪A . (14)
8
• Associativité :
A ∩ (B ∩ C) = (A ∩ B) ∩ C . (15)

A ∪ (B ∪ C) = (A ∪ B) ∪ C . (16)
• Distributivité :

A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) . (17)

A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) . (18)
• Complémentaires : soient A et B des parties d’un ensemble E. Alors :
E \ (E \ A) = A , (19)
E \ (A ∪ B) = (E \ A) ∩ (E \ B) , (20)
E \ (A ∩ B) = (E \ A) ∪ (E \ B) . (21)
Nous nous placerons toujours dans le cas où tous les ensembles considérés sont
des parties d’un ensemble de référence E. Le complémentaire d’une partie A est alors
implicitement défini comme l’ensemble des éléments de E qui n’appartiennent pas à A.
Moyennant cette convention, le résultat d’une opération ensembliste quelconque sur des
parties de E est encore une partie de E. Il est commode de visualiser E par un rectangle
et les sous-ensembles de E par des « patates » hachurées dessinées dans ce rectangle.
Le résultat s’appelle un diagramme de Venn, plutôt qu’un sac de patates (figure 1).
Nous conseillons au lecteur de visualiser les égalités ensemblistes du théorème 2 sur
des diagrammes de Venn.

complémentaire

intersection réunion

E E E

B B

A A A

Figure 1 – Diagrammes de Venn pour le complémentaire, l’intersection et la réunion.
Il existe d’autres manières utiles de combiner des ensembles entre eux pour en
former de nouveaux. Nous utiliserons plusieurs fois le produit cartésien.
9
Définition 2. Soient A et B deux ensembles. On appelle produit cartésien de A par

B et on note A × B l’ensemble des couples formés d’un élément de A et un de B.
A × B = { (a, b) ; a ∈ A et b ∈ B } .
Le produit cartésien de A par lui-même se note A2 . On le généralise à plus de deux

copies de A en définissant An comme l’ensemble des n-uplets formés d’éléments de A.
An = { (a1 , . . . , an ) , (a1 ∈ A) ∧ . . . ∧ (an ∈ A) } .
Attention, dans un n-uplet, certaines coordonnées peuvent être identiques et l’ordre

est important. Par exemple, si a et b sont deux éléments distincts de A, les triplets
(a, b, a) et (a, a, b) sont des éléments distincts de A3 .
1.3 Quantificateurs
Les quantificateurs sont les deux symboles ∀ « quel que soit » et ∃ « il existe ». On
les utilise pour des énoncés du type :
∀n ∈ N , ∃m ∈ N ; n<m. (22)
Cette formule se lit : quel que soit n appartenant à N, il existe m appartenant à N tel
que n < m. Soit encore : pour tout entier n, il existe un entier m strictement plus grand
que n. Il est crucial de retenir que dans ce cas l’entier m peut dépendre de l’entier n.
Cette assertion est vraie : pour tout n, le nombre m = n + 1 vérifie bien n < m.
L’ordre dans lequel on écrit les quantificateurs est très important. Echangeons dans
(22) les deux quantificateurs.
∃m ∈ N ; ∀n ∈ N , n<m.
Cette assertion se lit : il existe un entier m tel que tout entier n vérifie n < m (ce qui
est faux).
Pour écrire la négation d’une assertion comportant des quantificateurs on change
les ∀ en ∃ et les ∃ en ∀, puis on écrit la négation de l’assertion qui suit la liste des
quantificateurs. Ceci est tout à fait conforme à l’intuition. La négation de « tout les x
vérifient A » est bien « il existe un x qui ne vérifie pas A ». La négation de « il existe
un x qui vérifie A » est bien « aucun x ne vérifie A » soit encore « tous les x vérifient
¬A ». Ecrivons par exemple la négation de l’assertion (22).
∃n ∈ N ; ∀m ∈ N , (n > m) .
Il existe un entier n supérieur ou égal à tout entier m (ce qui est faux).
Attention, les quantificateurs ne sont pas toujours distributifs par rapport à « et » et
« ou ». Par exemple, « il existe un entier supérieur à 7 et inférieur à 6 » (faux) n’est
pas équivalent à « il existe un entier supérieur à 7 et il existe un entier inférieur à
10
6 » (vrai). De même « tout entier est inférieur ou égal à 6, ou bien supérieur ou égal
à 7 » (vrai) n’est pas équivalent à « tout entier est inférieur ou égal à 6 ou tout entier
est supérieur ou égal à 7 » (faux).
Nous commettrons souvent l’abus de notation consistant à regrouper des quantifi-
cateurs de même nature. Par exemple :
∀n ∈ N , ∀m ∈ N , m+n∈N,
que l’on pourrait aussi écrire
∀(n, m) ∈ N2 , m+n∈N,
sera plutôt écrit :

∀n, m ∈ N , m+n∈N.
(La somme de deux entiers naturels est un entier naturel.)
Ou encore,
∃n ∈ N , ∃m ∈ N ; n + m < 10 ,
deviendra :
∃n, m ∈ N ; n + m < 10 .
(Il existe deux entiers dont la somme est inférieure à 10.)
Constatez en la lisant à haute voix que la formule suivante définit bien la divisibilité.

∀m, n ∈ N , (m | n) ⇐⇒ ∃k ∈ N ; n = km .
1.4 Applications
Les fonctions et les applications sont des correspondances entre ensembles. Pour
définir une fonction f , il faut d’abord un ensemble de départ E (la source) et un
ensemble d’arrivée F (le but). Il faut ensuite un sous-ensemble Γ du produit cartésien
de E × F , c’est-à-dire un ensemble de couples (x, y) où x ∈ E et y ∈ F . L’ensemble Γ
s’appelle le graphe de la fonction. La règle de base est qu’un élément de E ne peut pas
correspondre à deux éléments de F . Ceci s’écrit :

((x, y) ∈ Γ) ∧ ((x, z) ∈ Γ) =⇒ y = z .
La donnée de l’ensemble de départ, de l’ensemble d’arrivée et du graphe définit la

fonction f . Si (x, y) ∈ Γ, on dit que y est l’image de x : y = f (x). La notation standard
pour une fonction est la suivante.
f
E −→ F
x 7−→ f (x)
11
Elle se lit « fonction f de E vers F qui à x associe f (x) ».

On utilise le plus souvent fonction et application comme des synonymes. En toute
rigueur une application est une fonction telle que tout élément de l’ensemble de départ
admet une image (et une seule). Pour une fonction, le sous-ensemble de l’ensemble de
départ formé des éléments qui ont effectivement une image s’appelle le domaine de
définition. Dans ce chapitre, nous nous limiterons aux applications.
Définition 3. Soient E et F deux ensembles et f une application de E dans F .

1. Soit A un sous-ensemble de E. On appelle image de A par f et on note f (A)
l’ensemble des images des éléments de A.
f (A) = { y ∈ F ; ∃x ∈ A , f (x) = y } .
2. Soit B un sous-ensemble de F . On appelle image réciproque de B par f et on

note f −1 (B) l’ensemble des éléments de E dont l’image appartient à B.
f −1 (B) = { x ∈ E ; f (x) ∈ B } .
Attention à la notation f −1 : elle ne signifie pas que f est inversée. C’est une
convention pour désigner un sous-ensemble de l’espace de départ. Un élément x de E
tel que f (x) = y s’appelle un antécédent de y. D’après la définition 3, l’ensemble des
antécédents de y est f −1 ({y}).
Soit E = {0, 1, 2, 3} et F = {0, 1, 2}. Considérons l’application qui à un nombre
associe le reste de sa division euclidienne par 2 : 0 s’il est pair, 1 s’il est impair. Le
graphe de cette application est :
Γ = { (0, 0), (1, 1), (2, 0), (3, 1) } .
Il est parfois commode de représenter un graphe par un ensemble de flèches entre

deux diagrammes de Venn (figure 2). L’image de {0, 2} est le singleton {0}. L’image
réciproque de {1} est {1, 3}. L’image réciproque de {2} est l’ensemble vide.
Soient E, F , et G trois ensembles, f une application de E vers F et g une application
de F vers G. On définit la composée de f par g , notée g ◦ f , comme l’application de
E vers G qui à x associe g ◦ f (x) = g(f (x)). Attention à l’ordre des applications dans
l’écriture g ◦ f : c’est l’ordre inverse des flèches dans le schéma ci-dessous.
f g
E −→ F −→ G
x 7−→ f (x) 7−→ g ◦ f (x) = g(f (x)) .
Définition 4. Soient E et F deux ensembles et f une application de E vers F . On dit

que f est :
12
0

0

1

1

2

3

Figure 2 – Représentation graphique d’une application de {0, 1, 2, 3} vers {0, 1, 2}.
1. injective si tout élément de l’ensemble d’arrivée possède au plus un antécédent

dans l’ensemble de départ.

∀x1 , x2 ∈ E , f (x1 ) = f (x2 ) =⇒ x1 = x2 .
2. surjective si tout élément de l’ensemble d’arrivée possède au moins un antécé-

dent dans l’ensemble de départ.
∀y ∈ F , ∃x ∈ E ; f (x) = y .
3. bijective si tout élément de l’ensemble d’arrivée possède exactement un anté-

cédent dans l’ensemble de départ.
Une application bijective, ou bijection, est donc à la fois injective et surjective (voir
figure 3).
injection surjection bijection

Figure 3 – Représentations graphiques d’une injection, d’une surjection et d’une bi-

jection.
13
Voici comment les applications injectives, surjectives et bijectives se comportent

vis-à-vis de la composition. La démonstration de cette assertion est laissée au lecteur
à titre d’exercice.
Proposition 3. Soient E, F , et G trois ensembles, f une application de E vers F et
g une application de F vers G.
1. Si f et g sont injectives alors g ◦ f est injective.
2. Si f et g sont surjectives alors g ◦ f est surjective.
3. Si f et g sont bijectives alors g ◦ f est bijective.
4. Si g ◦ f est injective alors f est injective.
5. Si g ◦ f est surjective alors g est surjective.
Si une application de E vers F est bijective, tout élément de F a un antécédent et
un seul. On peut alors définir l’application réciproque de f , notée f −1 :
f (x) = y ⇐⇒ x = f −1 (y) .
Si f est bijective, la composée de f par son application réciproque f −1 est l’appli-
cation qui à x associe x, de E vers E. On l’appelle application identique, ou identité.
f f −1
E −→ F −→ E
x 7−→ f (x) 7−→ f −1 ◦ f (x) = f −1 (f (x)) = x .
Les notations pour l’application réciproque et pour l’image réciproque d’une partie de
l’ensemble d’arrivée F sont liées par la relation :
f −1 ({y}) = {f −1 (y)} .
On prendra garde au fait que si l’image réciproque d’une partie est définie pour toute
application, l’application réciproque, quant à elle, n’est définie que pour une application
bijective.
1.5 Cardinaux
Nous allons utiliser la notion de bijection pour définir le cardinal d’un ensemble fini.
Intuitivement, deux ensembles ont le même nombre d’éléments si et seulement si on
peut définir une bijection entre ces ensembles. Les définitions qui suivent formalisent
cette intuition.
Définition 5. Soient E et F des ensembles. On dit que E et F ont le même cardinal
s’il existe une bijection de E sur F .
Soient E un ensemble et n un entier. On dit que E est de cardinal n si E et
{1, . . . , n} ont le même cardinal.
Soit E un ensemble. On dit que E est fini s’il existe un entier n tel que E soit de
cardinal n.
14
Proposition 4. Soient m et n des entiers. S’il existe une injection
f : {1, . . . , m} −→ {1, . . . , n} ,
alors m 6 n.
Démonstration : On raisonne par récurrence sur m. Si m = 0, la conclusion est vérifiée.

Supposons le résultat vrai pour m − 1. Soit
f : {1, . . . , m} −→ {1, . . . , n} ,
une application injective. Comme f est injective, on a
∀i ∈ {1, . . . , m}, i 6= m ⇒ f (i) 6= f (m) .
On peut donc définir
g : {1, . . . , m − 1} −→ {1, . . . , n − 1}
f (i) si f (i) < f (m),
i 7−→ 
f (i) − 1 si f (i) > f (m).
L’application ainsi définie est injective. Donc, par hypothèse de récurrence, m − 1 6

n − 1. D’où m 6 n.
Corollaire 2. Soient m et n des entiers. S’il existe une bijection de {1, . . . , m} sur
{1, . . . , n}, alors m = n.
Démonstration : Notons f une telle bijection. Alors f et f −1 sont injectives et on

applique la proposition précédente.
Ce corollaire montre que si E est un ensemble de cardinal m et de cardinal n, alors
m = n. En effet, dans ce cas il existe une bijection f de E sur {1, . . . , m} et g de E
sur {1, . . . , n} et g ◦ f −1 fournit une bijection de {1, . . . , m} sur {1, . . . , n}.
Définition 6. Soit E un ensemble fini. On appelle cardinal de E et on note Card(E)
l’unique entier n tel que E soit de cardinal n.
Exemple 1. Si a, b ∈ Z, avec a 6 b, alors
Card({a, a + 1, . . . , b − 1, b} = b − a + 1 .
En effet l’application
f : {a, . . . , b} −→ {1, . . . , b − a + 1}
x 7−→ x − a + 1
est bijective.
15
Proposition 5. Soit E un ensemble fini et X une partie de E. Alors

a) L’ensemble X est fini ;
b) Card(X) ≤ Card(E) ;
c) Si Card(X) = Card(E), alors X = E.
Démonstration : Soit n le cardinal de E. Il existe donc une bijection Φ de E sur

{1, . . . , n}. L’application obtenue par restriction à X :
X −→ Φ(X)
x 7−→ Φ(x) ,
est également bijective. Quitte à remplacer X par Φ(X), il suffit de traiter le cas où
E = {1, . . . , n}.
On raisonne alors par récurrence sur le cardinal de E. Si n = 0, alors E = X = ∅
et le résultat est valide. Supposons le résultat démontré pour les ensembles de cardinal
n − 1, et montrons le pour E = {1, . . . , n}. Si X = E, alors Card(X) = Card(E) et les
assertions a), b) et c) sont vérifiées. Si X 6= E, il nous suffit de montrer que X est fini
de cardinal inférieur ou égal à n − 1. Mais dans ce cas, il existe i ∈ {1, . . . , n} tel que
i 6∈ X. On considère alors l’application
f : {x ∈ E ; x 6= i} −→ {1, . . . , n − 1}
x si x < i,
x 7−→
x − 1 si x > i.
f est bijective, donc Card({x ∈ E ; x 6= i}) = n − 1 et par hypothèse de récurrence X

est fini et
Card(X) 6 n − 1 < Card(E).
ce qui montre les assertions dans ce cas.
Corollaire 3. Soient E et F des ensembles et f : E → F une application.

Si F est fini et si f est injective, alors
a) E est fini ;
b) Card(E) ≤ Card(F ) ;
c) f est bijective si et seulement si Card(E) = Card(F ).
Si E est fini et si f est surjective, alors
a) F est fini ;
b) Card(F ) ≤ Card(E) ;
c) f est bijective si et seulement si Card(E) = Card(F ).
16
Démonstration : Si f est injective, on considère l’application
g : E −→ f (E)
x 7−→ f (x)
g est bijective. Donc E et f (E) ont même cardinal. Donc Card(E) = Card(f (E)) 6
Card(F ). L’application f est bijective si et seulement si f (E) = F ce qui est équivalent
à Card(E) = Card(F ) par ce qui précède.
Supposons f surjective, c’est-à-dire telle que
∀y ∈ F, ∃x ∈ E, f (x) = y.
Donc il existe une application g : F → E telle que
∀y ∈ F, f (g(y)) = y.
La composée f ◦ g est l’application identique de F , donc g est injective. On applique

alors le cas injectif à g.
Rappelons la définition du complémentaire. Soient A et B deux ensembles. On note
A \ B l’ensemble des élements de A qui n’appartiennent pas à B.
A \ B = { x ∈ A ; x 6∈ B } .
Si B ⊂ A, A \ B est appelé le complémentaire de B dans A.

Proposition 6. Si A est fini et B ⊂ A, alors
Card(A) = Card(B) + Card(A \ B).
Démonstration : Par la proposition 5, on sait que B et A \ B sont finis. Notons p le

cardinal de B et q le cardinal de A \ B. Il existe donc des bijections
Φ1 : B −→ {1, . . . , p}
et
Φ2 : A \ B −→ {p + 1, . . . , p + q}
L’application
Φ : A −→ {1, . . . , p + q}
Φ (x) si x ∈ B,
1
x 7−→
Φ2 (x) si x ∈ A \ B
est bijective donc Card(A) = p + q.

Proposition 7. Soient A un ensemble fini, r un entier et (Ai )i∈{1,...,r} une famille de
parties de A telle que
17
i. A = A1 ∪ · · · ∪ Ar ;
ii. ∀i, j ∈ {1, . . . , r}, i 6= j ⇒ Ai ∩ Aj = ∅
Alors r
X
Card(A) = Card(Ai ).
i=1
Démonstration : On raisonne par récurrence sur r.

Si r = 1, A = A1 et le résultat est vrai. Si c’est vrai pour r − 1, par hypothèse de
récurrence, appliquée à l’ensemble A1 ∪ · · · ∪ Ar−1 , on a
r−1
X
Card(A1 ∪ · · · ∪ Ar−1 ) = Card(Ai ).
i=1
Mais Ar = A \ (A1 ∪ · · · ∪ Ar−1 ). Donc

r−1
X
Card(A) = Card(Ar ) + Card(Ai )
i=1
ce qui prouve le résultat pour r.

Définition 7. Soit E un ensemble fini et soit (λe )e∈E une famille de nombres réels (ou
complexes) Soit Φ : {1, . . . , n} → E une bijection. La somme
n
X
λΦ(i)
i=1
P
ne dépend pas du choix de Φ, on la note e∈E λe .
Exemple 2. Ainsi Card(E) =
P
e∈E 1.
Q
On peut définir de même le produit e∈E λe .
Corollaire 4 (Principe des bergers). Soient E un ensemble fini et F un ensemble. Soit
f : E → F une application, alors f (E) est fini et :
Card(f −1 ({y})) .
X
Card(E) =
y∈f (E)
Démonstration : L’application g : E → f (E) définie par g(x) = f (x) pour tout x de E

est surjective. Par conséquent, f (E) est fini. Soit m = Card(f (E)). On fixe donc une
bijection
Φ : {1, . . . , m} −→ f (E).
On applique alors la proposition à la famille (f −1 ({Φ(i)}))i∈{1,...,m} de parties de E.
Proposition 8. Soient E et F des ensembles finis, alors :
18
a) Card(E × F ) = Card(E)Card(F ) ;
b) Card(E F ) = Card(E)Card(F ) ;
c) Card(P(E)) = 2Card(E) .
Démonstration : Pour a), on considère l’application surjective f : E × F → F qui

applique (x, y) sur y et on applique la proposition précédente, en notant que pour tout
y de F , l’application
E −→ f −1 ({y})
x 7−→ (x, y)
est bijective.
Pour b), on raisonne par récurrence sur Card(F ) en considérant pour tout x ∈ F
l’application
E F −→ E F −{x}
g 7−→ g|F −{x} .
Pour c), on vérifie que l’application de P(E) sur {0, 1}E qui envoie une partie A
sur l’application
IA : E −→  {0, 1}
1 si x ∈ A,
x 7−→
0 sinon.
est bijective.
1.6 Relations
Dans ce cours, une relation R établit une correspondance entre deux éléments d’un
même ensemble. Elle est définie par l’ensemble E sur lequel elle opère, et par son
graphe Γ, qui est un sous-ensemble du produit cartésien E × E. Le fait qu’un couple
(x, y) appartienne au graphe Γ est noté xRy (x est en relation avec y). Considérons
par exemple la relation « divise » sur l’ensemble E = {1, 2, 3, 4, 5, 6}. Son graphe est :
Γ = { (1, 1), (1, 2), (1, 3), (1, 4), (1, 5), (1, 6),
(2, 2), (2, 4), (2, 6), (3, 3), (3, 6), (4, 4), (5, 5), (6, 6) } .
Ses éléments sont visualisés par des flèches sur la figure 4.
Les propriétés intéressantes que l’on attend d’une relation sont les suivantes.
Définition 8. On dit qu’une relation R sur un ensemble E est :
1. réflexive si tout élément est relié à lui-même
∀x ∈ E , xRx ;
2. symétrique si x relié à y entraîne que y est relié à x

∀x, y ∈ E , (xRy) =⇒ (yRx) ;
19

2

3

6

1

5 4

Figure 4 – Représentation graphique de la relation « divise » sur {1, 2, 3, 4, 5, 6}.
3. anti-symétrique si x relié à y et y relié à x entraînent x = y

∀x, y ∈ E , (xRy) ∧ (yRx) =⇒ x = y ;
4. transitive si quand x est relié à y et y à z alors x est relié à z

∀x, y, z ∈ E , (xRy) ∧ (yRz) =⇒ xRz .
Les relations servent à traduire mathématiquement des comparaisons entre éléments

d’un même ensemble. Ces comparaisons peuvent être de deux types.
• x a le même . . . que y (la même valeur, la même image par une fonction. . . ) :
c’est une relation d’équivalence.
• x est plus . . . que y (plus petit, plus grand, plus tôt. . . ) : c’est une relation
d’ordre.
Définition 9. Soit R une relation sur un ensemble E.

1. On dit que R est une relation d’équivalence si elle est à la fois réflexive,
symétrique et transitive.
2. On dit que R est une relation d’ordre si elle est à la fois réflexive, anti-
symétrique et transitive.
Voici des exemples de chacun des deux types de relations.

Notre premier exemple de relation d’équivalence est la congruence des entiers. Soit
p un entier strictement positif fixé. Définissons la relation R sur N par :

∀m, n ∈ N , mRn ⇐⇒ p | (m − n)
20
On dit que m et n sont congrus modulo p et on note « m ≡ n modulo p ». Il est facile de

vérifier que la congruence modulo p est réflexive, symétrique et transitive. Les nombres
pairs sont tous congrus à 0 modulo 2, les nombres impairs sont congrus à 1. Vérifiez sur
votre agenda, où les jours de l’année sont numérotés, que tous les lundis sont congrus
entre eux modulo 7.
Pour notre deuxième exemple de relation d’équivalence, nous allons revenir sur la
notion de cardinal d’un ensemble. Soit E un ensemble et P(E) l’ensemble de ses parties.
Définissons la relation R sur P(E) qui relie deux parties A et B s’il existe une bijection
de A vers B. Cette relation est :
• réflexive : l’application identique est une bijection de E vers lui-même,
• symétrique : si f est une bijection de A vers B alors l’application réciproque
f −1 est une bijection de B vers A,
• transitive : si f est une bijection de A vers B et g est une bijection de B vers
C, alors g ◦ f est une bijection de A vers C.
Le cardinal est la propriété commune que possèdent deux parties reliées par cette
relation d’équivalence. Il caractérise leur classe d’équivalence.
Définition 10. Soit E un ensemble et R une relation d’équivalence sur E. Pour tout
élément x de E, la classe d’équivalence de x pour R est l’ensemble, noté clR (x) de
tous les éléments de E auxquels x est relié.
clR (x) = { y ∈ E , xRy } .
L’ensemble des classes d’équivalence s’appelle ensemble quotient de E par R, et il est

noté E/R.
Théorème 3. Deux classes d’équivalence sont égales ou bien disjointes.
Démonstration : Soient x et y deux éléments de E. Ces deux éléments sont reliés ou

ils ne le sont pas : nous distinguons les deux cas.
1. Si x est relié à y.
Nous allons démontrer que les deux classes sont égales. Soit z un élément de
clR (y). Par définition d’une classe d’équivalence, yRz. Comme xRy et yRz,
d’après la transitivité, xRz. Nous venons de montrer que tout élément de clR (y)
appartient aussi à clR (x). Donc clR (y) ⊂ clR (x). Comme la relation est symé-
trique, y est relié à x. Donc ce qui précède s’applique en permutant x et y. Donc
clR (x) ⊂ clR (y). Comme les deux inclusions sont vraies, les deux classes sont
égales.
2. Si x n’est pas relié à y.
Nous allons démontrer que l’intersection des deux classes est vide. D’après la
transitivité, pour tout z ∈ E, l’implication suivante est vraie.

(xRz) ∧ (zRy) =⇒ (xRy) .
21
Donc si xRy est fausse, alors l’une des deux relations xRz, zRy est fausse. Donc
un élément z de E ne peut pas appartenir à la fois à clR (x) et à clR (y) : leur
intersection est vide.

Tout élément de E appartient à sa propre classe d’équivalence car la relation est
réflexive, et à aucune autre d’après le théorème précédent. On dit que l’ensemble des
classes d’équivalences constitue une partition de E (figure 5).
Définition 11. Soit E un ensemble et P ⊂ P(E) un ensemble de parties de E. On

dit que P est une partition de E si tout élément de E appartient à un et un seul des
éléments de P .

Figure 5 – Représentation graphique d’une relation d’équivalence. Partition en classes

d’équivalence.
Considérons la relation de congruence modulo p sur Z. La classe d’équivalence de

0 est l’ensemble des multiples de p, la classe d’équivalence de 1 est l’ensemble de tous
les entiers n tels que n − 1 est un multiple de p. . . :
∀i ∈ {0, . . . , p − 1} , clR (i) = {i + np , n ∈ Z} .
L’ensemble quotient est formé de ces p classes d’équivalence.

Considérons maintenant la relation d’équivalence R sur P(N) qui relie deux en-
sembles d’entiers s’il existe une bijection de l’un vers l’autre. La classe d’équivalence de
{1, . . . , n} contient toutes les parties de N qui ont n éléments. Pour m 6= n les classes de
{1, . . . , m} et {1, . . . , n} sont disjointes, car il n’existe pas de bijection entre {1, . . . , m}
et {1, . . . , n}. L’ensemble quotient de P(N) par la relation R est en bijection avec N.
Passons maintenant aux relations d’ordre. L’ordre le plus naturel est celui des
nombres entre eux. Observons que « < » et « > » ne sont pas réflexives. Par contre
« 6 » et « > » sont bien des relations d’ordre. Si deux éléments sont reliés par une
relation d’ordre, on dit qu’ils sont comparables. Si tous les éléments sont comparables
22
deux à deux, on dit que l’ordre est total. C’est le cas pour « 6 » et « > » mais pas pour
la relation « divise » sur N, qui est une relation d’ordre partiel. Si E est un ensemble,
l’inclusion est une relation d’ordre partiel sur P(E).
Voici un autre exemple. Supposons que E soit un alphabet, pour lequel on a choisi
un ordre total, noté 6 : l’alphabet latin dont les lettres sont rangées de « A » à « Z »,
E = {0, 1} avec 0 6 1, etc. . . Les éléments de E n sont des n-uplets de lettres, donc
des mots de longueur n. Comment les ranger ? On peut bien sûr définir une relation
d’ordre coordonnée par coordonnée :

(x1 , . . . , xn )R(y1 , . . . , yn ) ⇐⇒ (x1 6 y1 ) ∧ . . . ∧ (xn 6 yn ) .
C’est bien une relation d’ordre, mais il n’est que partiel. On obtient un ordre total en
donnant la précédence à la première coordonnée, puis à la seconde en cas d’égalité sur
la première, etc. . .
(x1 , . . . , xn )R(y
1 , . . . , yn ) ⇐⇒
(x1 < y1 ) ∨ ((x1 = y1 ) ∧ (x2 < y2 )) ∨ . . . ∨

((x1 = y1 ) ∧ . . . ∧ (xn−1 = yn−1
) ∧ (xn < yn ))∧
((x1 = y1 ) ∧ . . . ∧ (xn = yn )) .
L’ordre est maintenant total. Compliqué ? Pas tellement : c’est l’ordre dans lequel les
mots sont rangés dans un dictionnaire : on l’appelle ordre lexicographique.
1.7 Raisonnements
Il ne s’agit pas de proposer ici une théorie du raisonnement mathématique. Nous
allons simplement donner quelques exemples de démonstrations, pour illustrer trois
types de raisonnements : par contraposée, par l’absurde et par récurrence.
Raisonnement par contraposée
Il consiste, plutôt que de démontrer l’implication A =⇒ B, à démontrer sa contraposée
(¬B) =⇒ (¬A). Il est difficile de donner une règle générale d’utilisation de ce raison-
nement. Un bon conseil avant de se lancer dans la démonstration d’une implication,
est d’écrire d’abord sa contraposée. Avec un peu d’expérience, on arrive vite à sentir
laquelle des deux est la plus facile à démontrer. Si le résultat désiré est B, on cherche
les conséquences de ¬B pour arriver aux bonnes hypothèses. Notre premier exemple
est un résultat facile, mais très utile.
Proposition 9. Soit x un nombre réel tel que pour tout ε > 0, x 6 ε. Alors x 6 0.
Démonstration : Nous devons démontrer l’implication :

∀ε > 0 , x6ε =⇒ (x 6 0) .
23
Ecrivons sa contraposée :

(x > 0) =⇒ ∃ε > 0 ; x>ε .
« Si x est strictement positif, alors il existe ε > 0 tel que x > ε ». C’est vrai : il suffit
de choisir ε = x/2.
Comme deuxième exemple, nous allons reprendre un des points de la démonstration
du théorème 3.
Proposition 10. Soit R une relation d’équivalence sur un ensemble E. Soient x et y
deux éléments de E qui ne sont pas reliés. Alors l’intersection des deux classes d’équi-
valence de x et y est vide.
Démonstration : L’implication que nous devons démontrer s’écrit formellement :
¬(xRy) =⇒ (clR (x) ∩ clR (y) = ∅) .
Sa contraposée est :
(clR (x) ∩ clR (y) 6= ∅) =⇒ (xRy) .
Soit z un élément de clR (x) ∩ clR (y) (il y en a au moins un car l’intersection est non
vide. Par définition des classes d’équivalence, x est relié à z, et z est relié à y. Par
transitivité, x est relié à y.
Raisonnement par l’absurde

Il consiste à démontrer une assertion en vérifiant que sa négation conduit à une contra-
diction avec les hypothèses. Dans certains cas il se distingue mal du raisonnement par
contraposée : si A désigne la conjonction des hypothèses et B la conclusion, nier B
et aboutir à une contradiction, revient à démontrer ¬A à partir de ¬B, ce qui est la
contraposée de A =⇒ B.
Notre premier exemple est dû à Euclide.
Proposition 11. Il existe une infinité de nombres premiers.
Démonstration : Supposons qu’il n’en existe qu’un nombre fini, et soit N le plus grand
d’entre eux. Considérons le nombre P = N ! + 1. Il est strictement supérieur à N , donc
il n’est pas premier, par définition de N . Si on effectue la division euclidienne de P
par un nombre quelconque entre 2 et N , le reste est 1, par définition de la factorielle
(produit de tous les entiers de 1 à N ). Donc le nombre P n’est divisible par aucun
nombre entre 2 et N donc par aucun nombre premier : il est donc premier, d’où la
contradiction.
Voici un autre résultat classique.
√
Proposition 12. Le nombre 2 est irrationnel.
24
Démonstration : Un nombre rationnel est le quotient de deux √ entiers ; un nombre

irrationnel n’est pas rationnel. Nous devons donc démontrer que 2 n’est pas le √quotient
de deux entiers. Supposons le contraire : il existe deux entiers p et q tels que 2 = p/q.
Quitte à simplifier la fraction, nous pouvons supposer que p et q n’ont pas de facteur
commun. Multiplions par q et élevons au carré :
2q 2 = p2 .
Le nombre p2 = 2q 2 est pair, donc p est également pair. Mais si p est pair, alors p2 est
multiple de 4. Donc q 2 est multiple de 2, donc q est pair. Mais alors 2 est un facteur
commun à p et q, ce qui est une contradiction.
Pour notre troisième exemple, nous revenons encore une fois sur :
Deux classes d’équivalence sont égales ou bien disjointes.
Comparez la démonstration qui suit avec celle du théorème 3 et de la proposition 10.

Démonstration : L’assertion A est l’hypothèse : R est une relation d’équivalence.
L’assertion B est la conclusion, que l’on peut écrire de manière formelle comme suit.
∀x, y ∈ E , (clR (x) = clR (y)) ∨ (clR (x) ∩ clR (y) = ∅) .
La négation de B s’écrit :
∃x, y ∈ E , (clR (x) 6= clR (y)) ∧ (clR (x) ∩ clR (y) 6= ∅) .
Soit encore : il existe deux éléments x et y tels que les classes clR (x) et clR (y) ne soient
ni égales ni disjointes. Si c’est le cas, il existe un élément z qui est dans l’une et pas
dans l’autre, et un élément t qui est dans les deux. Supposons que z soit dans clR (x),
mais pas dans clR (y). Donc xRz, donc zRx, car R est symétrique. Mais aussi xRt et
tRy car t appartient aux deux classes de x et y. Donc puisque R est transitive, zRy.
Donc z est dans la classe de y, ce qui est une contradiction.
Raisonnement par récurrence

Pour démontrer qu’une assertion H(n) dépendant d’un entier n est vraie pour tout
n ∈ N, on démontre :
1. H(0) « initialisation »,
2. ∀n ∈ N , H(n) =⇒ H(n + 1) « hérédité ».
L’assertion H(n) est l’hypothèse de récurrence. Il peut se faire qu’elle ne soit vraie que
pour n > 1 ou n > 2, auquel cas, on la démontre pour la plus petite valeur pour
laquelle elle est vraie. Voici la démonstration d’une formule à connaître :
Proposition 13. Pour tout entier n > 1, la somme des entiers de 1 à n vaut n(n+1)/2.
25
Démonstration : L’hypothèse de récurrence est :

n
X n(n + 1)
H(n) : k= .
k=1 2
1. Initialisation. Pour n = 1 :
1
X 1(1 + 1)
k=1= .
k=1 2
2. Hérédité. Soit n un entier quelconque. Supposons que H(n) est vraie. Ecrivons :
n+1 n
!
X X
k= k + (n + 1) .
k=1 k=1
En appliquant H(n), on obtient

n
!
X n(n + 1)
k + (n + 1) = + (n + 1) ,
k=1 2
Le membre de droite s’écrit
n(n + 1) (n + 1)(n + 2)
+ (n + 1) = ,
2 2
Nous avons donc démontré que
n+1
X (n + 1)(n + 2)
k= ,
k=1 2
c’est-à-dire que H(n + 1) est vraie.

On peut être amené, pour démontrer H(n + 1) à utiliser H(m) pour m ∈ {0, . . . , n},
ce qui ne change rien au principe de la récurrence.

∀n ∈ N , (∀m ∈ {0, . . . , n} , H(m) ) =⇒ H(n + 1) .
Pour deviner quelle est la bonne hypothèse H(n), on doit souvent essayer plusieurs
valeurs successives de n : n = 0, puis n = 1, n = 2,. . . C’est parfaitement inutile
pour la démonstration. Attention, ce n’est pas parce qu’une propriété est vraie pour
quelques valeurs de n qu’elle est vraie pour tout n. Voici deux exemples.
1. Les nombres 31, 331, 3 331,. . . , 33 333 331 sont tous premiers. Mais 333 333 331 =
17 × 19 607 843 ne l’est pas.
2. Pour toutes les valeurs de n allant de 0 à 39, le nombre n2 + n + 41 est premier.
Mais le nombre 402 + 40 + 41 = 412 ne l’est pas.
26
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Parmi les assertions suivantes, lesquelles sont vraies, lesquelles sont faus-
ses et pourquoi ?
1. (2 < 3) ∧ (2 | 4).
2. (2 < 3) ∧ (2 | 5).
3. (2 < 3) ∨ (2 | 5).
4. (2 < 3) ∧ (¬(2 | 5)).
5. (¬(2 < 3)) ∨ (2 | 5).

6. (2 < 3) ∧ (2 | 4) ∨ (3 | 6).

7. (2 < 3) ∧ (2 | 4) ∨ (3 | 5).

8. (2 < 3) ∧ (2 | 4) ∧ (3 | 5).

9. (2 < 3) ∧ (2 | 5) ∨ (3 | 6) ∧ (3 < 6) .

10. (2 < 3) ∧ (2 | 5) ∨ (3 | 6) ∧ (3 > 6) .
Vrai-Faux 2. Soit n un entier naturel quelconque. Parmi les implications suivantes,
lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. (n > 5) =⇒ (n > 3).
2. (n > 5) =⇒ (n > 6).
3. (n > 5) =⇒ (n 6 6).
4. (n < 1) =⇒ (2 | n).
5. (n < 1) =⇒ (n | 2).
6. (n < 2) =⇒ (n2 = n).
7. (n > 0) =⇒ (2n > n).
8. (n > 0) =⇒ (2n > n).
9. (n > 0) =⇒ ((n + 1) > n).
Vrai-Faux 3. Soit n un entier naturel quelconque. Parmi les équivalences suivantes,
1. (n > 5) ⇐⇒ (n > 4).
2. (n > 5) ⇐⇒ (n > 4).
3. ((n > 5) ∧ (n | 12)) ⇐⇒ (n = 6).
4. ((n > 6) ∧ (n | 12)) ⇐⇒ (n = 12).
5. ((3 | n) ∧ (4 | n)) ⇐⇒ (12 | n).
27
6. ((3 | n) ∧ (4 | n)) ⇐⇒ (n | 12).

7. ((n | 3) ∨ (n | 4)) ⇐⇒ (n | 12).
Vrai-Faux 4. Parmi les assertions suivantes, portant sur un entier naturel n, lesquelles
sont des conditions suffisantes pour que n soit pair, lesquelles ne le sont pas et pourquoi ?
1. n 6 2.
2. (n 6 2) ∧ (¬(n = 1)).
3. 12 | n.
4. n | 12.
5. (n | 12) ∧ (n > 3).
6. (n | 12) ∨ (n | 10).
7. (n | 12) ∧ (n | 10).
8. (n | 16) ∧ (n > 1).
9. (n | 16) ∧ (¬(n2 = n)).
Vrai-Faux 5. Soit n un entier quelconque. Parmi les phrases suivantes, lequelles tra-
duisent correctement l’implication
(4 | n) =⇒ (2 | n) ,
lesquelles ne la traduisent pas et pourquoi ?

1. Si 4 divise n alors 2 divise n.
2. 2 divise n seulement si 4 divise n.
3. Pour que 2 divise n il faut que 4 divise n.
4. Pour que 2 divise n il suffit que 4 divise n.
5. la condition « 2 divise n » est nécessaire pour que 4 divise n.
6. la condition « 4 divise n » est nécessaire pour que 2 divise n.
7. la condition « 4 divise n » est suffisante pour que 2 divise n.
Vrai-Faux 6. Parmi les phrases suivantes, lesquelles traduisent correctement l’équiva-
lence
((3 | n) ∧ (4 | n)) ⇐⇒ (12 | n) ,
lesquelles ne la traduisent pas et pourquoi ?
1. Si 3 et 4 divisent n alors 12 divise n et réciproquement.
2. Pour que 12 divise n il faut que 3 et 4 divisent n.
3. Pour que 12 divise n il faut et il suffit que 3 et 4 divisent n.
4. Pour que 12 divise n il est nécessaire et suffisant que 3 et 4 divisent n.
5. 12 divise n seulement si 3 et 4 divisent n.
28
6. 12 divise n si et seulement si 3 et 4 divisent n.
Vrai-Faux 7. Si je mange, alors je bois et je ne parle pas. Si je ne parle pas alors je

m’ennuie. Je ne m’ennuie pas. Je peux en déduire que (oui ou non et pourquoi) :
1. je parle.
2. je ne parle pas.
3. je ne bois pas.
4. je ne mange pas.
5. je ne bois pas et je ne mange pas.
Vrai-Faux 8. Parmi les assertions suivantes lesquelles sont vraies, lesquelles sont faus-
ses, et pourquoi ?
1. Si Napoléon était chinois, alors 3 − 2 = 2.
2. Soit Cléopâtre était chinoise, soit les grenouilles aboient.
3. Soit les roses sont des animaux, soit les chiens ont 4 pattes.
4. Si l’homme est un quadrupède, alors il aboie.
5. Les roses ne sont ni des animaux, ni des fleurs.
6. Paris est en France ou Madrid est en Chine.
7. La pierre ponce est un homme si et seulement si les femmes sont des sardines.
8. Les poiriers ne donnent pas des melons, et Cléopâtre n’était pas chinoise.
9. Il est faux que si les grenouilles n’aboient pas alors 3 × 2 = 7.
10. Si les champignons sont des animaux ou le Cid était espagnol, alors la longueur
d’une circonférence est le double de son rayon.
11. Une condition nécessaire et suffisante pour que dans un jeu de 40 cartes il y
ait 45 as est que le cuir soit végétal.
Vrai-Faux 9. Soient A, B, C trois sous-ensembles d’un ensemble E. L’ensemble

((A ∪ B) ∩ C) ∪ ((A ∩ B) ∩ cC) est-il (oui ou non et pourquoi) ?
1. égal à E.
2. inclus dans A ∩ B.
3. inclus dans A ∪ B.
4. inclus dans A ∪ C.
5. inclus dans A ∩ C.
6. inclus dans (A ∩ C) ∪ B.
7. inclus dans (A ∩ cC) ∪ B.
8. égal à (A ∩ B) ∪ (B ∩ C) ∪ (A ∩ C).
29
Vrai-Faux 10. Parmi les ensembles d’entiers suivants, lesquels sont égaux au singleton
{0}, lesquels sont différents et pourquoi ?
1. { n ∈ N ; n 6 1 }.
2. { n ∈ N ; n < 1 }.
3. { n ∈ N ; (n 6 1) ∧ (2 | n) }.
4. { n ∈ N ; 1 + n > 0 }.
5. { n ∈ N ; 1 + n = 1 }.
6. { n ∈ N ; ∀m ∈ N , n 6 m }.
7. { n ∈ N ; ∀m ∈ N , n < m }.
8. { n ∈ N ; ∀m ∈ N , n | m }.
9. { n ∈ N ; ∀m ∈ N , m | n }.
Vrai-Faux 11. Un entier est un nombre premier s’il est non nul et divisible seulement
par 1 et par lui-même. Parmi les ensembles suivants, lesquels sont égaux à l’ensemble
des nombres premiers, lesquels sont différents et pourquoi ?
1. { n ∈ N ; (n > 0) ∧ ((m | n) =⇒ (m = n)) }.
2. { n ∈ N ; (m | n) =⇒ (m ∈ {1, n}) }.
3. { n ∈ N ; (m | n) =⇒ (1 6 m 6 n) }.
4. { n ∈ N ; ∀m ∈ N , ((m = 1) ∨ (m = n)) ∧ (¬(m | n)) }.
5. { n ∈ N ; ∀m ∈ N , ((m = 1) ∨ (m = n)) ∨ (¬(m | n)) }.
6. { n ∈ N ; ∀m ∈ N , (1 < m < n) =⇒ (¬(m | n)) }.
7. { n ∈ N ; ∀m ∈ N , (n > 0) ∧ ((1 < m < n) =⇒ (¬(m | n))) }.
Vrai-Faux 12. Soient E et F deux ensembles et f une application de E vers F . Parmi

les affirmations suivantes lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. Si f est injective alors tout élément de E a plus d’une image dans F .
2. Si f est injective alors tout élément de F a au plus un antécédent dans E.
3. Si f est surjective alors tout élément de F a plus d’un antécédent dans F .
4. Si f n’est pas bijective alors au moins un élément de F n’a pas d’antécédent.
5. Si f n’est pas injective alors il existe deux éléments distincts de E ayant la
même image.
Vrai-Faux 13. Soient E et F deux ensembles finis et f une application de E vers

F . Parmi les affirmations suivantes lesquelles sont vraies, lesquelles sont fausses et
pourquoi ?
1. Si Card(E) > Card(F ) alors f est surjective.
2. Si Card(E) > Card(F ) alors f n’est pas injective.
30
3. Si Card(E) = Card(F ) alors f est bijective.

4. Si Card(E) = Card(F ) et si f est surjective, alors f est bijective.
5. Si Card(E) 6= Card(F ) alors f est injective ou surjective.
6. Si Card(E) = Card(F ) et si f n’est pas surjective, alors f n’est pas injective.
7. Si Card(E) = Card(F ) et si f n’est pas injective, alors f n’est pas surjective.
Vrai-Faux 14. Soit E = {0, 1, 2}. Les graphes suivants définissent-ils une relation d’é-
quivalence sur E (oui ou non et pourquoi) ?
1. Γ = { (0, 0), (0, 1), (1, 0), (1, 1) }.
2. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (2, 2) }.
3. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (1, 2), (2, 2) }.
4. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (1, 2), (2, 1), (2, 2) }.
5. Γ = { (0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2) }.
Vrai-Faux 15. Soit E = {0, 1, 2}. Les graphes suivants définissent-ils une relation d’or-
dre sur E (oui ou non et pourquoi) ?
1. Γ = { (0, 0), (0, 1), (1, 1), (2, 2) }.
2. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (2, 2) }.
3. Γ = { (0, 0), (0, 1), (0, 2), (1, 1), (2, 2) }.
4. Γ = { (0, 0), (0, 1), (1, 1), (1, 2), (2, 2) }.
5. Γ = { (0, 0), (0, 1), (0, 2), (1, 1), (1, 2), (2, 2) }.
Vrai-Faux 16. Soient E un ensemble fini non vide et x un élément fixé de E. Les
relations R définies par les assertions suivantes sont-elles des relations d’équivalence
sur P(E) (oui ou non et pourquoi) ?
1. ∀A, B ∈ P(E) , ARB ⇐⇒ A = B.
2. ∀A, B ∈ P(E) , ARB ⇐⇒ A ⊂ B.
3. ∀A, B ∈ P(E) , ARB ⇐⇒ (A ∩ B = ∅).

4. ∀A, B ∈ P(E) , ARB ⇐⇒ (A ∩ B = ∅) ∨ (A ∪ B 6= ∅) .
5. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ A ∪ B).

6. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ A ∩ B) ∨ (x ∈ cA ∩ cB) .
Vrai-Faux 17. Soient E un ensemble fini contenant au moins deux éléments, et x un

élément fixé de E. Les relations R définies par les assertions suivantes sont-elles des
relations d’ordre sur P(E) (oui ou non et pourquoi) ?
1. ∀A, B ∈ P(E) , ARB ⇐⇒ A = B.
2. ∀A, B ∈ P(E) , ARB ⇐⇒ A ⊂ B.
31
3. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ (A ∩ cB)).

4. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ (A ∪ cB)).

c
5. ∀A, B ∈ P(E) , ARB ⇐⇒ (A = B) ∨ (x ∈ A ∩ B) .
Vrai-Faux 18. Soit H(n) un énoncé dépendant de l’entier n. Les assertions suivantes
entraînent-elles que H(n) est vraie pour tout n ∈ N (oui ou non et pourquoi) ?

1. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 1) .

2. H(1) ∧ ∀n ∈ N , H(n) =⇒ H(n + 1) .

3. H(0) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

4. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 2) .

5. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 2) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

6. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(2n) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

7. (H(0)∧H(1))∧ ∀n ∈ N , H(n) =⇒ H(2n) ∧ ∀n ∈ N , H(n+1) =⇒ H(n) .
2.2 Exercices
Exercice 1. Soient A, B, C trois assertions. Pour chacune des assertions suivantes :

A ∧ (¬B) A ∨ (¬B)

A ∨ (B ∧ C) A ∧ (B ∨ C)

A =⇒ (¬B) A ⇐⇒ B

(¬(A ∨ B)) =⇒ C (A ∧ B) ⇐⇒ (¬C)

(A ∧ (¬B)) =⇒ C A ∨ (¬B) =⇒ (¬C)
1. Ecrire sa négation.
2. Traduire l’assertion et sa négation en langage courant, en remplaçant A par « je
mange », B par « je bois » et C par « je fume ».
Exercice 2. Soient A, B et C trois assertions. Démontrer que les équivalences suivantes

sont toujours vraies, d’abord à l’aide des tables de vérité, ensuite en utilisant les opéra-
tions entre connecteurs logiques. Traduire chacune des assertions en langage courant,
en remplaçant A par « je mange », B par « je bois » et C par « je fume ».
32

1. A =⇒ (B =⇒ C) ⇐⇒ (A ∧ B) =⇒ C .

2. (A ∨ B) =⇒ C ⇐⇒ (A =⇒ C) ∧ (B =⇒ C) .

3. (A ∧ B) =⇒ C ⇐⇒ (A =⇒ C) ∨ (B =⇒ C) .

4. A =⇒ (B ∧ C) ⇐⇒ (A =⇒ B) ∧ (A =⇒ C) .

5. A =⇒ (B ∨ C) ⇐⇒ (A =⇒ B) ∨ (A =⇒ C) .
Exercice 3. On introduit un nouveau connecteur logique, dit barre de Scheffer, noté |,

dont la table de vérité est la suivante :
A B A|B
F F V
F V V
V F V
V V F
1. Donner une expression de A|B en utilisant les connecteurs usuels : ¬, ∨, ∧.

2. Montrer que tous les connecteurs peuvent être remplacés par ce seul connecteur,
en exprimant ¬A, A ∨ B, A ∧ B et A =⇒ B en utilisant seulement la barre de
Scheffer et, si nécessaire, des parenthèses.
Exercice 4. On considère les quatre assertions suivantes :
• F : je fume,
• B : je bois,
• J : je mange du jambon,
• M : j’ai des moustaches.
Exprimer sous forme symbolique les phrases suivantes :
1. Je fume et je bois, mais je n’ai pas de moustache.
2. Quand je fume, je ne bois pas.
3. Chaque fois que je mange du jambon, je ne fume pas mais je bois.
4. Si je mange du jambon ou si je bois, alors je ne fume pas.
5. Il suffit que j’aie des moustaches pour que je mange du jambon.
6. Il faut que je mange du jambon et que je boive pour que je fume.
7. Une condition nécessaire pour que je boive et que je fume est que je mange du
jambon.
8. Je fume et je bois, si et seulement si je mange du jambon ou j’ai des moustaches.
9. De deux choses l’une : soit je bois et je mange du jambon, soit si j’ai une
moustache alors je ne fume pas.
33
En supposant que les valeurs de vérité respectives de F, B, J, M sont V, V, F, V , trouver

les valeurs de vérité des phrases précédentes.
Exercice 5. Exprimer sous forme symbolique les raisonnements suivants et vérifier

qu’ils sont corrects.
1. Si je vais à Londres, j’irai aussi à Oxford. Soit je vais à Londres, soit je dépense
mon argent à autre chose. Si je vais à Oxford, je verrai John. Si je dépense mon
argent à autre chose, je verrai John. Donc je verrai John.
2. Si j’ai de l’argent ou si je bois du vin alors je chante en me rasant et je suis
content. Donc je n’ai pas d’argent ou bien je chante en me rasant.
3. Soit je mange, soit je bois, et si je mange je ne fume pas. Comme je ne bois pas,
je ne fume pas.
4. Si Pierre est marié, alors Jean est marié, et si Jean est marié, alors Louis l’est
aussi. De plus, soit Jean est célibataire, soit il est marié et Louis est célibataire.
Donc Pierre est célibataire.
5. Si on ne danse pas, je m’asseois. Si je m’asseois, je bois et je fume. Si on danse
je m’amuse. Or je m’ennuie. Donc je fume.
6. Si je ne m’asseois pas, je bois. Si je bois, on danse et de plus je fume. Si je
m’asseois, je m’amuse. Or je m’ennuie. Donc je fume.
7. Si je marche, je sue. Si je ne me fatigue pas, je ne sue pas. Or je ne me fatigue
pas. Donc je ne marche pas.
8. Si A dit la vérité, B ment. Si B ment, C ment. Si C ment, D dit la vérité. D
ment ou bien E ment. A ne ment pas. Donc E ment.
Exercice 6. Trois commerçants habitent dans 3 maisons situées aux numéros 21, 23
et 25 de la même rue. Le boucher habite dans la maison jaune, qui est à côté de la
rouge mais qui n’est pas à côté de la verte. L’épicier, qui n’est pas suisse, habite à côté
du Français. L’Italien habite au numéro 21 et sa maison n’est pas jaune. Quelle est la
nationalité du pharmacien, quelle est la couleur de sa maison, et où habite-t-il ?
Exercice 7. Trois personnes, un policier un berger et un assassin, habitent dans 3

maisons situées aux numéros 19, 21 et 23 de la même rue. Le policier habite au numéro
23 et sa maison n’est pas rouge. La maison rouge est à côté de la maison bleue mais pas
à côté de la maison jaune. L’Italien habite dans la maison rouge. Le Français, qui n’est
pas berger, habite à côté de l’assassin. Quelle est la couleur de la maison de l’assassin
et où habite-t-il ?
Exercice 8. (Pour les courageux).

• Alice dit que si Bernard est coupable, Charles l’est aussi.
• Bernard dit que Alice est coupable et que Charles ne l’est pas.
• Charles dit qu’il n’est pas coupable mais que au moins l’un des deux autres l’est.
34
Soit A (respectivement B, C) l’assertion « Alice (respectivement : Bernard, Charles)

est coupable ».
1. Ecrire sous forme logique les affirmations de Alice, Bernard et Charles.
2. On sait que chacune des trois personnes ment si et seulement si elle est cou-
pable. Déduire de la question précédente trois assertions vraies. Simplifier leur
expression.
3. Contruire la table de vérité de chacune des trois assertions de la question pré-
cédente.
4. Déduire de ces tables de vérité que Alice est innocente, Bernard et Charles sont
coupables.
Exercice 9. Définir les ensembles suivants en extension.
1. { n ∈ N ; (n > 3) ∧ (n 6 7) }.
2. { n ∈ N ; (2 | n) ∧ (n 6 7) }.
3. { n ∈ N ; (n | 12) ∨ (n > 7) }.
4. { n ∈ N ; (¬(n | 12)) ∧ (n 6 7) }.
5. { n ∈ N ; (n > 3) ∧ ((n | 12) ∨ (n 6 7)) }.
6. {n ∈ N; {l ∈ N; (3 < l2 ) ∧ (l2 6 16)}.
S
(n|15)}
7. {n ∈ N; ((n + 1)|20) ∨ ((n − 1)|8)}.
Exercice 10. Soient A, B et C trois sous-ensembles d’un ensemble E. Ecrire en fonction
de A, B, C les ensembles correspondant aux assertions suivantes.
1. x appartient aux trois.
2. x appartient au moins à l’un d’entre eux.
3. x appartient à deux d’entre eux au plus.
4. x appartient à l’un d’entre eux exactement.
5. x appartient à deux d’entre eux au moins.
6. x appartient à l’un d’entre eux au plus.
Exercice 11. Soit E un ensemble. Soient A et B deux sous-ensembles de E. On appelle :
• différence de B dans A et on note A \ B l’ensemble A ∩ cB,
• différence symétrique de A et B et on note A∆B l’ensemble (A \ B) ∪ (B \ A).
1. Ecrire sous forme logique les propriétés « x ∈ A \ B » et « x ∈ A∆B » à l’aide
des propriétés « x ∈ A » et « x ∈ B ». Démontrer les égalités ensemblistes
suivantes.
2. A \ ∅ = A∆∅ = A.
3. A \ A = A∆A = ∅.
4. A ∩ (B∆C) = (A ∩ B)∆(A ∩ C).
35
5. (A∆B) ∪ (A∆C) = (A ∪ B ∪ C) \ (A ∩ B ∩ C).

6. Donner une représentation sous forme de diagramme de Venn de tous les en-
sembles définis dans cet exercice.
Exercice 12. Soient A, B et C trois sous-ensembles d’un ensemble E.

1. Simplifier l’expression (A ∩ B ∩ C) ∪ (cA ∩ B ∩ C) ∪ cB ∪ cC.
2. Démontrer que (A ∩ cB) ∩ cC = A ∩ c (B ∪ C) = (A ∩ cC) ∩ cB.
3. Démontrer que (A ∪ B ⊂ cC) ∧ (A ∪ C ⊂ B) ⇐⇒ (A ⊂ B) ∧ (C = ∅).
Exercice 13. (D’après Lewis Caroll). Parmi les combattants d’une grande bataille, au
moins 70% ont perdu un œil, au moins 75% une oreille, au moins 80% un bras, et
au moins 85% une jambe. Quelle est la proportion minimale des combattants qui ont
perdu les 4 ?
Exercice 14. Un centre de langue propose des cours d’Albanais, de Bantou et de Chi-
nois. Sur 93 élèves, 54 étudient l’Albanais, 51 le Bantou ou le Chinois, 27 le Chinois
mais pas le Bantou, 3 ni l’Albanais ni le Chinois, et 12 étudient les 3 langues.
1. Combien d’élèves étudient à la fois le Bantou et le Chinois ?
2. Combien d’élèves étudient l’Albanais ou le Bantou mais pas le Chinois ?
3. Combien d’élèves n’étudient ni le Bantou ni le Chinois ?
4. Combien d’élèves étudient une seule langue ?
5. Combien d’élèves étudient exactement deux langues ?
Exercice 15. Pour chacune des assertions suivantes :

• ∀n ∈ N , ∃m ∈ N ; (m | n),
• ∃n ∈ N ; ∀m ∈ N , (m | n),
• ∃n ∈ N ; ∀m ∈ N, (n | m),
• ∀n ∈ N , ∀m ∈ N , (m | n) ∨ (n | m) ,

• ∀n ∈ N , ∀m ∈ N , ((m | n) ∧ (n | m)) =⇒ (m = n) ,

• ∀n ∈ N , ∀m ∈ N , ∃k ∈ N ; (n | k) ∧ (m | k) .
1. Lire à haute voix et comprendre.

2. Dire si l’assertion est vraie ou fausse et le démontrer.
3. Ecrire la négation, lire à haute voix et comprendre.
Exercice 16. On note N l’ensemble des entiers naturels, A l’ensemble des nombres pairs,
et B l’ensemble des nombres premiers. Exprimer sous forme symbolique les phrases
suivantes.
1. Tout nombre pair est divisible par 2.
36
2. Aucun nombre impair n’est divisible par 2.

3. Il n’existe pas de nombre premier pair distinct de 2.
4. Tout nombre premier distinct de 2 est impair.
5. Il existe un nombre pair qui divise tout nombre pair.
6. Tout nombre premier divise au moins un nombre pair
Exercice 17. On note N l’ensemble des entiers naturels, A l’ensemble des nombres
pairs, et B l’ensemble des nombres premiers. Ecrire en langage courant et comprendre
la signification des expressions logiques suivantes.
1. ∃n ∈ A ; n ∈ B.
2. ∀n ∈ A , ∃m ∈ B ; m | n.

3. ∀n ∈ N , n ∈ A =⇒ (n ∈
/ B) ∨ (n = 2) .

4. ∀n ∈ A , (n = 2) ∨ ∃(m, p) ∈ A × B ; n = mp .
5. ∃n ∈ N ; ∀(m, p) ∈ A × B , (n 6= m) ∧ (n 6= p).

6. ∀n ∈ N , ∃m ∈ A ; m|n =⇒ (n ∈ A).

7. ∀n ∈ N , (n ∈ A) ∨ ∃m ∈ A ; m+1=n .
Exercice 18. Représenter sur un diagramme de Venn les ensembles suivants.

• Ensemble Q des quadrilatères.
• Ensemble T des trapèzes.
• Ensemble P des parallélogrammes.
• Ensemble R des rectangles.
• Ensemble L des losanges.
• Ensemble C des carrés.
Exprimer sous forme logique, puis ensembliste, les phrases suivantes.
1. Tout carré est un rectangle.
2. Tout rectangle qui est aussi un losange est un carré.
3. Il existe des parallélogrammes qui ne sont pas des rectangles.
4. Si un losange est un rectangle alors c’est un carré.
5. Une condition nécessaire pour qu’un trapèze soit un carré est que ce soit un
rectangle.
6. Pour qu’un trapèze soit un rectangle il suffit que ce soit un carré.
7. Il existe des quadrilatères qui ne sont ni des rectangles, ni des losanges.
8. Il existe des parallélogrammes qui ne sont ni des rectangles, ni des losanges.
37
Exercice 19. Si n est un entier, on note « n modulo 5 » le reste de la division euclidienne

de n par 5. Les applications suivantes sont définies sur {0, 1, 2, 3, 4}, à valeurs dans lui-
même. Représentez-les sur un diagramme. Sont-elles injectives ? surjectives ? bijectives ?
Représentez le diagramme de f ◦ f .
1. f : n 7→ n + 1 modulo 5.
2. f : n 7→ n + 3 modulo 5.
3. f : n 7→ n + 10 modulo 5.
4. f : n 7→ 2n modulo 5.
5. f : n 7→ 3n modulo 5.
6. f : n 7→ 10n modulo 5.
Exercice 20. Si n est un entier, on note « n modulo 6 » le reste de la division euclidienne

de n par 6. Les applications f suivantes sont définies sur {0, 1, 2, 3, 4, 5}, à valeurs
dans lui-même. Représentez-les sur un diagramme. Sont-elles injectives ? surjectives ?
bijectives ? Représentez le diagramme de f ◦ f .
1. f : n 7→ n + 1 modulo 6.
2. f : n 7→ n + 3 modulo 6.
3. f : n 7→ n + 10 modulo 6.
4. f : n 7→ 2n modulo 6.
5. f : n 7→ 3n modulo 6.
6. f : n 7→ 10n modulo 6.
Exercice 21. On considère les applications suivantes, de N vers N. Sont-elles injectives ?

surjectives ? bijectives ?
1. f : n 7→ n + 1.
2. f : n 7→ 2n.
3. f : n 7→ n2 .
(
n + 1 si n est pair
4. f : n 7→
2n si n est impair.
(
2n si n est pair
5. f : n 7→
n − 1 si n est impair.
(
n + 1 si n est pair
6. f : n 7→
n − 1 si n est impair.
(
n/2 si n est pair
7. f : n 7→
(n − 1)/2 si n est impair.
Exercice 22. On considère les applications suivantes, de R vers R. Sont-elles injectives ?
surjectives ? bijectives ?
38
1. f : x 7→ x + 1.
2. f : x 7→ 2x.
3. f : x 7→ x2 .
4. f : x 7→ x3 .
q
5. f : x 7→ |x|.
6. f : x 7→ √x si x 6= 0 , f (0) = 0.
|x|
7. f : x 7→ ex .
8. f : x 7→ x3 − 3x.
2x
Exercice 23. Soit f l’application de R dans R définie par f (x) = .
1 + x2
1. f est-elle injective ? surjective ?
2. Montrez que f (R) = [−1, 1].
3. Montrez que la restriction

[−1, 1]→ [−1, 1]
g:
x → f (x)
est une bijection.
Exercice 24. On considère l’application
f: R2 → R2
(x, y) 7→ (x + y, xy)
et l’ensemble A = {(x, y) ∈ R2 | x = 0 et y > 0}.

1. L’application f est-elle injective ?
2. Déterminez f −1 (A).
3. L’application f est-elle surjective ?
4. On considère maintenant l’application définie sur C,
g: C2 → C2
(x, y) 7→ (x + y, xy)
Montrez que
(
y = α−x
g(x, y) = (α, β) ⇔
x2 − αx + β = 0
Déduisez de cette équivalence la surjectivité de g.
39
Exercice 25. Les applications suivantes sont-elles injectives ? surjectives ? bijectives ?

R −→ R2
1. f :
x 7−→ (x, 0)
R −→ (R2
2. f : 4 − 2x2 si x < 1
x 7−→
x+1 si x > 1
R2 −→ R2
3. f :
(x, y) 7−→ (x + y, x − y)
Exercice 26. Soit E un ensemble, f et g deux applications de E dans E.
1. On suppose que f ◦ g = f ◦ f ◦ f et que f est injective. Montrer que ∀x ∈
E, g(x) = (f ◦ f )(x).
2. On suppose que g ◦ f = f ◦ f ◦ f et que f est surjective. Montrer que ∀x ∈
E, g(x) = (f ◦ f )(x).
On suppose maintenant que f est bijective. Dans l’un quelconque des cas ci-dessus,
montrer que g est bijective et calculer son inverse.
Exercice 27. Soit E un ensemble et A un sous-ensemble de E. On appelle « fonction
indicatrice de A » et on note IA l’application de E vers {0, 1} qui à x ∈ E associe 1 si
x ∈ A, 0 si x ∈/ A. Soient A et B deux sous-ensembles de E. Démontrer les assertions
suivantes.
1. ∀x ∈ E , IcA (x) = 1 − IA (x).
2. ∀x ∈ E , IA∩B (x) = min{IA (x), IB (x)} = IA (x) IB (x).
3. ∀x ∈ E , IA∪B (x) = max{IA (x), IB (x)} = IA (x) + IB (x) − IA (x) IB (x).
Exercice 28. Soient E et F deux ensembles, f une application de E vers F . Soient A
et A0 deux sous-ensembles de E. Soient B et B 0 deux sous-ensembles de F . Démontrer
les assertions suivantes.
1. (A ⊂ A0 ) =⇒ (f (A) ⊂ f (A0 )).
2. (B ⊂ B 0 ) =⇒ (f −1 (B) ⊂ f −1 (B 0 )).
3. f (A ∪ A0 ) = (f (A) ∪ f (A0 )).
4. f −1 (B ∪ B 0 ) = (f −1 (B) ∪ f −1 (B 0 )).
5. f (A ∩ A0 ) ⊂ (f (A) ∩ f (A0 )).
6. f −1 (B ∩ B 0 ) = (f −1 (B) ∩ f −1 (B 0 )).
7. f −1 (f (A)) ⊃ A.
8. f (f −1 (B)) ⊂ B.
9. f (A ∩ f −1 (B)) = (f (A) ∩ B).
10. f (A ∪ f −1 (B)) ⊂ (f (A) ∪ B).
40
Exercice 29. Ecrire chacune des assertions suivantes comme une implication.
Ecrire et démontrer sa contraposée.
1. Aucun nombre impair n’est la somme de deux nombres impairs.
2. Tout nombre premier strictement supérieur à 2 est impair.
3. Soient m et n deux entiers impairs tels que m divise 2n. Alors m divise n.
4. Soient m et n deux entiers tels que m divise n. Alors m et n + 1 sont premiers
entre eux (ils n’ont aucun diviseur commun autre que 1).
5. Si le produit de deux entiers strictement supérieurs à 1 est le carré d’un entier
alors chacun des deux est le carré d’un entier ou bien ils ont un diviseur commun
autre que 1.
Exercice 30. Démontrer par récurrence les assertions suivantes.

n
X
1. ∀n ∈ N , (k + 1) = (n + 1)(n + 2)/2.
k=0
n
k 2 = n(n + 1)(2n + 1)/6.
X
2. ∀n ∈ N ,
k=0
n
k 3 = n2 (n + 1)2 /4.
X
3. ∀n ∈ N ,
k=0
4. ∀n ∈ N , 3|(n3 − n).
n
2k = 2n+1 − 1.
X
5. ∀n ∈ N ,
k=0
n
k2k = (n − 1)2n+1 + 2.
X
6. ∀n ∈ N ,
k=0
n
Y k2 − 4 (n + 2)!
7. ∀n ∈ N, n ≥ 3 , = .
k=3 k 12n(n − 1)
n n
(n + k) = 2n
Y Y
8. ∀n ∈ N∗ , (2k − 1).
k=1 k=1
Exercice 31. Soient E un ensemble fini non vide et x un élément fixé de E. On considère
les relations R définies par les assertions suivantes.
• ∀A, B ∈ P(E) , ARB ⇐⇒ A = B.
• ∀A, B ∈ P(E) , ARB ⇐⇒ (A ∩ B = ∅) ∨ (A ∪ B 6= ∅) .

c c
• ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ A ∩ B) ∨ (x ∈ A ∩ B) .
Pour chacune de ces relations.
1. Montrer que R est une relation d’équivalence sur P(E).
2. Décrire l’ensemble quotient P(E)/R.
41
Exercice 32. Soit E un ensemble non vide et x un élément fixé de E. On définit la

relation R sur l’ensemble P(E) des parties de E par :

∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ A ∩ B) ∨ (x ∈ cA ∩ cB) .
1. Montrer que R est une relation d’équivalence.

2. Montrer que la classe d’équivalence de ∅ est P(E \ {x}) (ensemble des parties
du complémentaire de {x} dans E).
3. Montrer que l’ensemble quotient P(E)/R a deux éléments :
P(E)/R = {clR (∅), clR ({x}) } .
4. On définit l’application fx , de P(E) vers P(E), qui à un sous-ensemble A associe

A ∪ {x}. L’application f est-elle injective ? surjective ?
5. Vérifier que l’image par fx d’un élément de clR (∅) appartient à clR ({x}).
6. Montrer que tout élément de clR ({x}) a un antécédent et un seul dans clR (∅).
7. En déduire que :
Card(clR (∅)) = Card(clR ({x}))
8. Déduire des questions précédentes que :
Card(P(E)) = 2Card(P(E \ {x})) .
9. Démontrer par récurrence que le cardinal de l’ensemble des parties d’un ensemble
à n éléments est 2n .
2.3 QCM
Donnez-vous une heure pour répondre à ce questionnaire. Les 10 questions sont
indépendantes. Pour chaque question 5 affirmations sont proposées, parmi lesquelles 2
sont vraies et 3 sont fausses. Pour chaque question, cochez les 2 affirmations que vous
pensez vraies. Chaque question pour laquelle les 2 affirmations vraies sont cochées
rapporte 2 points.
Question
1.
A (4 < 2) ∧ (2 | 4) ∧ (4 | 8) ∧ (4 < 8) .

B (4 < 2) ∨ (2 | 4) ∧ (4 | 8) ∧ (8 < 4) .

C (4 < 2) ∧ (2 | 4) ∨ (4 | 8) ∧ (4 < 8) .

D (4 < 2) ∨ (2 | 4) ∧ (4 | 8) ∨ (4 < 8) .

E (8 < 2) ∧ (2 | 8) ∨ (2 | 4) ∧ (4 < 2) .
Question 2. Soit n un entier naturel quelconque.
42
A (n2 = n) =⇒ (n < 2).

B (n2 = 16) =⇒ (2|n).
C (n 6 2) =⇒ (2n > n).
D (n2 6 n) =⇒ (2n > n).
E (2|n) =⇒ (2 < n).
Question 3. Soit n un entier quelconque. L’implication (6 | n) =⇒ (3 | n), peut se
traduire par :
A Pour que n soit multiple de 3, il faut que n soit multiple de 6.
B Pour que n soit multiple de 3, il suffit que n soit multiple de 6.
C L’entier n est multiple de 3, seulement s’il est multiple de 6.
D Une condition nécessaire pour que n soit multiple de 6 est que n soit multiple
de 3.
E Une condition suffisante pour que n soit multiple de 6 est que n soit multiple
de 3.
Question 4. Si je mange, alors je bois. Si je bois, alors je ne parle pas et je suis content.
Je ne suis pas content. Vous pouvez en déduire que :
A je ne mange pas.
B je parle.
C je ne parle pas et je ne mange pas.
D je mange.
E je ne bois pas.
5. Soient A,B, C trois sous-ensembles quelconques d’un ensemble E. L’en-

Question
semble (A ∪ cB) ∩ cC ∪ (cA ∪ cC) ∩ B) est :
A inclus dans cC ∪ B.
B égal à E.
C disjoint de B.
D égal à cC ∪ (cA ∩ B).
E inclus dans A ∪ B.
Question 6. L’ ensemble A est égal au singleton {1}.
A A = { n ∈ N , (n2 = n) }.
B A = { n ∈ N , (∀m > n , n|m) }.
C A = { n ∈ N , (n|3) }.
D A = { n ∈ N , (n|2) ∨ (n|3) }.
E A = { n ∈ N , (n|2) ∧ (n|3) }.
Question 7.
A ∀n ∈ N , ∃m ∈ N ; m 6 n.
B ∀n ∈ N , ∀m ∈ N ; m 6 n.
43
C ∃n ∈ N , ∀m ∈ N ; n 6 m.
D ∃n ∈ N , ∀m ∈ N ; m 6 n.
E ∃n ∈ N , ∃m ∈ N ; n + m + 1 = 0.
Question 8. Soit E = {1, 2, 3, 4}. On note f l’application de E dans E dont le graphe

Γ est le suivant.
Γ = { (1, 2) , (2, 3) , (3, 3) , (4, 1) } .
A L’application f est surjective.
B f ({2, 3}) est un singleton.
C f −1 ({2, 3}) est un singleton.
D L’image réciproque par f de tout singleton est non vide.
E 4 n’a pas d’antécédent pour f .
Question 9. La relation R est une relation d’équivalence sur N.

A ∀n, m ∈ N , nRm ⇐⇒ n|m.
B ∀n, m ∈ N , nRm ⇐⇒ n2 = m2 .
C ∀n, m ∈ N , nRm ⇐⇒ n2 + m2 = −2nm.
D ∀n, m ∈ N , nRm ⇐⇒ n2 − m2 = 2nm + 2n.
E ∀n, m ∈ N , nRm ⇐⇒ n2 + m2 = 2nm.
Question 10. Soit H(n) un énoncé dépendant de l’entier n. L’assertion entraîne que
H(n) est vraie
pour tout n > 1.
A H(1) ∧ ∀n > 1 , H(n) =⇒ H(n + 1) .

B H(1) ∧ ∀n > 1 , H(n) =⇒ H(n + 2) .

C H(1) ∧ ∀n > 2 , H(n) =⇒ H(n + 1) .

D H(1) ∧ ∀n > 1 , H(n + 1) =⇒ H(n) .

E H(1) ∧ ∀n > 1 , H(n) =⇒ H(2n) ∧ ∀n > 4 , H(n) =⇒ H(n − 1) .
Réponses : 1–CD 2–AB 3–BD 4–AE 5–AD 6–BE 7–AC 8–BE 9–BE 10–AE
2.4 Devoir
Essayez de bien rédiger vos réponses, sans vous reporter ni au cours, ni au corrigé. Si
vous souhaitez vous évaluer, donnez-vous deux heures ; puis comparez vos réponses avec
le corrigé et comptez un point pour chaque question à laquelle vous aurez correctement
répondu.
Questions de cours : Soient E et F deux ensembles. Soit f une application de E
dans F . Soit A un sous-ensemble de E et B un sous-ensemble de F .
44
1. Définir l’image f (A) de A et l’image réciproque f −1 (B) de B.

2. Démontrer que A ⊂ f −1 (f (A)) et que f (f −1 (B)) ⊂ B.
3. Quand dit-on que f est injective ? surjective ?
4. Démontrer que si f est injective, alors A = f −1 (f (A)). Démontrer que si f est
surjective, alors B = f (f −1 (B)).
5. Soit E = F = {−1, 0, 1} et soit f l’application de E dans F qui à x associe
x2 . L’application f est-elle injective ? surjective ? Soit A = {1} et B = {−1, 1}.
Ecrire en extension les ensembles f −1 (f (A)) et f (f −1 (B)).
Exercice 1 : Soient A, B et C trois assertions.
1. Ecrire la table de vérité de l’assertion :
(A ∨ B) =⇒ (A ∨ C) .
2. Ecrire la table de vérité de l’assertion :
(A ∧ B) =⇒ (A ∧ C) .
3. Utiliser les tables de vérité des deux questions précédentes pour démontrer que
l’équivalence suivante est toujours vraie.

(A ∨ B) =⇒ (A ∨ C) ∧ (A ∧ B) =⇒ (A ∧ C) ⇐⇒ B =⇒ C .
4. En utilisant les assertions A : « je suis une fille », B : « je fais du sport » et C :

« je garde la forme », exprimer en langage courant l’équivalence de la question
précédente.
5. Soit E un ensemble, A, B, C trois sous-ensembles de E. Représenter dans trois
diagrammes de Venn différents les ensembles E, A, B, C, dans les trois cas sui-
vants.
• B ⊂ C.
• B 6⊂ C, (A ∪ B) ⊂ (A ∪ C), (A ∩ B) 6⊂ (A ∩ C).
• B 6⊂ C, (A ∪ B) 6⊂ (A ∪ C), (A ∩ B) ⊂ (A ∩ C).
6. Démontrer que l’équivalence suivante est toujours vraie.

(A ∪ B) ⊂ (A ∪ C) ∧ (A ∩ B) ⊂ (A ∩ C) ⇐⇒ B⊂C .
Exercice 2 :
1. Soient A1 et A2 deux assertions. Ecrire à l’aide des symboles ∧, ∨, ¬ l’assertion :
« de deux choses l’une, soit A1 est vraie, soit A2 est vraie, mais pas les deux ».
On notera désormais (A1 Xor A2 ) cette assertion.
45
2. Démontrer à l’aide des tables de vérité que l’implication suivante est toujours
vraie.
A1 Xor A2 ∧ ¬A1 =⇒ A2 .
3. On considère les propositions suivantes : B : « je bois », C :« je conduis », F :
« je vais voir un film », M : « je marche », R : « je vais au restaurant ». Ecrire
sous forme symbolique les assertions suivantes.
A1 : « de deux choses l’une, soit je conduis, soit je marche ».
A2 : « de deux choses l’une, soit je vais voir un film, soit je vais au restaurant,
et dans ce cas je bois ».
A3 : « si je conduis, alors je ne bois pas ».
A4 : « je ne marche pas ».
4. On suppose que les assertions A1 , A2 , A3 , A4 sont vraies. Démontrer que l’asser-
tion F est vraie. Vous écrirez votre raisonnement sous forme symbolique, et en
langage courant.
Exercice 3 : Soit R la relation définie sur l’ensemble des réels R par :

∀x, y ∈ R , xRy ⇐⇒ x2 − y 2 = x − y .
Soit S la relation définie sur l’ensemble des réels R par :

∀x, y ∈ R , xSy ⇐⇒ x2 − y 2 6 x − y .

2. Démontrer que pour tout x ∈ R,
clR (x) = {x, 1 − x} .
3. Démontrer que la relation S est réflexive, transitive, mais qu’elle n’est ni symé-
trique ni anti-symétrique.
4. Soit I l’ensemble des réels supérieurs ou égaux à 1/2. Soit S 0 la relation définie
sur I par :
∀x, y ∈ I , xS 0 y ⇐⇒ x2 − y 2 6 x − y .
Montrer que S 0 est une relation d’ordre sur I.
5. Démontrer que :
∀x, y ∈ I , xS 0 y ⇐⇒ x6y .
46
2.5 Corrigé du devoir

Questions de cours :
1. L’image de A est l’ensemble des images par f des éléments de A.
f (A) = { f (x) , x ∈ A } = { y ∈ B , ∃x ∈ A , y = f (x) } .
L’image réciproque de B est l’ensemble des éléments de E dont l’image appar-

tient à B.
f −1 (B) = { x ∈ E , f (x) ∈ B } .
2. Soit x un élément quelconque de A. Posons y = f (x). Alors y ∈ f (A) car x ∈ A.
Donc x est un élément de E dont l’image par f appartient à f (A). Par définition
de l’image réciproque, x appartient à f −1 (f (A)). Tout élement de A appartient
à f −1 (f (A)), donc A ⊂ f −1 (f (A)).
Soit y un élément quelconque de f (f −1 (B)). Par définition de l’image, il existe
x ∈ f −1 (B) tel que f (x) = y. Puisque x ∈ f −1 (B), l’image de x est dans B,
donc y ∈ B. Tout élement de f (f −1 (B)) appartient à B, donc f −1 (f (B)) ⊂ B.
3. On dit que f est injective si tout élément de F a au plus un antécédent dans
l’ensemble de départ.

∀x1 , x2 ∈ E , f (x1 ) = f (x2 ) =⇒ x1 = x2 .
On dit que f est surjective si tout élément de l’ensemble d’arrivée a au moins

un antécédent dans l’ensemble de départ.
∀y ∈ F , ∃x ∈ E ; f (x) = y .
4. Nous allons montrer que si f est injective, alors f −1 (f (A)) ⊂ A. Soit x un

élément de f −1 (f (A)). Par définition de l’image réciproque, f (x) ∈ f (A). Donc
il existe un élément de A dont l’image est égale à celle de x. Mais comme f est
injective, cet élément ne peut être que x lui-même. Donc x ∈ A. Tout élément de
f −1 (f (A)) appartient à A, donc f −1 (f (A)) ⊂ A. Comme d’après la question 2,
A ⊂ f −1 (f (A)), nous avons bien démontré que A = f −1 (f (A)), si f est injective.
Nous allons maintenant montrer que si f est surjective, alors B ⊂ f (f −1 (B)).
Soit y un élément de B. Comme f est surjective, il existe x ∈ E tel que f (x) = y.
Par définition de l’image réciproque, puisque y ∈ B, x ∈ f −1 (B), et donc
y = f (x) ∈ f (f −1 (B)). Tout élément de B appartient à f (f −1 (B)), donc B ⊂
f (f −1 (B)). Comme d’après la question 2, f (f −1 (B)) ⊂ B, nous avons bien
démontré que B = f (f −1 (B)).
5. Le graphe de f est :
{ (−1, 1) , (0, 0) , (1, 1) } .
47
L’application f n’est pas injective car −1 et 1 ont la même image. Elle n’est pas
surjective car −1 n’a pas d’antécédent.
f −1 (f (A)) = {−1, 1} =
6 A et f (f −1 (B)) = {1} =
6 B.
Exercice 1 :
1. Notons I l’assertion proposée.

I= (A ∨ B) =⇒ (A ∨ C) .
Voici sa table de vérité.

A B C A∨B A∨C I
V V V V V V
V V F V V V
V F V V V V
V F F V V V
F V V V V V
F V F V F F
F F V F V V
F F F F F V
2. Notons J l’assertion proposée.

J= (A ∧ B) =⇒ (A ∧ C) .
Voici sa table de vérité.

A B C A∧B A∧C J
V V V V V V
V V F V F F
V F V F V V
V F F F F V
F V V F F V
F V F F F V
F F V F F V
F F F F F V
48
3. Voici les tables de vérité des assertions I ∧ J et B =⇒ C.

A B C I J I ∧ J B =⇒ C
V V V V V V V
V V F V F F F
V F V V V V V
V F F V V V V
F V V V V V V
F V F F V F F
F F V V V V V
F F F V V V V
On constate que les tables de vérité des assertions I ∧ J et B =⇒ C sont les

mêmes. L’équivalence entre les deux assertions est donc toujours vraie.
4. • (A ∨ B) =⇒ (A ∨ C) : Si je suis une fille ou je fais du sport, alors je suis une
fille ou je garde la forme.
• (A ∨ B) =⇒ (A ∨ C) : Si je suis une fille et je fais du sport, alors je suis une
fille et je garde la forme.
• B =⇒ C : Si je fais du sport, alors je garde la forme.
De deux choses l’une : soit je ne suis pas une fille, soit j’en suis une. Si je ne
suis pas une fille (A est faux), la première implication dit que faire du sport est
une condition suffisante pour garder la forme. La seconde implication dit que
faire du sport est une condition suffisante pour garder la forme, aussi pour les
filles. Affirmer les deux premières implications revient à dire que faire du sport
est suffisant pour garder la forme, qu’on soit une fille ou non.
5. Voir figure 6.
E E E A
C A
C B C B
A B
Figure 6 – Diagrammes de Venn de trois sous-ensembles.
6. Notons respectivement A, B et C les assertions « x ∈ A », « x ∈ B » et

« x ∈ C ». Les inclusions de l’énoncé se traduisent comme suit.

(A ∪ B) ⊂ (A ∪ C) ⇐⇒ A ∨ B =⇒ A ∨ C ,
49

(A ∩ B) ⊂ (A ∩ C) ⇐⇒ A ∧ B =⇒ A ∧ C ,

B⊂C ⇐⇒ B =⇒ C .
L’équivalence demandée est celle de la question 3.

Exercice 2 :
1.
A1 Xor A2 = ¬A1 ∧ A2 ∨ A1 ∧ ¬A2 .
2.

A1 A2 A1 Xor A2 A1 Xor A2 ∧ (¬A1 ) A1 Xor A2 ∧ (¬A1 ) =⇒ A2
V V F F V
V F V F V
F V V V V
F F F F V
3. A1 : C Xor M
A2 : F Xor (R ∧ B)
A3 : C =⇒ (¬B)
A4 : ¬M
4.
(C Xor M ) ∧ (¬M ) =⇒ C
C =⇒ (¬B)

(¬B) =⇒ ¬(R ∧ B

F Xor (R ∧ B) ∧ ¬(R ∧ B) =⇒ F .
Soit je conduis, soit je marche. Puisque je ne marche pas, je conduis ; donc je ne

bois pas. Puisque je ne bois pas, je ne suis pas au restaurant en train de boire.
Donc je vais voir un film.
Exercice 3 :
1. La relation R est :
• réflexive :
∀x ∈ R , x2 − x2 = x − x ,
• symétrique :

∀x, y ∈ R , x2 − y 2 = x − y =⇒ y 2 − x2 = y − x ,
50
• transitive :

2 2 2 2
∀x, y, z ∈ R , x −y = x−y ∧ y −z = y−z =⇒ x2 −z 2 = x−z .
Donc c’est une relation d’équivalence.
2.

∀x, y ∈ R2 , xRy ⇐⇒ x2 − y 2 = x − y
⇐⇒ (x − y)(x + y − 1) = 0

⇐⇒ (x − y = 0) ∨ (x + y − 1 = 0)

⇐⇒ (y = x) ∨ (y = 1 − x) .
3. La relation S est :
• réflexive :
∀x ∈ R , x2 − x2 6 x − x ,
• transitive :

∀x, y, z ∈ R , x2 − y 2 6 x − y ∧ y 2 − z 2 6 y − z =⇒ x2 − z 2 6 x − z ,
• non symétrique :
02 − 22 6 0 − 2 mais 22 − 02 > 2 − 0 ,
• non anti-symétrique :
02 − 12 6 0 − 1 et 12 − 02 6 1 − 0 .
4. La relation S 0 est réflexive et transitive, comme la relation S (car ce qui est vrai
sur R reste vrai sur un sous-ensemble de R). Nous devons démontrer qu’elle est
anti-symétrique. Soit I l’ensemble des réels supérieurs ou égaux à 1/2.

∀x, y ∈ I , xS 0 y ∧ yS 0 x =⇒ x2 − y 2 = x − y
=⇒ (y = x) ∨ (y = 1 − x) ,
d’après la question 2. Or si x > 1/2, alors 1 − x < 1/2, et si x = 1/2, alors

1−x = 1/2. Donc si x et y sont à la fois éléments de I et tels que xS y ∧ yS 0 x ,
0
alors x = y : la relation S 0 est anti-symétrique.

5. Soient x et y deux éléments de I. Si x = y = 1/2, on a la fois xS 0 y et x 6 y. Si
x ou y est strictement supérieur à 1/2, alors x + y − 1 est strictement positif.
Dans ce cas :
(x2 − y 2 ) 6 (x − y) ⇐⇒ (x − y)(x + y − 1) 6 0
⇐⇒ x − y 6 0
⇐⇒ x 6 y .
51
3 Compléments
3.1 La quantification des prédicats
Voici ce qu’un élève de Hamilton écrivait en 1846, au terme d’un exposé sur la
quantification du prédicat.
Nous ne pouvons pas finir, sans exprimer la véritable joie que nous ressen-
tons (que la force de ce sentiment serve d’excuse à notre témérité) de ce que
cette découverte a été faite dans notre pays et dans notre temps. Nous nous
réjouissons de savoir qu’il s’est élevé un homme capable de comprendre et
de compléter le plan du grand architecte, Aristote, de placer la dernière
pierre au monument dont les fondations étaient posées depuis deux mille
ans, par la main puissante du philosophe de Stagire, et qui après les efforts
de tant de générations d’ouvriers. . .
Sir William Stirling Hamilton (1788–1856) n’est pas le Sir William Rowan Hamilton
des quaternions et du hamiltonien, et il est beaucoup moins célèbre. Pour quelqu’un
censé avoir « complété le plan du grand architecte », n’est-ce pas quelque peu injuste ?
Et pour commencer, quelle est cette fameuse « dernière pierre au monument » ?
Voici un énoncé, suivi de sa démonstration par contraposée.
Soient A et B deux ensembles non vides. Alors :

∀x ∈ A , x ∈ B =⇒ ∃x ∈ B , x ∈ A .
En effet,
¬ ∃x ∈ B , x ∈ A ⇐⇒ ∀x ∈ B , x ∈
/A .
Or,
∀x ∈ B , x ∈
/A =⇒ ∀x ∈ A , x ∈
/B .
Enfin :
∀x ∈ A , x ∈
/B =⇒ ¬ ∀x ∈ A , x ∈ B
Voici une autre formulation.

Si A appartient à tout B, B aussi appartient à quelque A ; car si B n’ap-
partenait à aucun A, A n’appartiendrait non plus à aucun B : or A était
supposé appartenir à tout B.
À part que le second énoncé est nettement plus compréhensible que le premier, qu’est-ce
qui les sépare ?
La bagatelle de 23 siècles ! Le second est extrait de l’Organon d’Aristote (384–
322 av. J.C.), le premier n’aurait pas pu être écrit tel quel avant 1935, date de la
première utilisation du symbole ∀. Comme ci-dessus, on trouve dans la plupart des
énoncés d’Aristote l’usage de « tout », « aucun » et « quelque ». Selon les différentes
52
combinaisons de « tout » et « quelque », on distingue 4 types d’affirmations positives

(ni la signification ni la véracité ne sont en cause) :
1. Tout homme est tout animal
2. Tout homme est quelque animal
3. Quelque homme est tout animal
4. Quelque homme est quelque animal
Si on rajoute les négations possibles sur chacun des deux attributs, on obtient 16
types de propositions. Certaines sont utiles, d’autres moins car toujours vraies ou tou-
jours fausses. Les 16 types, virtuellement présents chez Aristote, ont été abondamment
discutés par les commentateurs anciens d’Aristote : Ammonios (475–515) et Boèce
(480–525). Ibn Zur‘a (943–1008) semble être le premier à lister systématiquement les
16 types 1 , suivi par Ibn Sina (Avicenne : 980–1037), Ibn Rushd (Averroès : 1126–1198)
et Maïmonide (1138–1204). Mais comme d’habitude, l’apport des savants arabes ou
juifs sera longtemps ignoré des occidentaux. Lorsque vers 1836 Hamilton liste 8 types
parmi les 16 sans identifier clairement leur valeur sémantique, le moins que l’on puisse
dire est qu’il ne recueille pas une adhésion massive de ses contemporains ; et lorque
quelques années plus tard il acuse imprudemment Augustus de Morgan (1806–1871) de
plagiat, il aggrave son cas : de Morgan ne se gêne pas pour tailler en pièces la « théorie
de la quantification des prédicats ». Voici ce que dit Jacques Maritain 2 .
Ces dithyrambes paraissent un peu exagérés, surtout si l’on réfléchit qu’en
réalité Hamilton n’a apporté aucune découverte nouvelle, et que son idée
de la quantification du prédicat s’était déjà très nettement présentée à l’es-
prit du « philosophe de Sagire », – lequel l’avait d’ailleurs rejetée non sans
bonnes raisons. À notre connaissance, aucun des critiques modernes de la
théorie de Hamilton n’a songé à se reporter sur ce point à la pensée des
anciens. Nous avons cependant là un exemple fort remarquable d’une pré-
tendue innovation non pas seulement, comme tant d’autres, déjà contenue,
plus ou moins implicitement, dans l’arsenal des vieux auteurs, et élucidable
par leurs principes, mais bien formulée explicitement et explicitement cri-
tiquée par eux. Bien plus, si pertinente que soit la réfutation présentée par
de Morgan et par Stuart Mill de la théorie de la quantification du prédicat,
nulle critique moderne de cette théorie n’est aussi décisive et aussi péné-
trante que la page qui lui est consacrée par Saint Thomas d’Acquin dans
son commentaire sur le Perri Hermeneias.
1. A. Hasnawi, Avicenna on the quantification of the predicate in TS. Rahman, T. Street, H. Tahiri
eds. The unity of science in the Arabic tradition, Springer, New-York (2008)
2. J. Maritain, La quantification du Prédicat et la logique de l’école, Revue néoscolastique de
philosophie, 25(97), p. 57–89 (1923)
53
3.2 Ces longues chaînes de raisons

Voici six textes célèbres à propos de l’universalité et de la perfection du langage
mathématique.
Platon (428-348 av. J.-C.), La République
Tu n’ignores pas, je pense, que ceux qui s’occupent de géométrie, d’arith-
métique et autres sciences du même genre, supposent le pair et l’impair, les
figures, trois espèces d’angles et autres choses analogues suivant l’objet de
leur recherche : qu’ils les traitent comme choses connues, et que quand ils
en ont fait des hypothèses, ils estiment qu’ils n’ont plus à en rendre aucun
compte ni à eux-mêmes ni aux autres, attendu qu’elles sont évidentes à
tous les esprits ; qu’enfin, partant de ces hypothèses et passant par tous les
échelons, ils aboutissent par voie de conséquences à la démonstration qu’ils
s’étaient mis en tête de chercher.
Gerbert d’Aurillac (945 ?-1003), Pape Sylvestre II en l’an mil

Je vous invite à entrer dans ce paradis terrestre qu’est la contemplation des
causes. Ce qu’on peut faire au moyen de cette magie que les Perses nomment
sagesse, les juifs kabbale, les Grecs philosophie, les Pythagoriciens science
des nombres formels et les Platoniciens souverain remède qui donne à l’âme
une parfaite tranquillité par la vertu qu’il a de joindre les effets, passifs, aux
vertus, agentes. Cette magie n’est autre que la philosophie naturelle, c’est-
à-dire l’étude des lois qui régissent la nature[. . . ]
Si vous n’étiez pas fermement convaincu que la science des nombres contient
en elle ou produit, comme une source, les prémisses de toutes choses, vous
ne montreriez pas tant d’ardeur à en prendre une connaissance entière et
approfondie[. . . ]
Galilée (1564-1642), L’Essayeur

La philosophie est écrite dans ce très vaste livre qui est éternellement ouvert
devant nos yeux – je veux dire l’Univers – mais on ne peut le lire avant
d’avoir appris la langue et s’être familiarisé avec les caractères dans lesquels
elle est écrite. Elle est écrite en langue mathématique et ses lettres sont des
triangles, des cercles et d’autres figures géométriques, moyens sans lesquels
il est humainement impossible de comprendre un seul mot, sans lesquels on
erre en vain dans un obscur labyrinthe.
Descartes (1596-1650), Discours de la méthode

Ces longues chaînes de raisons, toutes simples et faciles, dont les géomètres
ont coutume de se servir pour parvenir à leurs plus difficiles démonstrations,
m’avaient donné occasion de m’imaginer que toutes les choses, qui peuvent
tomber sous la connaissance des hommes, s’entre-suivent en même façon,
54
et que, pourvu seulement qu’on s’abstienne d’en recevoir aucune pour vraie
qui ne le soit, et qu’on garde toujours l’ordre qu’il faut pour les déduire les
unes des autres, il n’y en peut avoir de si éloignées auxquelles enfin on ne
parvienne, ni de si cachées qu’on ne découvre. Et je ne fus pas beaucoup
en peine de chercher par lesquelles il était besoin de commencer : car je
savais déjà que c’était par les plus simples et les plus aisées à connaître ; et
considérant qu’entre tous ceux qui ont ci-devant recherché la vérité dans les
sciences, il n’y a eu que les seuls mathématiciens qui ont pu trouver quelques
démonstrations, c’est-à-dire quelques raisons certaines et évidentes, je ne
doutais point que ce ne fût par les mêmes qu’ils ont examinées ; bien que
je n’en espérasse aucune autre utilité, sinon qu’elles accoutumeraient mon
esprit à se repaître de vérités et ne se point contenter de fausses raisons.
Pascal (1623-1662), De l’esprit géométrique
Je ne puis faire entendre la conduite qu’on doit garder pour rendre les
démonstrations convaincantes, qu’en expliquant celle que la géométrie ob-
serve, et je n’ai choisi cette science pour y arriver que parce qu’elle seule
sait les véritables règles du raisonnement, et, sans s’arrêter aux règles des
syllogismes qui sont tellement naturelles qu’on ne peut les ignorer, s’arrête
et se fonde sur la véritable méthode de conduire le raisonnement en toutes
choses, que presque tout le monde ignore, et qu’il est si avantageux de sa-
voir, que nous voyons par expérience qu’entre esprits égaux et toutes choses
pareilles, celui qui a de la géométrie l’emporte et acquiert une vigueur toute
nouvelle.
Je veux donc faire entendre ce que c’est que démonstrations par l’exemple
de celles de géométrie, qui est presque la seule des sciences humaines qui
en produise d’infaillibles, parce qu’elle seule observe la véritable méthode,
au lieu que toutes les autres sont par une nécessité naturelle dans quelque
sorte de confusion que seuls les géomètres savent extrêmement connaître.
Condillac (1715-1780), La langue des calculs
L’algèbre est une langue bien faite, et c’est la seule : rien n’y paraît arbi-
traire. L’analogie qui n’échappe jamais, conduit sensiblement d’expression
en expression. L’usage n’a ici aucune autorité. Il ne s’agit pas de parler
comme les autres, il faut parler d’après la plus grande analogie pour arriver
à la plus grande précision ; et ceux qui ont fait cette langue, ont senti que
la simplicité du style en fait toute l’élégance : vérité peu connue dans nos
langues vulgaires.
3.3 Le Docteur Illuminé

« Doctor Illuminatus » : c’est par référence à son savoir théologique et son talent
de débatteur que ce surnom flatteur (quelque chose comme « Savant Très Éclairé »)
55
a été attribué à Ramón Lull (1232–1316). La traduction littérale est donc tout à fait
trompeuse. Quoique. . .
Né dans l’île de Mallorca, récemment reconquise par les chrétiens, Lull 3 avait com-
mencé par mener la vie de dissolue de courtisan à laquelle les hauts faits d’armes de
son père pendant la reconquête, et les récompenses qu’il y avait gagnées lui donnaient
droit. Jusqu’à ce que, à l’âge de 30 ans, l’apparition réitérée du Christ en croix lui fasse
tout quitter pour dédier sa vie à la conversion des « infidèles ». Songez que c’était en
ce temps-là la tâche la plus méritoire que l’on puisse entreprendre. Pensez aussi qu’elle
était habituellement menée à grand renfort d’assassinats (« tuez-les tous, Dieu recon-
naîtra les siens » : le massacre de Béziers a été perpétré en 1209), de croisades (celles de
Louis ix datent de 1248 et 1270) et de bûchers (l’Inquisition a été instaurée en 1213).
L’approche de Lull est donc plutôt originale pour l’époque : il commence par se donner
neuf ans de réflexion au cours desquels il peaufine quelques milliers de pages d’argu-
mentaires théologiques. Il apprend même l’arabe pour étudier l’Islam et la philosophie
musulmane et mieux convaincre plus tard ses interlocuteurs. Supposer que sa volonté
de dialogue pacifique ait pu aller jusqu’à la tolérance serait un anachronisme. Pour
apprendre l’arabe, il avait acheté un esclave Maure. Entendant un jour celui-ci jurer en
insultant le nom du Dieu des chrétiens, il le rosse de manière suffisamment humiliante
pour que l’esclave tente de l’assassiner par vengeance. La tentative ayant échoué, Lull
intervient pour que l’esclave ne soit pas immédiatement mis à mort mais seulement em-
prisonné en attendant son jugement. L’esclave aura l’élégance de se suicider en prison,
épargnant ainsi à Lull le dilemme d’avoir à faire appel d’une condamnation inévitable.
Il n’y avait qu’une seule vérité possible pour Lull, celle de sa religion ; il était prêt
à tout pour elle, priant Dieu de lui accorder la grâce de périr en martyr. Il n’est pas
interdit de considérer qu’il faisait ce qu’il fallait pour. Au cours de plusieurs voyages à
Bejaïa ou à Tunis, il se mettait régulièrement à haranguer la foule en plein marché :
« La loi des Chrétiens est sainte et vraie, et la secte des Maures est mauvaise et fausse,
et c’est ce que je vais vous démontrer ! ». Après avoir été sauvé à plusieurs reprises de
groupes furieux d’être ainsi provoqués, ce qu’il souhaitait arriva finalement et il mourut
lapidé à Bejaïa, à l’âge respectable de 83 ans.
Lull savait bien que dans ses argumentaires, certains shémas de pensée revenaient
systématiquement. Il eut l’idée de mécaniser sa méthode par un dispositif de cercles
concentriques, qu’il livrait en appendice à son Ars Magna. Ayant lu en particulier Aver-
roès et Avicenne, il connaissait la logique d’Aristote et de ses continuateurs musulmans :
celle-ci n’était sans doute pas étrangère à son invention 4 .
En fait ce qui est sans doute le plus important est que cette formalisation
correspondait également à des aspects de la méthode polémique musulmane
et que c’est dans cet héritage que s’enracine la fécondité ultérieure de la
méthode combinatoire. Le coup de génie de Lull est d’avoir vu qu’il pouvait
3. E.A. Peers, Ramon Lull : a biographyLondon (1929)
4. D. Urvoy, Les musulmans pouvaient-ils comprendre l’argumentation lullienne ? Estudi General
9, p. 159–170(1989)
56
mettre en relation le défi, par les polémistes musulmans, de dénombrement

exhaustif des combinaisons possibles de concepts, avec certains procédés
combinatoires de la mantique et des talismans.
Voici comment l’écrivain J.L. Borges (auteur de « La bibliothèque de Babel », censée
contenir tous les livres aléatoires possibles) voyait la machine de Lull.
Il s’agit d’un schéma ou diagramme des attributs de Dieu. La lettre A,
centrale, représente de Seigneur. Sur la circonférence, le B signifie la bonté,
le C la grandeur, le D l’éternité, le E le pouvoir, le F la sagesse, le G la
bonté, le C la grandeur, le D l’éternité, le E le pouvoir, le F la sagesse, le
G la volonté, le H la vertu, le I la vérité, le K la gloire.
[. . . ]
Imaginons un problème quelconque : déterminer la « véritable » couleur des
tigres. Je donne à chacune des lettres lulliennes la valeur d’une couleur, je
fais tourner les disques et je constate que le tigre inconstant est bleu, jaune,
noir, blanc, vert, violet, orange et grois ou bleu-jaune, bleu-noir, bleu-blanc,
bleu-vert, bleu-violet, bleu-bleu, etc, etc. Devant cette ambiguïté torren-
tielle, les partisans de l’Ars Magna ne s’effrayaient pas ; ils conseillaient
l’emploi simultané d’un grand nombre de machines combinatoires qui – se-
lon eux – s’orienteraient et se rectifieraient à force de « multiplications » et
d’« évacuations ».
Une machine produisant des phrases aléatoires à volonté, l’idée allait séduire long-
temps : de celle que Gulliver voit fonctionner dans l’île de Laputa, à la littérature
combinatoire chère à Georges Pérec et Raymond Queneau, jusqu’aux « Pipotrons »
que l’on trouve à foison sur le web.
Si la caricature est facile, il reste que Lull est l’initiateur d’un courant philosophique
de « mécanisation de la pensée » qui sera repris sans discontinuer au cours des siècles
suivants : Giordano Bruno, Descartes, Hobbes, Leibniz, puis Babbage et enfin Turing :
l’intelligence artificielle a une longue histoire derrière elle !
3.4 Ramener l’infini au fini

Si des raisonnement par récurrence se trouvent déjà dans les Éléments d’Euclide,
son disciple Eubulide, en fit un usage plutôt particulier.
Un million de grains de sables constituent un tas
Si on enlève un grain de sable à un tas de sable, il reste un tas de sable.
Donc trois grains, deux grains, et même un seul grain ou zéro grain consti-
tuent un tas de sable.
Depuis Euclide, les mathématiciens ont plus ou moins implicitement utilisé le principe
de récurrence. Al Karaji (953–1029) 5 connaissait la formule du binôme, savait calculer
5. R. Rashed, l’induction mathématique – Al Karaji et As Samaw’al Arch. Hist. Exact Sci. 9, p.
1–21 (1972)
57
la somme des n premiers entiers, des n premiers carrés et cubes. Francesco Maurolico
(1475–1575) démontre que la somme des n premiers entiers impairs est n2 .
La première formulation claire du principe du raisonnement apparaît en 1654 dans
le Traité du triangle arithmétique de Blaise Pascal (1623-1662). Voici son texte.
Quoique cette proposition ait une infinité de cas, j’en donnerai une démons-
tration bien courte, en supposant deux lemmes.
Le premier, qui est évident de soi-même, que cette proportion se rencontre
dans la seconde base [. . . ]
Le second, que si cette proportion se trouve dans une base quelconque, elle
se trouvera nécessairement dans la base suivante.
D’où il se voit qu’elle est nécessairement dans toutes les bases : car elle est
dans la seconde base par le premier lemme ; donc par le second elle est dans
la troisième base, donc dans la quatrième, et à l’infini.
3.5 Lettres à une Princesse d’Allemagne

En 1759 Sophie Friederike Charlotte Leopoldine von Brandenburg-Schwedt a 14
ans, quand son père demande à Léonard Euler de lui donner des cours de maths. Au
bout de quelques mois Euler doit interrompre ses leçons.
Madame,
Comme l’espérance de continuer à V. A. mes instructions dans la Géomé-
trie semble éprouver de nouveaux retards, qui me causent un chagrin très
sensible, je souhaiterais pouvoir y suppléer par écrit ; autant que la nature
des objets peut le permettre.
Il est possible que ces « nouveaux retards » aient été liés à la guerre de sept ans ; ils
auront eu en tout cas une conséquence des plus heureuses. Entre 1760 et 1762 Euler
écrit 234 lettres, soit environ 500 pages, portant sur l’ensemble des connaissances du
temps : musique, philosophie, mécanique, optique, astronomie, théologie, éthique ; un
ouvrage de vulgarisation d’une ampleur et d’une clarté exceptionnelles. Voici un extrait
de l’éloge d’Euler par Condorcet devant l’Académie des Sciences de Paris.
Ces leçons ont été publiées sous le nom de Lettres à une Princesse d’Alle-
magne ; ouvrage précieux par la clarté singulière avec laquelle il y a exposé
les vérités les plus importantes de la mécanique, de l’astronomie physique,
de l’optique et de la théorie des sons, et par des vues ingénieuses, moins
philosophiques, mais plus savantes que celles qui ont fait survivre la plura-
lité des mondes de Fontenelle au système des tourbillons. Le nom d’Euler, si
grand dans les sciences, l’idée imposante que l’on se forme de ses ouvrages,
destinés à développer ce que l’analyse a de plus épineux et de plus abstrait,
donnent à ces lettres si simples, si faciles, un charme singulier. Ceux qui
n’ont pas étudié les mathématiques, étonnés, flattés peut-être de pouvoir
entendre un ouvrage d’Euler, lui savent gré de s’être mis à leur portée, et
58
ces détails élémentaires des sciences acquièrent une sorte de grandeur par
le rapprochement qu’on en fait avec la gloire et le génie de l’homme qui les
a tracés.
Autre extrait d’éloge, par Nicolas Fuss devant l’Académie des Sciences de Saint-Péters-
bourg :
Pour ce qui regarde son contenu, il suffit de remarquer que, comme il est à
la portée d’un plus grand nombre de lecteurs, et même à la portée du beau
sexe, il n’a pas peu contribué à répandre le nom illustre de son auteur, et
à le rendre cher à ceux qui n’ont pu le juger que d’après ses Lettres à une
Princesse d’Allemagne.
. . . « et même à la portée du beau sexe » : l’exploit n’était pas mince ! De fait le succès
populaire fut immense : traduites en russe, en anglais et en allemand, plusieurs fois
rééditées, ces lettres ont servi d’initiation scientifique et philosophique à des milliers
d’amateurs éclairés au siècle des lumières et plus tard. Quant à la jeune princesse, on
ignore le bénéfice qu’elle en tira, outre celui de passer à la postérité grâce à Euler : elle
vécut l’essentiel de sa vie dans un couvent.
Entre le 14 février et le 7 mars 1761, les lettres 102 à 108 traitent de logique. Euler
y détaille avec sa clarté habituelle les fondements du raisonnement rigoureux, sous une
forme remarquablement proche de la logique propositionnelle qui vous a été exposée
dans ce chapitre. Il n’y est pas question d’ensembles, néanmoins les nombreuses figures
par lesquelles il illustre son exposé traduisent bien les notions d’implication, conjonc-
tion, disjonction etc. Les propositions y sont représentées par des cercles, disjoints,
concentriques, ou intersectés, assez proches des diagrammes de Venn que nous utili-
sons encore. En plus des figures, Euler illustre les différentes formes de syllogismes par
de nombreux exemples, avec parfois quelque malice.
Nul homme vertueux n’est pas médisant
Or quelques hommes médisans sont savans
Donc quelques savans ne sont pas vertueux.
3.6 Froid dans le dos

Durant la longue marche depuis Aristote jusqu’à la logique moderne, la formalisa-
tion du raisonnement était considérée comme faisant partie de la philosophie, et non
des mathématiques. Georges Boole (1815–1864) allait révolutionner le thème avec son
algèbre des propositions. Vous connaissez le syllogisme « Tous les hommes sont mortels,
Socrate est un homme donc Socrate est mortel » ? (À propos, il ne se trouve nulle part
dans l’Organon d’Aristote). Voici comment il apparaît chez Boole 6 .
6. G. Boole, The mathematical analysis of logic, London (1847)
59
All Xs are Ys y(1 − x) = 0

All Ys are Zs z(1 − y) = 0
Eliminating y, we have z(1 − x) = 0, All Xs are Zs.

C’etait bien un nouveau calcul algébrique sur des variables binaires, avec ses propres
règles, différentes de celles du calcul ordinaire. Observez que Boole utilise tout de
même les notations de l’algèbre classique ; celles de la logique boolénne (∧, ∨, ¬. . . )
apparaîtront bien plus tard.
Mary Everest était la fille d’un pasteur ami de Boole, et la nièce du cartographe
qui a donné son nom au plus haut sommet du monde (qui en avait déjà un, mais cela a
moins de rapport avec la logique). Elle avait passé son enfance en France, où son père
était devenu un disciple de Hahnemann, le fondateur de l’homéopathie. Qu’est-ce que
l’homéopathie ? Mary nous en dit plus.
The medicine which will produce any symptom in a healthy man, or tem-
porarily aggravate it in one who is already suffering from it, is homeopathic
to that symptom.
[. . . ]
Hahnemann’s great homeopathic law or principle “like should be treated by
like”, is now in some measure admitted by all really scientific practitionners,
however they may choose to deride the word homeopathy.
. . . « Traiter le mal par le mal, admis par tous les praticiens réellement scientifiques » ?
Ayant beaucoup suivi et aidé la jeune fille (de 17 ans sa cadette), Boole finit par
l’épouser. Neuf ans plus tard, à la suite d’un banal refroidissement, il tombe malade.
Pas de quoi s’alarmer, mais tout de même, un bon traitement homéopathique s’impose.
Des années plus tard, leur plus jeune fille (bébé au moment du décès de son père) accuse.
My sister Mary Hinton, who had a friendship with her, and who collected
various anecdotes about the family, told me that, in Aunt Mary Ann’s
[Boole’s sister] view at least, the cause of father’s early death was believed
to have been the Missus’ (Mary Everest Boole) belief in a certain crank
doctor who advocated cold water cures for everything. Someone – I can’t
remember who – is reported to have come in and found Father “shivering
between wet sheets”. Now for myself, I am inclined to believe that this
may have happened. The Everests do seem to have been a family of cranks
and followers of cranks. The Missus’ father apparently adored Mesmer and
Hahnemann and the Missus herself ran theories to death.
L’agonie de Boole « tremblant dans des draps mouillés » dure 17 jours, et il meurt
de pneumonie. Plus de 40 ans après, Mary est toujours une fervente supportrice du
« mal par le mal », même si elle reconnaît que quelques concessions s’imposent parfois.
Dans « The message of psychic sciences to the world », elle consacre un long chapitre
60
à l’homéopathie où elle revient avec insistance sur le traitement par le froid du refroi-
dissement. Outre la définition de l’homéopathie reproduite ci-dessus, voici ce qu’on y
lit.
The treatment for chronic coldness of the feet may consist, if the patient is
strong, in making him walk for a few minutes on rough gravel in a brook ;
if he is delicate and weakly, you should at bed-time first get the feet tho-
roughly warm by some antipathic means, and then give a shock of cold
water followed by rubbing.
[. . . ]
Thus you have a child whose circulation is defective, and who is constantly
chilly. How will you correct this evil state of thing ? Plunge him roughly
into ice-cold water regardless of his screams ? Send him out fasting after his
morning bath to creep along for an hour as best he may, with benumbed
limbs and a more benumbed heart, through snow and wind and early fog ?
keep him half the day in a fireless room insufficiently clad, by way of har-
dening him ? and punish him for temper when he cries in sullen misery ?
That would be homeopathic treatment, certainly, after a fashion ; and a
good deal of such was practised in the early days of homeopathy and the
water-cure ; and even under the eyes of the founders of both systems.
[. . . ]
If the vital energy has been by any chance overtaxed, the patient should
be treated, for a time, not with homeopathic but with antipathic remedies.
Thus, rubbing with snow is sufficient treatment for a frozen limb ; but a man
who is suffering from general exposure to cold, or chilly from over-fatique
and hunger, needs warmth.
Ça fait froid dans le dos, vous ne trouvez pas ?
3.7 Le rêve de Hilbert

Durant l’été 1900 un congrès international de mathématiques se tenait à Paris. Le
8 août, David Hilbert (1862–1943) y donne une conférence mémorable ; selon Charles
Hermite, « on n’entendra plus jamais dans les congrès de conférences pareilles ». Qu’a-
t-il donc raconté ? Un théorème exceptionnel que lui seul pouvait démontrer ? Une
nouvelle théorie ? Pas du tout. Il s’était contenté d’énoncer 23 problèmes, ceux qui
selon lui feraient progresser la recherche en mathématiques durant le siècle qui allait
commencer. Le plus impressionnant est que le siècle en question, qui vient de s’achever,
lui a très largement donné raison !
Dans plusieurs de ces problèmes, et en particulier dans le dixième, Hilbert pose la
question du fondement même du raisonnement mathématique. Il souhaitait rendre ex-
plicite un système axiomatique formel « universel ». En ces temps de scientisme triom-
phant, personne ne doutait que ce soit possible, et que les mathématiques finiraient
bien, après tant de victoires sur la nature, par réussir à s’expliquer elles-mêmes.
61
Hilbert recherchait un système comportant des axiomes et des règles de déduction. Un

axiome est une assertion que l’on déclare vraie a priori : par exemple 0 < 1. Nous avons
vu les règles de déduction de la logique, et le moyen de déclarer vraie ou fausse une
assertion composée, en utilisant les tables de vérité. Hilbert souhaitait un système :
• consistant : aucune assertion ne peut être à la fois vraie et fausse ;
• complet : toute assertion est soit vraie soit fausse ;
• décidable : il existe une procédure finie qui permet de vérifier si une assertion
donnée est vraie ou fausse.
On peut démontrer qu’un système consistant et complet est forcément décidable. Une
procédure de décision consiste à ranger toutes les formules possibles d’abord par ordre
de longueur, puis par ordre lexicographique pour les formules de même longueur. Si
on doit vérifier l’assertion A, on parcourt les formules une par une en vérifiant pour
chacune si elle est valide et si elle entraîne A ou bien ¬A. Ce n’est pas très efficace,
mais cela conduira forcément au résultat !
En 1931 Kurt Gödel (1906–1978) ruine le rêve de Hilbert : il démontre que dans tout
système formel contenant l’arithmétique des entiers, il existe des propriétés telles que
l’on ne peut prouver ni qu’elles sont vraies, ni qu’elles sont fausses : on dit qu’elles
sont indécidables. La démonstration de Gödel est trop difficile pour être exposée ici,
mais elle ressemble dans ses grandes lignes à celle de la proposition 15. Il considère un
système consistant pour l’arithmétique des entiers. Il construit alors une assertion sur
les nombres entiers qui exprime par elle-même qu’elle n’est pas dénombrable : si elle
est vraie, alors elle est fausse, et si elle est fausse, alors elle est vraie. Il en déduit que
le système ne peut pas être complet.
Parmi les exemples d’assertions indécidables, l’axiome du choix est le plus célèbre.
Il s’agit de l’assertion affirmant que si un ensemble E est muni d’une relation d’équi-
valence, alors on peut choisir dans chacune des classes d’équivalence un élément parti-
culier. C’est évident si les classes d’équivalence sont finies ou dénombrables, mais cela
ne l’est pas en général. On peut le supposer vrai, ou bien faux, sans jamais aboutir à
une contradiction.
Loin de sonner le glas de la recherche sur les systèmes formels, le résultat négatif
de Gödel a donné une impulsion décisive à la logique, conduisant en particulier avec
Alan Turing (1912–1954), aux fondements de l’informatique théorique.
3.8 La langue universelle de Peano

L’histoire des mathématiques s’est souvent faite à l’envers du sens où elles vous sont
enseignées. Les dérivées ont été utilisées avant la notion de continuité, les fonctions
continues avant la définition rigoureuse des limites, les limites avant la définition de R,
et cette dernière avant l’axiomatisation des nombres entiers. Il faut dire que, jusqu’à
la fin du xixe siècle, pas grand-monde ne songeait à définir les « évidences ». Parmi
les propagandistes de la nouvelle exigence de rigueur, l’un des plus intransigeants fut
62
Giuseppe Peano (1858–1932), à qui on doit justement la première axiomatique de N,

entre autres.
Son œuvre majeure est le Formulaire de Mathématiques, publié en 5 tomes. « Le plus
grand intérêt est la publication de collections de tous les théorèmes connus actuellement
[. . . ] Une telle collection qui serait longue et difficile en langage ordinaire, est rendue
notablement plus facile en utilisant la notation de la logique mathématique ». Euh,
ça dépend pour qui ! Comme préparation à la lecture du Formulaire, Peano écrit un
mémoire d’une cinquantaine de pages, uniquement dédié à l’énoncé des « Notations de
Logique Mathématique ». Voici ce qu’il dit dans l’introduction.
Leibniz a énoncé, il y a deux siècles, le projet de créer une écriture univer-
selle, dans laquelle toutes les idées composées fussent exprimées au moyen
de signes conventionnels des idées simples, selon des règles fixes.
À la solution de ce problème a contribué d’abord le développement de l’écri-
ture algébrique, qui s’est beaucoup perfectionnée après Leibniz. Au moyen
des signes +, −, =, >, etc., des parenthèses et des lettres de l’alphabet, elle
permet d’écrire en symboles quelques propositions. Mais ce qui a le plus
contribué à la solution du problème, c’est la nouvelle et importante science
qu’on appelle Logique Mathématique, et qui étudie les propriétés formelles
des opérations et des relations de logique.
[. . . ]
Par la combinaison des signes d’Algèbre et de Logique, on peut exprimer en
symboles des opérations toujours plus longues et plus complètes, et le résul-
tat auquel on est arrivé dans ces dernières années, est qu’on peut représenter
toutes les opérations de logique avec peu de signes, ayant une signification
précise, et assujettis à des règles bien déterminées. En conséquence, en in-
troduisant des signes pour indiquer les idées de l’Algèbre, ou bien de la
Géométrie, on peut énoncer complètement en symboles les propositions de
ces sciences.
Le problème avec Peano est qu’il mettait ses théories en application. Il n’avait pas
son pareil pour détecter des fautes logiques, ou pour démolir par un contre-exemple
l’énoncé incomplet d’un collègue. Et il ne mâchait pas ses mots : « Nous pourrions
continuer sans fin à énumérer les absurdités que l’auteur a empilées. Mais ces erreurs,
le manque de précision et de rigueur tout au long du livre, lui ôtent toute valeur ».
Il était persuadé de la justesse de son approche pédagogique : « Chaque professeur
pourra utiliser le Formulaire comme un livre de cours, car il contient tous les théo-
rèmes et toutes les méthodes. Son enseignement se réduira à montrer comment lire les
formules, et à indiquer aux étudiants les théorèmes qu’il souhaite expliquer dans son
cours ». Mais ce n’était pas tout. Pour lui, le langage mathématique était indissociable
du langage naturel, et il souhaitaitait comme tant d’autres avant lui (dont Descartes
et Leibniz) une Langue Universelle. Il avait défini une version simplifiée du latin, le
« Latine Sin Flexione ». Non content d’être des litanies de formules, ses cours étaient
63
en plus écrits dans cette langue, qu’il utilisait aussi pour son enseignement oral. Ajou-
tez à cela qu’il se moquait éperdument de suivre un programme ! Le mathématicien
italien le plus célèbre de son temps était devenu vers la fin de sa carrière un réel pro-
blème pour son université. On décida de lui retirer tous les cours classiques, et on créa
spécialement un cours de « Compléments de Mathématiques » où il pourrait enseigner
ce qu’il voudrait. Il en fut si content qu’il accepta pour une fois d’enseigner en Italien
plutôt qu’en « Latine Sin Flexione ».
Mais peut-être auriez vous aimé l’avoir comme professeur : voici ce qu’il écrivait
dans un journal de Turin en 1912 sous le titre « Contre les examens ».
C’est un crime contre l’humanité. On ne doit pas torturer les étudiants avec
des examens destinés à établir si oui ou non ils connaissent des notions qui
sont inconnues de la plus grande partie du public éduqué.
3.9 Les cardinaux infinis

Combien y a-t-il d’entiers naturels, de rationnels, de réels ? Une infinité bien sûr.
Mais l’infinité des réels est plus grande que l’infinité des rationnels. Pour donner un
sens à cette affirmation, il faut d’abord définir ce qu’est un ensemble dénombrable.
Définition 12. Un ensemble infini est dit dénombrable s’il existe une application in-
jective de cet ensemble vers N.
Il peut paraître paradoxal que Q soit dénombrable. C’est pourtant le cas, car il
existe une application injective de Q vers Z × N (à un rationnel p/q on associe le
couple (p, q)), et une application bijective de Z × N dans N : on compte les éléments
de Z × N, en commençant par (0, 0), puis (1, 0), (0, 1), (−1, 0), puis (2, 0), (1, 1), (0, 2),
(−1, 1), (−2, 0), . . . Plus généralement, on démontre que le produit et la réunion de
deux ensembles dénombrables sont eux-mêmes dénombrables.
Théorème 4. L’ensemble des réels n’est pas dénombrable.
Démonstration : Nous allons démontrer par l’absurde que l’intervalle [0, 1] n’est pas
dénombrable. Supposons que l’on puisse compter les éléments de [0, 1], donc les mettre
en bijection avec N. Nous aurions [0, 1] = {xn , n ∈ N}. À l’élément xn , nous associons
un développement décimal :
xn = 0.an,1 an,2 an,3 . . . ,
où les an,k sont des entiers compris entre 0 et 9. Pour tout n, fixons bn ∈ {1, . . . , 8}, tel
que bn 6= an,n . Considérons le réel x dont le développement décimal est
x = 0.b1 b2 b3 . . .
Ce réel est différent de xn pour tout n, par construction. Il n’a donc pas pu être compté.
64
(Ce principe de démonstration s’appelle le procédé diagonal de Cantor).

Il y a plus de réels que de rationnels, et donc plus d’irrationnels que de rationnels.
Parmi les irrationnels, on distingue
√ ceux qui sont solutions d’une équation polynomiale
à coefficients entiers, comme 2 : on les appelle les nombres algébriques. Ils semblent
former une grosse masse. Pourtant il n’y a pas plus de polynômes à coefficients en-
tiers que d’entiers : l’ensemble des nombres algébriques est lui aussi dénombrable. Les
nombres qui ne sont pas algébriques (on les appelle « transcendants ») forment l’essen-
tiel des réels. Pourtant il est extrêmement difficile de démontrer qu’un réel particulier
est transcendant. C’est une des victoires du xixe siècle que de l’avoir fait pour π et e.
Existe-t-il des ensembles « intermédiaires » entre N et R, qui seraient non dénom-
brables, sans pourtant être en bijection avec R ? C’est le premier des 23 problèmes posés
par Hilbert en 1900. On a longtemps essayé d’en construire, ou de démontrer qu’il n’en
existe pas, avant de s’apercevoir finalement que c’est une assertion indécidable : on
peut la supposer vraie, ou bien fausse, sans jamais aboutir à une contradiction. Elle
s’appelle « l’hypothèse du continu ».
3.10 Ensembles quotients

Bertrand Russel (1872–1970) a dit « It must have required many ages to discover
that a brace of pheasants and a couple of days were both instances of the number two ».
Nous avons vu cela sous une forme moins imagée : le cardinal d’un ensemble peut être
défini comme la classe d’équivalence des ensembles en bijection avec lui.
À la base des mathématiques, comme de toute activité intellectuelle se trouvent les
concepts. Concept en mathématiques se dit classe d’équivalence : cela désigne une boîte
fictive dans laquelle nous pouvons ranger toutes sortes d’objets, pourvu qu’ils aient
une propriété commune. Une fois la boîte remplie, et dûment pourvue d’une étiquette
nommant la propriété qu’elle représente, on peut oublier son contenu et ne plus garder
que l’étiquette qui pourra d’ailleurs devenir un nouvel objet. Cette faculté d’abstraire
des propriétés communes est essentiellement humaine. C’est l’arme qui nous a permis de
prendre une telle avance dans la lutte darwinienne pour la survie de l’espèce. Parce que
l’homme préhistorique voyait un rapport entre un bras qui frappe et une branche qui
tombe, il a été capable d’inventer la massue. C’est aussi la base du langage. Tout mot est
une classe d’équivalence : « bleu » ou « table » ne sont que des boîtes pouvant contenir
des objets différents. Le miracle est que ces classes d’équivalence soient transmissibles :
que deux humains différents puissent être globalement d’accord sur les contenus de
leurs boîtes.
En mathématiques, les relations d’équivalence servent à fabriquer toutes sortes d’en-
sembles. Nous n’en donnerons qu’un exemple, la construction de l’ensemble Q des
rationnels à partir de l’ensemble des entiers.
Un rationnel est le rapport de deux nombres entiers, l’un entier relatif, l’autre entier
65
naturel non nul. ( )

p
Q= , (p, q) ∈ Z × N∗
q
Deux couples d’entiers peuvent représenter le même rationnel.
p p0
∀p ∈ Z , ∀q ∈ N∗ = 0 ⇐⇒ pq 0 = qp0
q q
Oublions maintenant les rationnels et supposons que nous ne connaissions que l’en-
semble E = Z × N∗ . Considérons la relation R définie sur E de la façon suivante.
(p, q)R(p0 , q 0 ) ⇐⇒ pq 0 = qp0 .
Il est facile de vérifier qu’elle est réflexive, symétrique et transitive : c’est une rela-
tion d’équivalence. L’ensemble quotient E/R est précisément l’ensemble des rationnels.
Mais pour que cette définition soit utilisable, il faut la compléter par les opérations dont
nous avons besoin : addition, multiplication, ordre total.
1. addition : considérons l’application de E × E vers E qui à deux couples (p, q)
et (r, s) associe le couple (ps + rq, qs). C’est bien ce que nous attendons de
l’addition des rationnels : p/q + r/s = (ps + rq)/qs. L’application que nous
avons définie « passe au quotient » : si (p0 , q 0 )R(p, q) et (r0 , s0 )R(r, s), alors (p0 s0 +
r0 q 0 , q 0 s0 )R(ps+rq, qs) (vérifiez. . . !). Si on la transporte sur l’ensemble quotient,
cette application définit l’addition des rationnels.
2. multiplication : considérons l’application de E × E vers E qui à deux couples
(p, q) et (r, s) associe le couple (pr, qs). C’est ce que nous attendons de la mul-
tiplication des rationnels : (p/q)(r/s) = (pr)/(qs). Comme ci-dessus, si on la
transporte sur l’ensemble quotient, l’application définit la multiplication des
rationnels.
3. ordre : considérons la relation O sur E définie par :
(p, q)O(r, s) ⇐⇒ (ps 6 rq)
Même technique : une fois transportée sur l’ensemble quotient, la relation O

devient la relation d’ordre total que nous attendons sur Q.
Ce que nous venons de décrire pour l’ensemble des rationnels est un cas particulier
d’une procédure très générale, qui consiste à rajouter ce qui manque à un ensemble en
définissant une relation d’équivalence sur un ensemble plus gros. Ainsi on peut définir
Z à partir de N, puis Q à partir de N et Z, puis R à partir de Q puis C à partir de R.
Cela sert aussi pour des espaces de fonctions, et encore bien d’autres objets que vous
rencontrerez plus tard.
66
3.11 Démonstrations non constructives

L’assertion ∃x ∈ ∅ est fausse (par définition l’ensemble vide ne contient aucun élé-
ment). Toute implication qui commence par ∃x ∈ ∅ est forcément vraie, par définition
de l’implication. Il est donc indispensable, avant de se lancer dans la démonstration
d’une implication, de vérifier que les hypothèses ne sont pas vides, c’est-à-dire qu’elles
sont satisfaites par au moins un objet. Sans cela, on pourrait en déduire tout et n’im-
porte quoi. Par exemple l’assertion suivante est mathématiquement correcte, même si
nous ne vous conseillons pas de l’apprendre par cœur :
Soit n un entier tel que ∀m ∈ N, n > m. Alors 1 = 0.
L’hypothèse est vide : aucun entier n’est supérieur à tous les autres.
Une grande partie de l’activité mathématique consiste à démontrer que des hypo-
thèses ne sont pas vides, c’est-à-dire qu’il existe au moins un objet qui les vérifie. On
appelle cela un « théorème d’existence ». Il est très possible de démontrer l’existence
d’un objet sans être capable de l’exhiber, ni même de donner un algorithme permettant
de le calculer. Voici un exemple célèbre.
Proposition 14. Il existe deux nombres irrationnels x et y tels que xy soit rationnel.
√
√ √ 2
Démonstration : Nous avons vu que le nombre 2 est irrationnel. Essayons 2 : il
est soit rationnel, soit irrationnel.
√ √2 √
• Si 2 est rationnel, la proposition est démontrée, puisque x = y = 2
convient.
√ √2 √ √2 √
• Si 2 est irrationnel, posons x = 2 , et y = 2. Alors
√ √ √2 √
y 2 2
x = 2 = 2 =2∈Q,
et la proposition est également démontrée.

√
√ 2
Rien dans cette démonstration ne permet de savoir si 2 est ou non rationnel,
et donc l’existence de x et y est démontrée sans qu’on puisse exhiber un seul exemple.
On dit que la démonstration est « non constructive ».
Certains mathématiciens, à la suite de Luitzen Brouwer (1881–1966), affirment
qu’il n’est pas acceptable de démontrer un théorème d’existence sans être capable de
construire au moins un objet vérifiant la propriété. Ils considèrent que cela revient à
peu près à affirmer que les licornes existent parce qu’on trouve la définition du mot
« licorne » dans les dictionnaires. À vous de juger. . .
67
3.12 L’ensemble de tous les ensembles

. . . n’existe pas ! Un ensemble E n’est défini que si pour tout objet x l’énoncé
(x ∈ E) ∧ ¬(x ∈ E) est faux.
Proposition 15. L’ensemble de tous les ensembles n’existe pas.
Démonstration : C’est un exemple de démonstration par l’absurde. Supposons que

l’ensemble de tous les ensembles existe, et notons-le E. Notons A l’ensemble
A = {x ∈ E ; x∈
/ x} .
Comme E contient tous les ensembles, A appartient à E. Est-ce que A appartient à

A?
• si A ∈ A alors par définition de A, A ∈/ A,
• si A ∈
/ A alors par définition de A, A ∈ A.
L’assertion A ∈ A ne peut pas être vraie et fausse en même temps, c’est donc que
l’hypothèse de départ (E existe) était fausse.
Des versions plus prosaïques de ce paradoxe sont connues depuis l’antiquité. Par
exemple :
Epiménide le Crétois a dit : tous les Crétois sont des menteurs
ou bien
Le barbier rase tous ceux qui ne se rasent pas eux-mêmes.
D’autres notions, apparemment claires, ne sont pas définies parce qu’elles condui-
sent à une contradiction. Par exemple :
Le plus petit nombre qu’on ne puisse pas définir en moins de vingt mots
(la phrase ci-dessus comporte quinze mots).
68
Structures algébriques
Didier Piau et Bernard Ycart
L’expérience indique que l’étude abstraite des structures algébriques peut se révéler
fascinante ou épuisante selon la personnalité de chacun. Un inconvénient, peut-être
inévitable, de cette étude est qu’il est difficile de mettre immédiatement en relief l’utilité
des résultats démontrés ; il faut passer un certain temps dans la théorie, puis de nouveau
un certain temps dans des chapitres plus concrets où les résultats accumulés seront
recyclés.
Tentons cependant de rassurer le lecteur grâce à la constatation suivante (à moins
que cette constatation ne l’effraie encore plus) : une bonne part des résultats énoncés sur
les groupes finis (concept d’ordre, théorème de Lagrange, etc.) aura l’occasion d’être
mise en application dès le chapitre d’arithmétique. En effet, une première utilité de
la théorie des groupes est de formaliser et systématiser les calculs usuels qu’on sait
pratiquer sur les ensembles de nombres.
L’autre point de vue sur lequel on peut insister est celui des groupes formés de
bijections, mais malheureusement on aura peu l’occasion de les voir vraiment appliqués
dans la suite de ce cours de première année. En revanche, on peut affirmer que des
connaissances sur les groupes de permutations (groupes de bijections des ensembles
finis) sont bien utiles de ci de là, en informatique par exemple. Et de toutes façons
l’investissement sera rentabilisé dès que le lecteur apprendra plus de géométrie, ce qui
reste un cadre idéal d’usage des groupes de transformations.
Table des matières

1 Cours 2
1.1 Relations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Lois de composition et morphismes . . . . . . . . . . . . . . . . . . . . 7
1.3 Groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Exemples fondamentaux de groupes finis . . . . . . . . . . . . . . . . . 12
1.5 Sous-groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.6 Noyaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7 Puissances et ordre d’un élément d’un groupe . . . . . . . . . . . . . . 22
1.8 Anneaux et corps . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2 Entraînement 27
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
8 novembre 2011
Maths en Ligne Structures algébriques UJF Grenoble
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Compléments 46
3.1 Le programme d’Erlangen . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.2 Hamilton et les quaternions . . . . . . . . . . . . . . . . . . . . . . . . 48
3.3 Les idéaux d’Emmy Noether . . . . . . . . . . . . . . . . . . . . . . . . 50
1
1 Cours
1.1 Relations
Vous avez déjà rencontré cette notion dans votre cursus ; rappelons qu’intuitive-
ment, une relation sur un ensemble E est la description de liens entre certains éléments
de E. Donnons des exemples avant même la définition.
Exemple 1. 1) La relation « est inférieur ou égal à » sur l’ensemble R des réels : pour
deux réels x et y, on peut avoir x 6 y ou non.
2) La relation « est inclus dans » sur l’ensemble des parties d’un ensemble : pour deux
parties A et B, on peut avoir A ⊂ B ou B ⊂ A ou aucun des deux.
3) La relation « a le même cardinal que » sur l’ensemble des parties d’un ensemble fini.
4) Plus exotique : la relation « coïncide en au moins un point avec » pour des fonctions
définies sur un même ensemble.
Définition 1. Le graphe d’une relation R sur un ensemble E est l’ensemble des couples
(a, b) de E × E tels que aRb.
Sermon
Attention à bien lire cette définition, qui, comme toutes ses consœurs de la suite de
ce cours, peut être mal retenue par de jeunes âmes peu scrupuleuses mathématique-
ment parlant. Il est facile de retenir que le graphe de R a un rapport avec aRb. Mais
soulignons que le graphe est un ensemble.
Profitons en pour signaler dès l’abord que les divers objets qui sont définis dans
ce cours entrent dans un petit nombre de catégories : souvent des ensembles, assez
souvent des applications, souvent des n-uplets (qui ne sont rien d’autres que des ap-
plications particulières, sauriez-vous préciser pourquoi ?), souvent aussi des nombres
(entiers, réels ou autres), plus rarement des relations, etc. Il n’est pas difficile de savoir
dans quelle catégorie ranger les graphes : ce ne sont manifestement pas des triplets, ni
des nombres complexes ! Le plus important est de ne pas oublier de les ranger quelque
part. Savoir à quelle catégorie appartient un objet permet d’éviter les bourdes les plus
monumentales : ainsi, le symbole ∩ aura un sens entre deux ensembles, pas entre deux
réels, et réciproquement pour le symbole +. On profitera du fait que la première phrase
de cette section contient les mots « élément » et « ensemble » pour vérifier qu’on ne
confond pas les deux.
C’était la fin de notre sermon d’aujourd’hui.
Voici maintenant quatre définitions rébarbatives, mais incontournables.
Définition 2. Soit E un ensemble et R une relation sur E.

1) La relation R est réflexive lorsque pour tout élément a de E, aRa.
2) La relation R est symétrique lorsque pour tous éléments a et b de E, si aRb,
alors bRa.
2
3) La relation R est transitive lorsque pour tous éléments a, b et c de E, si aRb

et si bRc, alors aRc.
4) La relation R est anti-symétrique lorsque pour tous éléments a et b de E, si
aRb et si bRa, alors a = b.
Quelques commentaires sur la dernière condition, qui est sans doute la plus difficile
à bien mémoriser des quatre : c’est, comme son nom l’indique, en gros le contraire de
la propriété de symétrie. La symétrie exige que quand deux éléments sont liés dans un
sens, ils le sont aussi dans l’autre. L’anti-symétrie, c’est approximativement demander
que si deux éléments sont liés dans un sens, ils ne le sont pas dans l’autre. Mais cette
condition empêcherait un élément d’être lié à lui-même, ce qui ne serait pas désespérant
en soi mais ne serait pas conforme à l’usage. De fait, l’usage s’est fait de compliquer la
définition afin de garder la permission pour un élément d’être lié à lui-même.
On comprendra peut-être un peu mieux la définition en écrivant la contraposée de
l’implication qu’elle contient.
Autre formulation de la définition de l’anti-symétrie Une relation R sur un
ensemble E est anti-symétrique lorsque pour tous éléments a et b distincts de E, on ne
peut avoir simultanément aRb et bRa.
Comme nous sommes encore débutants, faisons l’effort d’expliciter une autre façon
de présenter la même notion.
Autre formulation de la définition de l’anti-symétrie Une relation R sur un
ensemble E est anti-symétrique lorsque pour tous éléments a et b distincts de E, aRb
est faux ou bRa est faux.
Bien évidemment, ce genre de liste de formulations équivalentes n’est surtout pas
à « savoir par cœur ». Ce qui est par contre indispensable, c’est de se familariser avec
les petites manipulations qui permettent de passer de l’une à l’autre, selon les besoins.
En pratique, les relations qui pourront nous intéresser dans ce cours ne seront
jamais bien compliquées ; le vocabulaire que nous avons dû ingurgiter depuis le début
de ce chapitre n’a d’utilité que pour savoir reconnaître deux types très particuliers de
relations : les relations d’ordre, auxquelles cette section est consacrée, puis, dans la
section prochaine, les relations d’équivalence.
Définition 3. Une relation est une relation d’ordre lorsqu’elle est simultanément ré-
flexive, transitive et anti-symétrique.
Considérons par exemple la relation « divise » sur l’ensemble E = {1, 2, 3, 4, 5, 6}.

C’est une relation d’ordre ; son graphe est visualisé par des flèches sur la figure 1.
Intuitivement, une relation d’ordre est une relation qui peut raisonnablement être
appelée « est supérieur ou égal à » ou, bien sûr, « est inférieur ou égal à ».
Exemple 2. La relation « 6 » sur E = R est une relation d’ordre. Pour tout ensemble
A fixé, la relation « ⊂ » sur E = P(A) est une relation d’ordre. La seconde est sans
3

2

3

6

1

5 4

Figure 1 – Représentation graphique de la relation « divise » sur {1, 2, 3, 4, 5, 6}.
doute plus compliquée à maîtriser que la première dans la mesure où deux parties de A
ne sont pas forcément comparables l’une à l’autre.
Le morceau est plus sérieux pour les relations d’équivalence que pour les relations
d’ordre, car on ne va pas se contenter de donner une définition, mais on va aussi voir le
lien avec un autre concept. Pour expliquer intuitivement ce qui va suivre, une relation
d’équivalence est une relation qui peut raisonnablement s’appeler « est de la même
catégorie que » et une partition est une répartition en catégories.
Définition 4. Une relation est une relation d’équivalence lorsqu’elle est simultanément
réflexive, symétrique et transitive.
Exemple 3. L’égalité sur n’importe quel ensemble E fixé. La relation « a même parité
que » sur l’ensemble N des entiers naturels. La relation « est confondue avec ou parallèle
à » sur l’ensemble des droites d’un plan affine.
Avalons encore trois définitions de plus en plus indigestes mais ce n’est pas gratuit,
les concepts serviront plus loin, notamment en arithmétique.
Définition 5. Soit R une relation d’équivalence sur un ensemble E, et soit a un

élément de E. On appelle classe d’équivalence de a modulo R l’ensemble
{x ∈ E | aRx}.
Avec des mots, la classe d’équivalence de a est l’ensemble formé des éléments de la
même catégorie que a.
Notation 1. On note clR (a) la classe d’équivalence d’un élément a de E pour la

relation d’équivalence R.
4
On abrège souvent clR (a) en cl(a). Une autre notation pour la classe d’équivalence
de a est ȧ mais nous l’utiliserons rarement dans ce cours. Par contre, nous désignerons
souvent les relations d’équivalence par le signe ∼.
Sans commentaires, car il y en aura plus loin, un objet plus étrange :
Définition 6. Soit ∼ une relation d’équivalence sur un ensemble E. On appelle
ensemble-quotient de E par la relation ∼ l’ensemble :
{ cl(a) | a ∈ E }.
Attention tout de même ! Comme cl(a) est une partie (et non un élément) de E,
l’ensemble-quotient est un ensemble de parties de E. Ce n’est pas une partie de E mais
une partie de P(E). Ce n’est pas si compliqué, mais il ne faut pas s’y perdre.
Notation 2. L’ensemble-quotient de E par ∼ est noté E/ ∼.
On remarquera qu’en général, chaque élément c de l’ensemble quotient E/ ∼ peut
s’écrire comme c = cl(a) pour de nombreux éléments a différents de E : très précisément,
c s’écrit c = cl(a) pour un élément a de E tel que a ∈ c, et aussi c = cl(b) pour tous
les éléments b de E tels que a ∼ b.
Définition 7. Une partition d’un ensemble E est un ensemble Q de parties de E
vérifiant les trois propriétés suivantes :
(i) L’ensemble vide n’est pas un élément de Q.
(ii) Deux éléments distincts de Q sont disjoints.
(iii) Tout élément de E appartient à un élément de Q.
C’est dur à avaler parce qu’on rentre inévitablement dans le monde des ensembles
dont les éléments sont eux-mêmes des ensembles. Les éléments de Q sont des parties
de E et doivent donc être pensés comme des groupes d’éléments de E vérifiant une
condition commune. Et Q ⊂ P(E) : une partition de E est une partie de l’ensemble
des parties de E (ouf !).
Exemple 4. En notant I ⊂ N l’ensemble des entiers impairs et P ⊂ N l’ensemble des
entiers pairs, {I, P } est une partition de N.
Tentons maintenant de commenter les conditions de la définition 7. La condition
(i) est sans grand intérêt et juste là pour que les énoncés marchent bien. La condition
(ii) nous assure qu’on n’a inscrit aucun élément de E dans deux catégories à la fois.
La condition (iii) signifie qu’on n’a oublié d’inscrire personne : tout élément de E est
dans un groupe.
On remarquera qu’on peut regrouper les deux conditions significatives, ce qui donne
l’énoncé suivant.
Autre formulation de la définition d’une partition Une partition d’un ensemble
E est un ensemble Q de parties de E vérifiant les deux propriétés (i) et (iv) ci-dessous :
5
(i) L’ensemble vide n’est pas un élément de Q.

(iv) Tout élément de E appartient à un et un seul élément de Q.
Bien évidemment là encore il n’est pas question d’apprendre par cœur ce genre de
reformulation. Il faut se convaincre, et ici ce n’est peut-être pas facile, qu’elle est bien
équivalente à la précédente.
Et voici maintenant la synthèse finale, qui expliquera ce qu’est un ensemble-quotient
à ceux qui ont compris ce qu’est une partition, et expliquera ce qu’est une partition à
ceux qui ont compris ce qu’est un ensemble-quotient (figure 2).

Figure 2 – Représentation graphique d’une relation d’équivalence. Partition en classes

d’équivalence.
Proposition 1. Soit ∼ une relation d’équivalence sur un ensemble E. L’ensemble-

quotient E/ ∼ est une partition de E.
Complément Toute partition de A peut s’obtenir ainsi comme quotient par une rela-
tion d’équivalence de E et cette relation d’équivalence est unique.
La preuve du complément est laissée au lecteur.
Démonstration : Vérifions successivement les trois propriétés définissant une partition.
Vérification de (i) : Soit A un élément de E/ ∼. Par définition de E/ ∼, il existe un
élément a de E tel que A = cl(a). Comme ∼ est réflexive, a ∼ a, donc a appartient à
cl(a) = A. Ainsi A n’est pas réduit à l’ensemble vide.
Vérification de (ii) : Soient A et B deux éléments de E/ ∼. On peut trouver des
éléments a et b de E tels que A = cl(a) et B = cl(b). On doit montrer que si A et B
sont distincts, ils sont alors disjoints, et on va procéder par contraposition, c’est-à-dire
en montrant que si A et B ne sont pas disjoints, ils sont égaux.
Supposons donc A et B non disjoints. L’objectif est de prouver que A = B, on va
montrer successivement les inclusions A ⊂ B et B ⊂ A.
Par l’hypothèse qu’on vient de faire, on peut prendre un élément c de E qui appar-
tient simultanément à A et à B.
6
Première inclusion : Montrons tout d’abord que A ⊂ B. Pour ce faire, prenons un

x ∈ A quelconque et prouvons que x ∈ B.
Comme x ∈ A = cl(a), par définition d’une classe d’équivalence, on obtient a ∼ x.
Comme c ∈ A = cl(a), on obtient de même a ∼ c, puis, grâce à la symétrie de ∼, on
obtient c ∼ a. Comme c ∈ B = cl(b), on obtient enfin b ∼ c. En mettant bout à bout
les trois informations ainsi obtenues (b ∼ c, c ∼ a et a ∼ x) et en jouant deux fois sur
la transitivité de ∼, on obtient alors que b ∼ x, c’est-à-dire que x ∈ B.
Ceci prouve bien que A ⊂ B.
Deuxième inclusion : L’astuce est ici classique, elle consiste à remarquer que nos
hypothèses (à savoir que A et B sont des classes d’équivalence, et qu’elles ne sont pas
disjointes) sont symétriques en A et B. Dès lors, en échangeant A et B dans le morceau
précédent de la preuve, on obtient bien l’inclusion B ⊂ A.
Par double inclusion, on a donc A = B.
Finalement, on a montré que si A ∩ B 6= ∅, alors A = B. La propriété (ii) est
prouvée. Ouf, c’était le plus gros morceau !
Vérification de (iii) : Soit a un élément de E. Comme ∼ est réflexive, a appartient
à cl(a), et de ce fait on a bien trouvé un élément de E/ ∼ dont a est lui-même élément.
C’est fini !
1.2 Lois de composition et morphismes

Définition 8. On appelle loi de composition sur un ensemble E une application de
E × E vers E.
En fait, bien que cette définition soit générale, on n’aurait pas l’idée d’appeler « loi
de composition » n’importe quelle application de E × E vers E ; le vocable n’est uti-
lisé que quand il est naturel de noter l’application par un symbole opératoire. Des
exemples typiques de lois de composition sont l’addition + de R2 vers R, qui associe
x + y à (x, y) ; ou bien la loi de composition ◦ sur l’ensemble E E des applications
de E vers E, qui associe l’application f ◦ g au couple d’applications (f, g). Pour des
lois de composition abstraites, le symbole opératoire ∗ a été à la mode et nous l’utili-
serons occasionnellement, surtout au début, mais nous nous contenterons rapidement
de la notation multiplicative a · b, ou même simplement ab, pour l’élément obtenu en
appliquant la loi de composition à (a, b).
Voici un peu de vocabulaire au sujet des lois de composition.
Définition 9. Soit ∗ une loi de composition sur un ensemble E.
1. On dit que ∗ est commutative lorsque pour tous éléments a et b de E,
a ∗ b = b ∗ a.
2. On dit que ∗ est associative lorsque pour tous éléments a, b et c de E,
(a ∗ b) ∗ c = a ∗ (b ∗ c).
7
3. On dit qu’un élément e de E est élément neutre pour ∗ lorsque pour tout élément
a de E,
a ∗ e = e ∗ a = a.
La cohérence de ce qui suit nécessite d’énoncer tout de suite un résultat simplissime.
Proposition 2. Une loi de composition possède au plus un élément neutre.
Démonstration : Soit e1 et e2 deux éléments neutres pour une loi de composition ∗.

Comme e2 est neutre, e1 ∗ e2 = e1 et comme e1 est neutre, e1 ∗ e2 = e2 . Donc e1 = e2 .

On parlera donc de l’élément neutre avec l’article défini, lorsqu’il existe un élément
neutre.
Définition 10. Soit ∗ une loi de composition sur un ensemble E admettant un élément
neutre noté e et soit a un élément de E. On dit qu’un élément b de E est symétrique
(ou inverse) de a lorsque
a ∗ b = b ∗ a = e.
Là encore, glissons sans tarder une évidence.
Proposition 3. Soit ∗ une loi de composition sur un ensemble E, associative et pos-

sédant un élément neutre. Chaque élément possède au plus un symétrique.
Démonstration : Soit e le neutre de ∗, soit a un élément de E et soient b1 et b2

deux symétriques de a. Alors d’une part (b1 ∗ a) ∗ b2 = e ∗ b2 = b2 et d’autre part
b1 ∗(a∗b2 ) = b1 ∗e = b1 . Par associativité de la loi de composition, (b1 ∗a)∗b2 = b1 ∗(a∗b2 ),
d’où b1 = b2 .
Les lois de composition intéressantes étant en pratique associatives, on pourra donc
faire plein usage de la notation suivante.
Notation 3. Le symétrique d’un élément a est noté a−1 .
Maintenant que nous savons manipuler une loi de composition sur un seul ensemble,
apprenons à évoluer d’un ensemble muni d’une loi de composition vers un autre.
Définition 11. Soit E un ensemble muni d’une loi de composition ∗ et F un en-

semble muni d’une loi de composition ·. On dit qu’une application f : E → F est un
morphisme lorsque pour tous éléments a et b de E, on a l’identité :
f (a ∗ b) = f (a) · f (b).
Définition 12. Un morphisme bijectif est appelé un isomorphisme.
8
Il semble plus facile d’expliquer la notion d’isomorphisme que celle de morphisme

en général ; deux lois de composition sur deux ensembles fourniront des structures
isomorphes lorsque ces deux lois de composition agissent de la même façon, seuls les
noms des éléments changeant. La phrase précédente n’étant peut-être pas si claire que
cela, donnons plutôt des exemples, c’est toujours bien les exemples.
Exemple 5. Considérons tout d’abord la bijection σ de l’ensemble E = {0, 1, 2, 3}

définie par
σ(0) = 1, σ(1) = 2, σ(2) = 3, σ(3) = 0.
Avec à peine un peu de bon sens (tout mathématicien pense très vite à σ comme
« faisant tourner » les quatre éléments de E), on voit sans guère de calculs que σ ◦ σ
est la bijection τ de E définie par
τ (0) = 2, τ (1) = 3, τ (2) = 0, τ (3) = 1,
puis que σ ◦ σ ◦ σ est la bijection % de E définie par
%(0) = 3, %(1) = 0, %(2) = 1, %(3) = 2,
et enfin que σ ◦ σ ◦ σ ◦ σ est tout simplement l’identité de E, que l’on note désormais e.
Pour abréger les calculs qui suivent, introduisons une notation.
Notation 4. Pour tout élément a d’un ensemble E muni d’une loi de composition ∗
et pour tout entier n > 1, notons a∗n la composition de a avec lui-même n fois. Ainsi,
a∗1 = a puis, pour tout n > 1, a∗n+1 = a∗n ∗ a. Si la loi de composition ∗ est munie
d’un neutre e, on notera aussi a∗0 = e. Enfin, on abrège souvent a∗n en an .
En utilisant cette notation, on peut très facilement calculer tous les produits deux à
deux des bijections introduites ici ; par exemple %◦τ = σ 3 ◦σ 2 = σ 5 = σ 4 ◦σ = e◦σ = σ.
On considère alors l’ensemble S = {e, σ, τ, %} et on voit que ◦ est une loi de compo-
sition sur ce sous-ensemble de E E , qui sera agréablement décrite par le tableau suivant,
que l’on appelle une table de composition.
◦ e σ τ %
e e σ τ %
σ σ τ % e
τ τ % e σ
% % e σ τ
Considérons à présent l’ensemble des nombres complexes dont la puissance qua-

trième vaut 1, c’est-à-dire l’ensemble F = {1, i, −1, −i}. Il est très facile de constater
9
que la multiplication des nombres complexes définit une loi de composition sur F , dont
la table est donnée ci-dessous.
◦ 1 i −1 −i
1 1 i −1 −i
i i −1 −i 1
−1 −1 −i 1 i
−i −i 1 i −1
Visuellement, on retrouve la même table, seuls les noms des éléments ont changé.
C’est signe qu’il y a un isomorphisme camouflé. On le détectera facilement ; c’est bien
sûr l’application g de E vers F définie par :
g(e) = 1 g(σ) = i g(τ ) = −1 g(%) = −i.
Exemple 6. Soit R l’ensemble des rotations de centre (0, 0) dans le plan, et soit U
le cercle-unité de C, c’est-à-dire l’ensemble des nombres complexes de module 1. Les
lois de composition respectivement envisagées sur R et sur U sont la composition des
applications et la multiplication. On définit une application f : R → U en envoyant la
rotation d’angle θ sur le nombre eiθ .
Il faut tout d’abord se soucier de vérifier que cette définition n’est pas ambiguë, car
elle n’est pas loin de l’être ! Une rotation peut en effet être caractérisée par plusieurs
angles (tourner d’un quart de tour dans le sens trigonométrique, c’est aussi tourner de
trois quarts de tour dans le sens des aiguilles d’une montre), mais deux angles distincts
θ1 et θ2 correspondant à la même bijection diffèrent d’un multiple entier de 2π ; il existe
donc un entier k ∈ Z tel que θ2 = θ1 + 2kπ. Les valeurs eiθ1 et
eiθ2 = eiθ1 +2kiπ = eiθ1 (e2iπ )k = eiθ1
sont donc égales, et l’application f est bien définie.

Une fois cette mise au point effectuée, vérifier que f est un morphisme est sans
problème : si %1 est la rotation d’angle θ1 et %2 la rotation d’angle θ2 , la composée
%1 ◦ %2 est la rotation % d’angle θ1 + θ2 , et on a donc :
f (%1 ◦ %2 ) = f (%) = ei(θ1 +θ2 ) = eiθ1 eiθ2 = f (%1 )f (%2 ).
Montrer que f est bijective n’est pas difficile ; on en conclut que f est un isomorphisme,
en d’autres termes que l’étude des nombres complexes de module 1 nous instruira sur
le fonctionnement des rotations.
Exemple 7. Voici enfin un morphisme qui n’est pas un isomorphisme et qui est pour-
tant une simple variante du précédent. Considérons l’application F de R (muni de
10
l’addition) vers U (le même qu’à l’exemple précédent, muni de la multiplication) dé-
finie par F (θ) = eiθ . On voit facilement que F est un morphisme, mais comme, par
exemple, F (0) = F (2π), F n’est pas une bijection donc pas un isomorphisme.
À l’évidence (et c’est sans doute ce que vous fîtes au lycée), on peut voir F comme
l’application qui « enroule » de façon régulière une corde (la droite R) sur une roue (le
cercle U), encore et encore.
1.3 Groupes
Définition 13. Soit G un ensemble muni d’une loi de composition ∗. On dit que G
est un groupe lorsque les trois conditions suivantes sont réalisées :
(i) La loi de composition ∗ est associative.
(ii) La loi de composition ∗ possède un élément neutre.
(iii) Tout élément de G possède un symétrique pour ∗.
Définition 14. Un groupe G est dit abélien (ou commutatif) lorsque sa loi de compo-
sition est commutative.
Avant de donner des exemples, quelques remarques d’ordre purement calculatoire
sur les groupes. Comme promis plus haut, on utilise désormais la notation multiplica-
tive, donc ab désigne le composé des éléments a et b d’un groupe G.
Proposition 4. Soit G un groupe. Alors pour tous éléments a, b et x de G :
1) Si ax = bx, alors a = b.
2) Si xa = xb, alors a = b.
3) Le symétrique de ab est b−1 a−1 .
Démonstration : Il n’y a que des vérifications simples et basées sur l’associativité ; pour
(1), si on suppose ax = bx, en multipliant à droite par x−1 on obtient (ax)x−1 = (bx)x−1
et donc a(xx−1 ) = b(xx−1 ), c’est-à-dire a = b. On prouve (2) de la même façon en
multipliant à gauche par x−1 . La preuve du (3) se réduit à deux calculs élémentaires :
(ab)(b−1 a−1 ) = a(bb−1 )a−1 = aa−1 = e,
et
(b−1 a−1 )(ab) = b−1 (a−1 a)b = b−1 b = e,
ce qui conclut la démonstration.
Remarque Au fait, pourquoi faut-il effectuer les deux calculs élémentaires ci-dessus ?
Un seul ne suffirait-il pas ? La réponse est non ; on rappelle que y est le symétrique de
x si xy et aussi yx valent e.
Maintenant que l’on sait calculer dans les groupes, il est temps de donner les
exemples les plus élémentaires : regardons les lois de composition que nous connaissons
le mieux, elles concernent les ensembles de nombres usuels.
11
Additions : elles sont associatives, ont un élément neutre noté 0. Dans N, le symé-
trique peut faire défaut ; ainsi 2 n’a pas d’opposé. Dans Z (puis dans les ensembles
usuels bien connus), l’opposé existe. Ainsi Z est un groupe pour l’addition.
Multiplication : 0 n’a jamais d’inverse, donc les ensembles de nombres bien connus
ne sont jamais des groupes pour la multiplication. En revanche, si on considère le
sous-ensemble formé des éléments non nuls, la multiplication y est bien définie, elle est
associative et elle possède un élément neutre noté 1. Le point à problème est l’existence
du symétrique (de l’inverse en notation multiplicative). Dans Z∗ , il fait défaut à la plu-
part des éléments, ainsi 2 n’a pas d’inverse ; Z∗ n’est donc pas un groupe. En revanche,
dans Q∗ (l’ensemble des fractions non nulles) ou R∗ ou C∗ , l’existence de l’inverse ne
pose pas de problème. Tous ces ensembles sont donc des groupes multiplicatifs.
Encore quelques propriétés de bon sens, mais qu’il ne coûte rien d’énoncer. Elles
paraissent évidentes si on comprend qu’un morphisme est moralement une application
qui transporte la structure ; si elle transporte la loi de composition, elle doit aussi
transporter ses caractéristiques, telles que l’élément neutre et le symétrique.
Proposition 5. Soit f un morphisme d’un groupe G, d’élément neutre e, vers un
groupe G0 , d’élément neutre e0 .
Alors f (e) = e0 et, pour tout élément a de G, [f (a)]−1 = f (a−1 ).
Démonstration : Essentiellement de la simple vérification ; pour le neutre, il s’agit d’une

(petite) astuce : on calcule f (e)f (e) = f (ee) = f (e) = f (e)e0 puis on simplifie par f (e).
Pour l’inverse, on fait un calcul très simple : f (a−1 )f (a) = f (a−1 a) = f (e) = e0 et
simultanément, f (a)f (a−1 ) = f (aa−1 ) = f (e) = e0 . Ceci montre bien que f (a−1 ) est
l’inverse de f (a).
1.4 Exemples fondamentaux de groupes finis

Cette partie est consacrée à deux exemples fondamentaux de classes de groupes
finis. La première classe est composée de groupes abéliens, la seconde de groupes non
abéliens sauf dans des cas dégénérés.
Définition 15. Pour tout entier n > 1, appelons Zn le groupe
Zn = {0, 1, . . . , n − 1},
muni de la loi de composition, notée ⊕, définie comme suit. Si les éléments i et j de

Zn sont tels que i + j 6 n − 1, on pose i ⊕ j = i + j. Sinon, i + j > n et on pose
i ⊕ j = i + j − n.
Proposition 6. Pour tout n > 1, (Zn , ⊕) est un groupe abélien de neutre 0.
Démonstration : Le seul point notable est que l’inverse de 0 vaut 0 et celui d’un élément
i 6= 0 vaut n − i.
12
On verra plus tard une présentation plus intrinsèque des groupes Zn comme quo-
tients du groupe Z muni de l’addition. Profitons tout de même du moment pour intro-
duire une définition.
Définition 16. Soit G un groupe de loi de composition ∗ et de neutre e et soit a un
élément de G. L’ordre de a est le plus petit entier k > 1, s’il existe, tel que a∗k = e.
Sinon on dit que l’ordre de a est infini.
Bien sûr, l’ordre du neutre vaut toujours 1 et l’ordre de tout élément d’un groupe
fini de cardinal fini n est fini et inférieur ou égal à n. Nous verrons bientôt que c’est
forcément un diviseur de n.
Outre les groupes Zn , les groupes les plus directement utilisables sont sans doute
ceux qui interviennent en géométrie. Ce sont des groupes de transformations « res-
pectant » telle ou telle propriété ; ainsi les isométries, qui conservent les distances,
ou les similitudes, qui conservent les angles. Et ils constituent notre deuxième classe
d’exemples.
Tous ces groupes ont le point commun d’avoir pour loi de composition ◦, la com-
position des applications, et d’être formés de bijections.
Fondamentale (quoique très facile) sera donc l’affirmation suivante.
Proposition 7. Soit E un ensemble. L’ensemble des bijections de E dans lui-même
forme un groupe pour la composition.
Démonstration : Tout est très simple. On vérifie que, pour toute bijection f de E, la
bijection réciproque est un symétrique de f ; que la composée de deux bijections est
une bijection, par exemple parce que g −1 ◦ f −1 se révèle un inverse de f ◦ g ; que la
composition est associative ; et enfin que idE est son neutre. On a déjà fini !
Notation 5. Soit E un ensemble. L’ensemble des bijections de E dans lui-même est
noté S(E).
On utilise souvent (au moins en mathématiques, en informatique et en analyse du
génome) le cas particulier du groupe des bijections d’un ensemble fini. L’archétype d’un
tel ensemble fini étant {1, . . . , n}, cela justifie d’introduire une toute spéciale notation.
Notation 6. Pour tout entier n > 1, on note Nn = {1, 2, . . . , n}. L’ensemble des
bijections de Nn s’appelle le groupe des permutations sur n éléments. On le note Sn .
Tentons de découvrir comment fonctionne le groupe des permutations Sn pour n
pas trop gros ; il vaut même mieux prendre n franchement petit, car Sn possédant n!
éléments, on serait vite débordé.
Pour n = 1, le groupe n’a qu’un élément ; sa table est vite tracée.
◦ e
e e
13
Pour n = 2, il y a deux bijections de {1, 2} : celle qui échange les deux éléments,
qu’on notera τ , et l’identité.
La table du groupe est donc la suivante.
◦ e τ
e e τ
τ τ e
À partir de n = 3, les calculs complets seraient nettement plus fastidieux. On va
en profiter pour introduire des notations et énumérer les ensembles Sn .
Notation 7. On dispose de plusieurs notations pour désigner une permutation s élé-

ment de Sn . La première est
!
1 2 ··· n
s= ,
s(1) s(2) · · · s(n)
que l’on abrège parfois en

s = (s(1), s(2), . . . , s(n)).
Définition 17. Une orbite d’une permutation s élément de Sn est une partie
{s◦k (i) ; k > 1}, i ∈ Nn .
On peut expliciter la structure des orbites comme suit.
Proposition 8. Pour toute permutation s et tout élément i de Nn , il existe un entier

k > 1 tel que s◦k (i) = i. Le plus petit entier k > 1 qui vérifie cette propriété est le
cardinal de l’orbite de i et s’appelle la taille de l’orbite de i.
Définition 18. Un cycle s est un élément de Sn qui possède exactement une orbite de
longueur différente de 1.
Pour tout cycle s de longueur k > 2, il existe donc une partie S ⊂ Nn de cardinal
k telle que s(i) = i pour tout élément i de Nn \ S. De plus, on peut numéroter les
éléments de S comme suit :
S = {i1 , i2 , . . . , ik }, s(ij ) = ij+1 , 1 6 j 6 k − 1, s(ik ) = i1 .
Notation 8. On désigne le cycle s de longueur k > 2 ci-dessus par l’écriture
s = (i1 i2 . . . ik ).
14
Avertissement On aura remarqué que la notation 8 est affreusement proche de l’écri-

ture abrégée d’une permutation quelconque donnée dans la notation 7, la seule diffé-
rence portant sur la présence ou l’absence de virgules.
Bien sûr, si le nombre d’entiers figurant dans l’écriture de s est différent de n, on
désigne forcément le cycle. Dans le cas contraire, on veillera à ne pas confondre
a = (123) et e = (1, 2, 3),
puisque a est un cycle de longueur 3 et e est la permutation identité.

Enfin, remarquons qu’un cycle dispose de plusieurs écritures différentes, par exemple
a = (123) = (231) = (312).
Fin de l’avertissement.
Il est à présent facile d’énumérer les éléments de S3 : outre l’identité, que l’on va
noter e, il y en a trois d’apparence identique : l’un, que je noterai t, échange 1 et 2
en laissant 3 fixe ; un autre, que je me garderai astucieusement de noter, échange 2
et 3 en laissant 1 fixe ; le dernier échange 3 et 1 en laissant 2 fixe. Enfin deux autres
jouent aussi des rôles voisins : l’un, que je noterai a, fait « tourner » les trois éléments
de {1, 2, 3} en envoyant 1 sur 2, 2 sur 3, et 3 sur 1 ; l’autre, dont je remarquerai que
c’est le carré de a, les fait « tourner » dans l’autre sens. Ainsi,
! ! !
1 2 3 1 2 3 2 1 2 3
t = (12) = , a = (123) = , a = (132) = .
2 1 3 2 3 1 3 1 2
On va remplir la table du groupe par ajouts successifs d’information. L’information la

plus récente sera systématiquement portée en gras.
Au point où nous en sommes, il est facile de commencer en remarquant que a3 = e
tandis que a2 , comme on l’a déjà dit, est distinct de a. En outre les trois autres éléments
ont un carré égal à e.
◦ e a a2 t
e e a a2 t
a a a2 e
a2 a2 e a
t t e
e
e
C’est le bon moment pour glisser une remarque importante : dans la table de com-
position d’un groupe on trouve chaque élément du groupe une fois et une seule dans
15
chaque ligne, et dans chaque colonne. Sauriez-vous le démontrer ? Sinon, cher lecteur,
nous vous conseillons d’arrêter votre lecture et de chercher une démonstration.
Le produit at ne peut être présent deux fois dans la colonne a, ni deux fois dans
la ligne t. Il est donc distinct des éléments qui y figurent déjà, c’est-à-dire de e, de a,
de a2 et de t. C’est donc un cinquième élément, qu’on peut alors faire figurer dans la
cinquième ligne et la cinquième colonne du tableau. On calcule au passage sans mal
(a2 )(at) = (a3 )t = et = t, et (at)t = a(t2 ) = ae = a.
◦ e a a2 t at
e e a a2 t at
a a a2 e at
a2 a2 e a t
t t e
at at a e
e
Puis à son tour, a2 t ne peut déjà figurer dans la ligne a2 ni dans la colonne t :
c’est donc le sixième élément. On peut l’ajouter au tableau en complétant par quelques
calculs évidents.
◦ e a a2 t at a2 t
e e a a2 t at a2 t
a a a2 e at a2 t t
a2 a2 e a a2 t t at
t t e
at at a e
a2 t a2 t a2
e
En utilisant toujours l’astuce selon laquelle il ne peut y avoir deux fois la même
valeur dans une ligne ni dans une colonne, on arrive à calculer (at)(a2 t) et (a2 t)(at)
par simple élimination de cinq valeurs impossibles.
16
e e a a2 t at a2 t
a a a2 e at a2 t t
2
a a2 e a a2 t t at
t t e
at at a e a2
a2 t a2 t a2 a e
Surprise ! On vient de montrer avec une étonnante économie de calculs que le groupe
n’est pas commutatif ; en effet (at)(a2 t) 6= (a2 t)(at).
Le même truc des répétitions interdites permet de compléter le coin inférieur droit
du tableau.
e e a a2 t at a2 t
a a a2 e at a2 t t
a2 a2 e a a2 t t at
t t e a2 a
at at a e a2
a2 t a2 t a2 a e
Dernier obstacle inattendu, alors que nous avions presque fini, avec la méthode,
maintenant classique pour nous, de remplir les cases par élimination, cette méthode est
insuffisante pour remplir les six misérables cases laissées blanches ! Il faut une nouvelle
astuce pour passer cet obstacle. Concentrons-nous sur la case correspondant au produit
ta. Pour calculer ce produit, bidouillons un peu : ta = tae = ta(t2 ) = [t(at)]t = a2 t.
Une nouvelle case est remplie :
e e a a2 t at a2 t
a a a2 e at a2 t t
a2 a2 e a a2 t t at
t t a2 t e a2 a
at at a e a2
a2 t a2 t a2 a e
17
Cette étape franchie, il est désormais très facile de finir de remplir la table en
utilisant l’idée simple : pas plus d’une apparition par ligne ou par colonne.
e e a a2 t at a2 t
a a a2 e at a2 t t
a2 a2 e a a2 t t at
t t a2 t at e a2 a
at at t a2 t a e a2
a2 t a2 t at t a2 a e
On a donc obtenu la table complète de la loi de composition ◦ sur S3 , en n’utilisant
que des techniques élémentaires.
1.5 Sous-groupes
Maintenant que nous connaissons ce que nous avons pompeusement appelé les
exemples fondamentaux, il reste à apprendre à tirer de ces exemples trop fondamentaux
pour être vraiment utiles des exemples plus concrets.
Pour cela, introduisons une nouvelle notion.
Définition 19. Soit G un groupe. On dit qu’un sous-ensemble H de G est un sous-

groupe de G lorsque les trois conditions suivantes sont vérifiées :
(i) L’ensemble H n’est pas vide.
(ii) Pour tous a et b de H, le produit ab est aussi dans H.
(iii) Pour tout a de H, l’inverse a−1 de a est aussi dans H.
Avant de commenter ce que ça veut dire, donnons tout de suite une proposition
très simple, et utile en pratique pour vérifier qu’un sous-ensemble d’un groupe est un
sous-groupe.
Proposition 9. Soit G un groupe. Un sous-ensemble H de G est un sous-groupe de G

si et seulement si les deux conditions suivantes sont vérifiées :
(i) L’ensemble H n’est pas vide.
(iv) Pour tous a et b de H, le produit ab−1 est aussi dans H.
Démonstration : Supposons que H est un sous-groupe de G, c’est-à-dire qu’il vérifie

(i), (ii) et (iii). Il est alors clair que (i) est vérifiée.
18
Montrons que H vérifie (iv). Soit a et b deux éléments de H. En appliquant (iii) à b,

on constate que b−1 est aussi dans H, puis en appliquant (ii) à a et b−1 que le produit
ab−1 aussi. Cette partie de la preuve est déjà finie !
Supposons maintenant que H vérifie (i) et (iv). Vérifier (i) est bien sûr sans pro-
blème. Avant de montrer que H vérifie (ii) et (iii), montrons préalablement que e
appartient à H, où e désigne l’élément neutre de G. En effet H n’étant pas vide, on
peut prendre un élément c dans H, puis appliquer l’hypothèse (iv) à c et c pour conclure
que cc−1 = e appartient à H.
Montrons maintenant que H vérifie (iii). Soit a un élément de H. Puisqu’on sait
maintenant que e aussi est dans H, on peut appliquer (iv) à e et a pour obtenir
ea−1 ∈ H, c’est-à-dire a−1 ∈ H.
Montrons enfin que H vérifie (ii). Soit a et b deux éléments de H. Par la propriété
(iii) appliquée à b, b−1 ∈ H, puis par la propriété (iv) appliquée à a et b−1 , a(b−1 )−1 ∈ H,
c’est-à-dire ab ∈ H.
Bien que le résultat qui suive soit très simple à démontrer, son importance lui fait
mériter l’appellation de :
Théorème 1. Soit G un groupe et H un sous-groupe de G. La restriction à H de la

loi de composition sur G fait de H un groupe.
Démonstration : Il ne faut pas manquer de vérifier la possibilité de restreindre la loi

de composition initiale, application de G × G vers G à une loi de composition sur
H, c’est-à-dire une application de H × H vers H. Comme on veut restreindre non
seulement l’ensemble de départ mais aussi l’ensemble d’arrivée, on est dans la situation
où il faut spécialement prendre garde. Mais la propriété (ii) de la définition des « sous-
groupes » assure précisément que la loi de composition de G envoie l’ensemble H × H
dans H et que la restriction a donc bien un sens.
L’associativité de cette restriction est alors évidente. Dans la preuve de la proposi-
tion précédente, on a montré au passage que le neutre de G était élément de H. Il est
alors évidemment neutre pour la loi de composition restreinte à H. Enfin la propriété
(iii) garantit l’existence d’un symétrique pour chaque élément de H.
Voyons maintenant comment ce théorème permet de fabriquer plein de groupes
nouveaux et intéressants.
Exemple 8. Soit G le groupe des bijections strictement croissantes de R vers R, muni

de la composition. Montrer que G est un groupe.
(On rappellera, au cas où ce serait nécessaire, qu’une application f est dite stricte-
ment croissante lorsque pour tous x et y, x < y entraîne f (x) < f (y)).
La bonne idée est de montrer que G est un sous-groupe du groupe S(R). Lançons-
nous.
La vérification de (i) est évidente : il est clair que l’application identique est une
bijection strictement croissante de R sur R.
19
Passons à (ii). Soit f et g deux bijections strictement croissantes de R sur R. On

sait déjà que g ◦ f est une bijection ; montrons qu’elle est strictement croissante. Soit x
et y deux réels avec x < y ; alors f (x) < f (y) (croissance de f ) puis g(f (x)) < g(f (y))
(croissance de g). Ceci montre bien que g ◦ f est strictement croissante.
Vérifions enfin (iii). Soit f une bijection strictement croissante de R vers R. Il est
bien clair que f −1 est bijective ; vérifions qu’elle est strictement croissante. Soit x et
y deux réels avec x < y. On ne peut avoir f −1 (x) = f −1 (y), car f −1 est injective ;
on ne peut avoir f −1 (y) < f −1 (x), car f étant strictement croissante on en dédui-
rait l’inégalité f (f −1 (y)) < f (f −1 (x)), qui est fausse. Par élimination on a donc bien
f −1 (x) < f −1 (y).
Exemple 9. Soit A un sous-ensemble de R2 et G l’ensemble des isométries f de R2 sur

R2 telles que f (A) = A. On montrerait par le même genre de méthode que G est un
groupe parce que c’est un sous-groupe de S(R2 ). Dès que A sera un peu trop patatoïdal,
G se réduira à {IdR2 } et sera donc peu intéressant, mais si A possède des symétries
raisonnables, par exemple si A est un pentagone régulier, le groupe G méritera notre
attention.
Le théorème de Lagrange est un résultat simple et élégant, proposé ici surtout pour
le plaisir de faire une démonstration agréable.
Théorème 2 (de Lagrange). Soit G un groupe fini et H un sous-groupe de G. Alors

le nombre d’éléments de H divise le nombre d’éléments de G.
Démonstration : Elle repose sur l’introduction de la relation ∼ définie pour tous

éléments a, b de G par :
a∼b si et seulement si ab−1 ∈ H.
Le plan de la preuve est le suivant :

1. On vérifie que ∼, comme son nom le laisse penser, est une relation d’équivalence.
2. On vérifie que toutes les classes d’équivalence pour la relation ∼ ont le même
nombre d’éléments, à savoir le nombre d’éléments de H.
3. On conclut en quelques mots.
Exécution. . .
Étape 1. Vérifions successivement les trois propriétés requises des relations d’équi-
valence.
Soit a un élément de G. Comme aa−1 = e ∈ H, a ∼ a. La relation ∼ est donc
réflexive.
Soit a et b deux éléments de G, avec a ∼ b, donc ab−1 ∈ H. En prenant l’inverse,
−1
(ab−1 ) ∈ H, c’est-à-dire ba−1 ∈ H, soit b ∼ a : la relation ∼ est donc symétrique.
20
Soit a, b et c trois éléments de G, avec a ∼ b et b ∼ c. On a donc ab−1 ∈ H et

bc−1 ∈ H. En multipliant entre eux ces deux éléments de H, on obtient que (ab−1 )(bc−1 )
appartient à H, c’est-à-dire ac−1 ∈ H, soit a ∼ c. La relation ∼ est donc transitive.
La relation ∼ est donc une relation d’équivalence.
Étape 2. Soit a un élément fixé de G. L’objectif est de montrer que sa classe d’équi-
valence cl(a) possède le même nombre d’éléments que H. Pour ce faire, une bonne
idée serait de montrer qu’il existe une bijection entre cl(a) et H. Et pour montrer
qu’une bijection existe, une bonne idée pourrait être d’en sortir une de sa manche (en
mathématiques, on dit « exhiber »), et voir qu’elle convient !
Introduisons donc l’application f : H → cl(a) définie par : pour tout h de H,
f (h) = ha.
Vérifions tout d’abord que f est bien une application. La difficulté vient ici de ce que
la formule ha possède certes un sens, mais qu’il faudrait savoir que ha appartient bien
à cl(a). Heureusement, la question est plus facile à résoudre qu’à poser ! C’est en effet
une simple vérification : a(ha)−1 = aa−1 h−1 = h−1 ∈ H ; donc a ∼ ha ; en d’autres
termes ha appartient à cl(a).
Vérifions que f est une bijection. Soit b un élément de G tel que b ∈ cl(a). Cherchons
les antécédents de b. Un élément h de H est antécédent de b par f si et seulement si
b = ah, c’est-à-dire si et seulement si h = ba−1 . Il y a donc au plus un antécédent, à
savoir ba−1 , et comme en outre b ∼ a, l’élément ba−1 est dans H et il y a exactement
un antécédent.
Ceci montre que f est une bijection, et cl(a) compte donc exactement autant d’élé-
ments que H.
Étape 3. Il ne reste plus qu’à conclure. On dispose d’une relation d’équivalence
∼, donc d’un ensemble-quotient G/ ∼, qui constitue une partition de G. Chacune des
parties de G figurant dans cette partition possède exactement card(H) éléments ; le
nombre total d’éléments de G est donc égal au produit de card(H) par le nombre
de parties de G figurant dans la partition G/ ∼ et est en particulier un multiple de
card(H).
1.6 Noyaux
Une petite définition, à l’usage pratique pour prouver des injectivités. Pour le reste,
une section courte sans guère de commentaires.
Définition 20. Soit f un morphisme de groupes, allant d’un groupe G vers un groupe
G0 , dont l’élément neutre est noté e0 . Le noyau de f est par définition l’ensemble des
éléments x de G tels que f (x) = e0 .
Notation 9. Le noyau de f est noté Ker(f ) (parce que Ker est l’abréviation de l’alle-
mand « Kern »).
21
Le fait suivant est presque évident, mais on ne peut s’interdire de le souligner.
Proposition 10. Le noyau d’un morphisme est un sous-groupe du groupe de départ.
Démonstration : Soit f un morphisme d’un groupe noté G de neutre noté e vers un

groupe noté G0 de neutre noté e0 .
On sait que f (e) = e0 donc e ∈ Ker(f ), qui n’est donc pas vide.
Soit a et b deux éléments de Ker(f ). On a alors f (ab−1 ) = f (a)[f (b)]−1 = e0 e0 = e0 ,
donc ab−1 appartient à Ker(f ).
Proposition 11. Soit f un morphisme de groupes, le neutre du groupe de départ étant

noté e. L’application f est injective si et seulement si Ker(f ) = {e}.
Démonstration : Sans surprise, vérifions successivement les deux implications. On

notera e0 le neutre du groupe d’arrivée.
Preuve de l’implication directe.
Supposons f injective. On sait déjà que f (e) = e0 , et donc que {e} ⊂ Ker(f ).
Réciproquement, si a ∈ Ker(f ), f (a) = f (e) = e0 , et comme f est injective, a = e.
D’où l’égalité {e} = Ker(f ).
Preuve de l’implication réciproque.
Supposons que Ker(f ) = {e}. Soit a et b deux éléments du groupe de départ vérifiant
f (a) = f (b). Alors f (ab−1 ) = f (a)[f (b)]−1 = e0 , donc ab−1 ∈ Ker(f ), donc ab−1 = e,
donc a = b. Donc f est injective.
1.7 Puissances et ordre d’un élément d’un groupe

Rappelons une définition déjà utilisée en partie.
Définition 21. Soit a un élément d’un groupe et n un entier relatif. On appelle puis-
sance n-ième de a l’élément an défini comme valant aa . . . a} si n > 1, comme valant
| {z
n fois
l’inverse de a−n si n 6 −1 et comme valant l’élément neutre si n = 0.
Définition équivalente (évitant l’emploi des trois petits points) On définit

par récurrence an pour tout entier n positif ou nul en posant a0 = e puis, pour tout
n > 0, an+1 = an a, puis on définit directement an pour tout entier n négatif en posant
an = (a−n )−1 (puisque a−n est alors déjà défini).
Notation 10. L’ensemble des puissances de a est noté hai.
Proposition 12. Soit a un élément d’un groupe et n et m deux entiers ; alors am+n =
am an et (am )n = amn .
22
Démonstration : C’est très simple à voir avec des points de suspension, en n’oubliant
pas de distinguer plein de cas selon les signes des divers entiers des formules, la définition
dépendant de ce signe. Comme c’est à la fois très facile et très fastidieux, on va oublier
discrètement de le faire.
On en déduit aussitôt la très élémentaire
Proposition 13. Soit G un groupe, et a un élément de G. L’ensemble hai est un

sous-groupe de G.
Démonstration : L’ensemble hai n’est pas vide, puisqu’il contient a. Si x et y sont

deux éléments de hai, on peut trouver deux entiers (relatifs) m et n permettant d’écrire
x = am et y = an . Dès lors xy −1 = am−n et donc xy −1 appartient à hai.
Définition 22. Soit a un élément d’un groupe, dont le neutre est noté e. Si pour tout
n > 1, an 6= e on dit que a est d’ordre infini. Sinon on appelle ordre de a le plus petit
entier n > 1 tel que an = e.
Afin de tenter de prévenir les confusions, introduisons un autre sens du mot « ordre »,
pas du tout synonyme du précédent et un peu superflu mais tellement passé dans les
usages qu’on ne peut l’éviter.
Définition 23. Soit G un groupe fini. L’ordre de G est son cardinal.
Histoire d’appliquer rétroactivement la division euclidienne, qui sera correctement

définie dans le chapitre sur l’arithmétique, démontrons le
Théorème 3. Soit a un élément d’un groupe. L’ordre de a est égal au nombre d’élé-
ments de hai.
Démonstration : La preuve étant plus longue que la moyenne, essayons de dégager des
étapes intermédiaires avec des énoncés précis, qui nous permettront de souffler quand
ils seront atteints. On notera e l’élément neutre du groupe considéré.
Étape intermédiaire 1 : si l’ordre de a est fini, noté n,
hai = A, où on a posé A = {e, a, a2 , . . . , an−1 }.
Preuve de l’étape 1. Soit b un élément de hai, c’est-à-dire une puissance de a.

On peut donc mettre b sous forme ak pour un entier relatif k. Effectuons la division
euclidienne de k par n, ainsi k = nq + r, avec 0 6 r 6 n − 1. On a alors
b = ak = anq+r = (an )q ar = eq ar = ar ,
donc b appartient à A, ce qui montre l’inclusion hai ⊂ A ; l’autre inclusion étant

évidente, l’étape 1 est prouvée.
23
Étape intermédiaire 2 : si l’ordre de a est fini, le théorème est vrai.

Preuve de l’étape 2. Notons n l’ordre de a. Il découle du résultat de l’étape 1
que dans cette hypothèse l’ensemble hai possède au plus n éléments. L’étudiant distrait
croira même qu’on a déjà prouvé qu’il en possède exactement n et qu’on a donc fini,
mais son condisciple plus observateur remarquera que nous ne savons pas encore si
dans l’énumération e, a, a2 , . . . , an−1 figurent bien n éléments distincts.
Prouvons donc ce dernier fait ; supposons que dans cette énumération il y ait deux
termes ai et aj qui représentent le même élément du groupe, avec pourtant i < j. On
aurait alors aj−i = e. Mais par ailleurs, comme i < j, on obtient 0 < j − i et donc
1 6 i−j, et comme 0 6 i et j < n, on obtient j −i < n. Mais ceci contredit la définition
de n comme le plus petit entier supérieur ou égal à 1 tel que an = e. L’hypothèse était
donc absurde, et l’énumération décrivant hai à l’étape 1 est une énumération sans
répétition.
Le nombre d’éléments de hai est donc bien égal à n, et l’étape 1 est prouvée.
Étape intermédiaire 3 : si l’ordre de a est infini, le théorème est vrai.
Preuve de l’étape 3. Dans ce cas, tout le travail consiste à prouver que hai est
un ensemble infini. La vérification est du même esprit qu’à l’étape 2, en plus simple :
on va prouver que pour i < j, les éléments ai et aj de hai sont distincts. Pour ce faire,
supposons que deux d’entre eux soient égaux ; on aurait alors aj−i = e, avec pourtant
1 6 j − i et a ne serait pas d’ordre infini. Ainsi l’étape 3 est prouvée.
Corollaire 1. L’ordre d’un élément divise l’ordre du groupe.
Démonstration : Laissée au lecteur, en lui rappelant l’existence dans ce cours d’un

théorème dit « de Lagrange » et en lui conseillant tout de même de bien distinguer
entre ordre (cardinal) et ordre (d’un élément), comme déjà mentionné.
Histoire d’utiliser encore un peu la notion d’ordre, donnons un énoncé qui peut
servir pour gagner du temps dans tel ou tel exercice très concret.
Proposition 14. Soit G un groupe fini et H un sous-ensemble de G. Alors H est un

sous-groupe de G si et seulement si :
1. L’ensemble H n’est pas vide.
2. Pour tous a, b de H, le produit ab est aussi dans H.
En d’autres termes, dans le cas particulier d’un sous-ensemble d’un groupe fini
(et seulement dans ce cas !) on peut faire des économies et éviter de travailler sur les
ennuyeux symétriques pour examiner un potentiel sous-groupe.
Pour enfoncer le clou sur la nécessité de l’hypothèse selon laquelle G est fini, on
pensera au cas G = Z et H = N.
Démonstration : La seule difficulté est évidemment de vérifier la propriété (iii) de la
définition des « sous-groupes ». Prenons donc un élément a de H. On commence par
24
traiter à part le cas stupide où a = e, et où il est clair qu’on a aussi a−1 = e ∈ H. Pour
le cas sérieux où a 6= e, considérons le sous-groupe hai de G. Ce sous-groupe est fini,
puisqu’inclus dans G. On déduit donc du théorème précédent (en fait de sa partie la
plus facile, l’étape 3 de sa preuve) que a est d’ordre fini. Notons n l’ordre de a ; comme
a 6= e, on a l’inégalité n > 2 et donc n − 1 > 1 ; écrivons l’identité an−1 = an a−1 = a−1 ,
et revenons dans cette formule à la définition de an−1 : on obtient a−1 = aa | .{z
. . aa}
n−1 fois
comme produit d’un nombre positif d’exemplaires de a ; par la propriété 2 de l’énoncé
de la proposition, on en déduit que a−1 ∈ H.
1.8 Anneaux et corps

Il s’agit ici simplement de rajouter un peu de vocabulaire pour pouvoir décrire les
propriétés que possèdent les ensembles de nombres usuels. Le chapitre se limitera donc
à quelques définitions.
Définition 24. Soit A un ensemble muni de deux opérations, notées + et ×. On dit
que A est un anneau lorsque les assertions (i) à (iv) sont vraies.
(i) Pour l’addition, A est un groupe commutatif.
(ii) La multiplication est associative.
(iii) La multiplication possède un élément neutre.
(iv) La multiplication est distributive par rapport à l’addition ; en d’autres termes,
pour tous a, b et c éléments de A,
(a + b)c = ac + bc, c(a + b) = ca + cb.
L’archétype de l’anneau est l’ensemble Z des entiers relatifs ; dans un anneau quel-
conque on peut calculer « comme » dans Z. Méfiance sur un seul point toutefois :
la définition n’exigeant pas que la multiplication soit commutative, certaines formules
peuvent être un peu plus perverses ; par exemple (a+b)2 se développe en a2 +ba+ab+b2 ,
mais ne peut pas dans un anneau trop général être regroupé en a2 + 2ab + b2 puisque
ab n’a aucune raison d’être égal à ba.
Voici un autre exemple.
Proposition 15. Soit E un espace vectoriel. L’ensemble des applications linéaires de
E vers E, noté L(E), est un anneau pour l’addition et la composition.
Démonstration : Les propriétés d’« anneau » sont généralement évidentes à vérifier ;

la plus intéressante est la distributivité, qui est liée à la linéarité, et que nous laissons
gentiment au lecteur. Le neutre pour la composition est sans surprise l’application
identique.
Si on choisit pour espace vectoriel E = Rn et que l’on représente les éléments de
L(E) par des matrices carrées, on obtient l’anneau Mn (R) des matrices carrées de
taille n × n à coefficients réels.
25
Définition 25. Soit A un anneau et n > 1 un entier. L’anneau des matrices carrées
de taille n à coefficients dans A, noté Mn (A), est défini par les lois de composition
suivantes. Si M = (ai,j )16i,j6n et N = (bi,j )16i,j6n sont deux éléments de Mn (A),
n
X
M + N = (ai,j + bi,j )16i,j6n , M × N = (ci,j )16i,j6n avec ci,j = ai,k bk,j .
k=1
Le neutre de Mn (A) pour l’addition est la matrice nulle, dont tous les coefficients
valent le neutre de l’addition de A. Le neutre de Mn (A) pour la multiplication est la
matrice identité, dont tous les coefficients valent le neutre de l’addition de A sauf ceux
de la diagonale qui valent le neutre de la multiplication de A.
Définition 26. Un anneau est dit commutatif quand sa multiplication est commuta-
tive.
Définition 27. Un anneau A est dit intègre lorsque :

(i) L’anneau A possède au moins deux éléments.
(ii) Pour tous a et b éléments non nuls de A, ab 6= 0.
Une classe particulière d’anneaux est celle des anneaux tels que la deuxième loi (la
multiplication) fournit aussi une structure de groupe (sur l’anneau privé de son zéro).
Définition 28. On dit qu’un anneau K est un corps commutatif lorsque :

(i) La multiplication est commutative.
(ii) L’anneau K possède au moins deux éléments.
(iii) Tout élément non nul de K possède un inverse pour la multiplication.
Les archétypes de corps commutatifs sont naturellement Q, ensemble des fractions,

et, encore mieux connus des étudiants, R et C. Un autre archétype, au moins aussi
important malgré sa simplicité, est Zp pour p premier. Nous avons déjà défini l’addition
sur Zp . On définit une multiplication ⊗, en convenant que i ⊗ j est l’unique entier
0 6 k 6 n − 1 tel que ij − k est divisible par p. On démontre facilement que (Zp , ⊕, ⊗)
est un anneau pour tout entier p, et que c’est un corps, si et seulement si p est premier.
Ces corps servent entre autres en cryptographie. Le plus petit d’entre eux, Z2 , peut
être considéré comme la base de toute l’informatique : excusez du peu !
26
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit E = {0, 1, 2}. Les graphes suivants définissent-ils une relation d’é-
quivalence sur E (oui ou non et pourquoi) ?
1. Γ = { (0, 0), (0, 1), (1, 0), (1, 1) }
2. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (2, 2) }
3. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (1, 2), (2, 2) }
4. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (1, 2), (2, 1), (2, 2) }
5. Γ = { (0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2) }
Vrai-Faux 2. Soit E = {0, 1, 2}. Les graphes suivants définissent-ils une relation d’ordre
sur E (oui ou non et pourquoi) ?
1. Γ = { (0, 0), (0, 1), (1, 1), (2, 2) }
2. Γ = { (0, 0), (0, 1), (1, 0), (1, 1), (2, 2) }
3. Γ = { (0, 0), (0, 1), (0, 2), (1, 1), (2, 2) }
4. Γ = { (0, 0), (0, 1), (1, 1), (1, 2), (2, 2) }
5. Γ = { (0, 0), (0, 1), (0, 2), (1, 1), (1, 2), (2, 2) }
Vrai-Faux 3. Soient E un ensemble fini non vide et x un élément fixé de E. Les relations
∼ définies ci-dessous sont-elles des relations d’équivalence sur P(E) (oui ou non et
pourquoi) ?
1. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ A = B
2. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ A ⊂ B
3. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ (A ∩ B = ∅)

4. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ (A ∩ B = ∅) ∨ (A ∪ B 6= ∅)
5. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ (x ∈ A ∪ B)

c c
6. ∀A, B ∈ P(E) , A ∼ B ⇐⇒ (x ∈ A ∩ B) ∨ (x ∈ A ∩ B)
Vrai-Faux 4. Soient E un ensemble fini non vide et x un élément fixé de E. Les relations
R définies ci-dessous sont-elles des relations d’ordre sur P(E) (oui ou non et pourquoi) ?
1. ∀A, B ∈ P(E) , ARB ⇐⇒ A = B
2. ∀A, B ∈ P(E) , ARB ⇐⇒ A ⊂ B
3. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ (A ∩ cB))
4. ∀A, B ∈ P(E) , ARB ⇐⇒ (x ∈ (A ∪ cB))

c
5. ∀A, B ∈ P(E) , ARB ⇐⇒ (A = B) ∨ (x ∈ A ∩ B)
27
Vrai-Faux 5. Les relations R définies ci-dessous sont-elles des relations d’ordre sur R
(oui ou non, et pourquoi) ?
1. ∀x, y ∈ R , xRy ⇐⇒ x < y
2. ∀x, y ∈ R , xRy ⇐⇒ ex 6 ey
3. ∀x, y ∈ R , xRy ⇐⇒ |x| 6 |y|
4. ∀x, y ∈ R , xRy ⇐⇒ (x − y) ∈ N
5. ∀x, y ∈ R , xRy ⇐⇒ (x − y) ∈ Z
Vrai-Faux 6. Les relations R définies ci-dessous sont-elles des relations d’équivalence

sur C (oui ou non, et pourquoi) ?
1. zRz 0 ⇐⇒ |z| = |z 0 |
2. zRz 0 ⇐⇒ |z/z 0 | = 1
0
3. zRz 0 ⇐⇒ ez = ez
4. zRz 0 ⇐⇒ |z − z 0 | = 1
0
5. zRz 0 ⇐⇒ |ez−z | = 1
Vrai-Faux 7. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont
fausses, et pourquoi ?
1. La soustraction est une loi de composition interne dans Z.
2. 0 est élément neutre de la soustration dans Z.
3. La soustraction dans Z est associative.
4. 0 est élément neutre pour l’addition dans N.
5. L’addition est associative dans N.
Vrai-Faux 8. Les ensembles suivants, munis de l’addition des réels sont-ils des groupes
(oui ou non et pourquoi) ?
n o
1. a/10n , a ∈ Z , n ∈ N
n o
2. a/2n , a ∈ Z , n ∈ Z
n √ o
3. a 2 , a ∈ Z
n √ o
4. a 2 , a ∈ N
n √ √ o
5. a 2 + b 3 , a, b ∈ Z
n √ √ o
6. a 2 + b 3 , a ∈ Z , b ∈ N
Vrai-Faux 9. Les ensembles suivants, munis de la multiplication des réels sont-ils des
groupes (oui ou non et pourquoi) ?
n o
1. 1, −1
28
n o
2. 1, −1, 1/2, 2
n o
3. 2n , n ∈ Z
n o
4. a2n , a = ±1 , n ∈ Z
n √ o
5. a + b 2 , a, b ∈ Q∗
n √ o
6. a + b 2 , a, b ∈ Q \ {0}
Vrai-Faux 10. Les ensembles suivants, munis de l’addition et de la multiplication des

réels sont-ils des anneaux (oui ou non et pourquoi) ?
n √ o
1. b 2 , b ∈ Q
n √ o
2. a + b 2 , a, b ∈ Q
n o
3. a + bπ , a, b ∈ Q
n √ o
4. a + b 4 , a, b ∈ Q
n √ o
5. a + b 3 2 , a, b ∈ Q
n √ √ o
6. a + b 2 + c 3 , a, b, c ∈ Q
Vrai-Faux 11. Les ensembles suivants, munis de l’addition et de la multiplication des

réels sont-ils des corps (oui ou non et pourquoi) ?
n √ o
1. b 2 , b ∈ Q
n √ o
2. a + b 2 , a, b ∈ Q
n o
3. a + bπ , a, b ∈ Q
n √ o
4. a + b 4 , a, b ∈ Q
n √ o
5. a + b 3 2 , a, b ∈ Q
n √ √ o
6. a + b 2 + c 3 , a, b, c ∈ Q
2.2 Exercices
Exercice 1. On considère les relations suivantes sur R.
• ∀x, y , xRy ⇐⇒ x 6 y
• ∀x, y , xRy ⇐⇒ x2 6 y 2
• ∀x, y , xRy ⇐⇒ bxc 6 byc
• ∀x, y , xRy ⇐⇒ bxc = byc
• ∀x, y , xRy ⇐⇒ sin(x) = sin(y)
• ∀x, y , xRy ⇐⇒ y − x ∈ N
Pour chacune de ces relations R :
29
1. Représenter graphiquement dans R2 le graphe de la relation R.

2. Est-ce une relation d’ordre ? une relation d’équivalence ?
Exercice 2. On définit la relation R sur N par :

∗ ∗ k
∀m, n ∈ N , mRn ⇐⇒ ∃k ∈ N , m = n
Démontrer que R est une relation d’ordre.

Exercice 3. Une relation binaire R dans un ensemble E est dite circulaire si pour tout
(a, b, c) ∈ E,
aRb et bRc =⇒ cRa
Montrer qu’une relation circulaire et réflexive est une relation d’équivalence.
Exercice 4. Soit E et F deux ensembles et f une application de E dans F . On définit
la relation ∼ sur E par :
∀x, y ∈ E , x ∼ y ⇐⇒ f (x) = f (y)
1. Montrer que ∼ est une relation d’équivalence.

2. Soit Γ l’ensemble des couples (cl(x), f (x)), où x parcourt l’ensemble E. Montrer
que Γ est le graphe d’une application de l’ensemble-quotient E/ ∼ dans F . On
note g cette application.
3. Montrer que g est une application injective.
4. Soit f l’application de Z dans N qui à n ∈ Z associe n2 . Décrire cl(0) et cl(1).
5. Soit f l’application de C dans C qui à z associe f (z) = z 4 . Décrire cl(0) et cl(1).
6. Soit f l’application de R dans R qui à un réel x associe sa partie entière. Décrire
cl(0) et cl(1).
7. Soit f l’application de R dans R qui à un réel x associe sa partie décimale. Décrire
cl(0) et cl( 21 ).
Exercice 5.
1. On munit R de la loi de composition interne ∗ définie par :
∀x, y ∈ R , x ∗ y = xy + (x2 − 1)(y 2 − 1)
Montrer que ∗ est commutative, non associative, et que 1 est élément neutre,
2. On munit R+∗ de la loi de composition interne ∗ définie par :
q
∀x, y ∈ R+∗ , x∗y = x2 + y 2
Montrer que ∗ est commutative, associative, et que 0 est élément neutre. Montrer
que aucun élément de R+∗ n’a de symétrique pour ∗.
30
3. On munit R de la loi de composition interne ∗ définie par :

q
3
∀x, y ∈ R , x∗y = x3 + y 3
Montrer que l’application x 7→ x3 est un isomorphisme de (R, ∗) vers (R, +). En
déduire que (R, ∗) est un groupe commutatif.
Exercice 6. Soit E l’ensemble des parties d’un ensemble à deux éléments, par exemple
E = P({0, 1}) donc
E= ∅ , {0} , {1} , {0, 1}
On considère les lois de composition ∗ suivantes sur l’ensemble E.
• Réunion : A ∗ B = A ∪ B
• Intersection : A ∗ B = A ∩ B
• Différence symétrique : A ∗ B = A4B = (A \ B) ∪ (B \ A)
• Réunion des complémentaires : A ∗ B = cA ∪ cB
• Intersection des complémentaires : A ∗ B = cA ∩ cB
Pour chacune d’entre elles :
1. Écrire la table de composition de la loi ∗.
2. L’ensemble E possède-t-il un élément neutre pour la loi ∗ ?
3. La loi ∗ est-elle associative ?
4. La loi ∗ est-elle commutative ?
5. L’ensemble E muni de la loi ∗ est-il un groupe ?
6. Répondre aux questions 2 à 5 en remplaçant E par l’ensemble des parties d’un
ensemble quelconque.
Exercice 7. Le but de l’exercice est d’étudier les groupes à 1, 2, 3 ou 4 éléments.
1. Ecrire la table de composition d’un groupe à 1 élément.
2. Ecrire la table de composition d’un groupe à 2 éléments. Vérifier qu’il est iso-
morphe aux groupes suivants.
n o
Z2 ; S2 ; {1, −1} , × ; x 7→ x , x 7→ 1/x , ◦
( ! !) !
1 0 0 1
, ,×
0 1 1 0
3. Ecrire la table de composition d’un groupe à 3 éléments. Vérifier qu’il est iso-
morphe aux groupes suivants.
n o
Z3 ; {1, e2iπ/3 , e4iπ/3 } , × ; (1, 2, 3), (2, 3, 1), (3, 1, 2) , ◦
      

 1 0 0 0 0 1 0 1 0  
0 1 0 , 1 0 0 , 0 0 1  ,×
      
  
 

0 0 1 0 1 0 1 0 0 
31

4. Soit {e, a, b, c} , ∗ un groupe à 4 éléments, d’élément neutre e.
(a) Montrer qu’il existe au moins un élément, autre que l’élément neutre, qui
est son propre symétrique. On suppose désormais que b est son propre sy-
métrique.
(b) On suppose a ∗ c = c ∗ a = e. Remplir la table de composition du groupe.
Montrer qu’il est isomorphe aux groupes suivants.

Z4 ; {1, i, −1, −i} , ×
n o
(1, 2, 3, 4), (2, 3, 4, 1), (3, 4, 1, 2), (4, 1, 2, 3) , ◦
( ! ! ! !) !
1 0 0 −1 −1 0 0 1
, , , ,×
0 1 1 0 0 −1 −1 0
(c) On suppose a ∗ a = c ∗ c = e. Remplir la table de composition du groupe.
Montrer qu’il est isomorphe aux groupes suivants.

Z2 × Z2 ; P({x, y}) , 4
n o
1 2 3 4 , 1 2 4 3 , 2 1 3 4 , 2 1 4 3 ,◦
( ! ! ! !) !
1 0 0 1 −1 0 0 −1
, , , ,×
0 1 1 0 0 −1 −1 0
(d) Vérifier que l’on est toujours dans le cas de la question (4b) ou dans le cas
de la question (4c).
5. Vérifier que tous les groupes de cet exercice sont abéliens.
Exercice 8. On considère les éléments suivants de S5 .
! !
1 2 3 4 5 1 2 3 4 5
σ= et % =
3 4 2 5 1 5 4 1 2 3
Calculer les puissances successives et déterminer l’ordre de σ et %, ainsi que de σ%, %σ,
σ%−1 et %−1 σ.
Exercice 9. On considère un pentagone régulier : pour fixer les idées, l’ensemble des
points du plan complexe dont des sommets ont pour affixes les racines cinquièmes de
l’unité, soit n o
P = e2ikπ/5 , k = 0, 1, 2, 3, 4 .
Le but de l’exercice est d’étudier le groupe (pour la composition des applications) des
isométries du plan complexe qui laissent invariant ce pentagone. On notera % la rotation
de centre l’origine et d’angle 2π/5, et σ la symétrie qui à un nombre complexe associe
son conjugué.
% : z 7−→ ze2iπ/5 ; σ : z 7−→ z
32
1. Vérifier que % et σ laissent invariant l’ensemble P .

2. Vérifier que les puissances successives de % sont des rotations dont on donnera
l’angle, et déterminer l’ordre de %.
3. Pour n = 0, . . . , 4, montrer que σ%n et %n σ sont des symétries par rapport à un
axe passant par l’origine, dont on donnera l’angle par rapport à l’axe réel.
4. Quel est l’ordre d’une symétrie ?
5. Montrer que le produit de deux des symétries de la question 3 est une puissance
de %.
6. Montrer que le plus petit groupe contenant % et σ possède 10 éléments.
Exercice 10. On rappelle que Zn est le groupe des entiers de 0 à n − 1, muni de
l’addition modulo n.
1. Montrer que l’ordre de 1 dans Zn vaut n.
2. Montrer que l’ordre de k dans Zn vaut n si et seulement si k est premier avec n.
3. Si k est un diviseur de n, montrer que l’ordre de k est le quotient de n par k.
4. Soit (G, ∗) un groupe quelconque. On suppose que G contient un élément a d’ordre
n. On note f l’application de {0, . . . , n−1} dans G qui à 0 associe l’élément neutre
de G et à k > 1 associe la puissance k-ième de a dans G. Montrer que f est un
isomorphisme de groupes entre Zn et hai.
Exercice 11.
1. Soit S un ensemble quelconque et E = {0, 1}S l’ensemble des applications de S
dans {0, 1}. On munit E de l’addition modulo 2 des images : pour tout f, g ∈ E,
f ⊕ g est l’application de S dans {0, 1} définie par :
(
1 si f (x) 6= g(x)
f ⊕ g(x) =
0 si f (x) = g(x)
Montrer que (E, ⊕) est un groupe abélien, dans lequel chaque élément est son
propre symétrique.
2. Soit F = P(S) l’ensemble des parties de S. On munit F de la différence symé-
trique ensembliste. On considère l’application φ, de F dans E qui à une partie
de S associe sa fonction indicatrice :
φ : A ∈ P(S) 7−→ IA ,
où pour tout x ∈ S, IA (x) = 1 si x ∈ A et IA (x) = 0 sinon.
Montrer que φ est un isomorphisme de E vers F , pour les lois ⊕ et 4. En
déduire que (F, 4) est un groupe abélien, dans lequel chaque élément est son
propre symétrique.
Dans toute la suite, G désigne un groupe dans lequel chaque élément est son
propre symétrique.
33
3. Montrer que G est abélien.

4. Soit a un élément quelconque de G, différent de l’élément neutre. On définit la
relation ∼ sur G par :

∀x, y ∈ G , x ∼ y ⇐⇒ x = y ou x = ay
Montrer que ∼ est une relation d’équivalence sur G. Montrer que chaque classe
d’équivalence a deux éléments.
5. On définit la loi ∗ sur l’ensemble-quotient G/ ∼ par :
∀x, y ∈ G , cl(x) ∗ cl(y) = cl(xy).
Montrer que ∗ est une loi de composition interne sur G/ ∼, et que G/ ∼ muni de
∗ est un groupe abélien, dans lequel chaque élément est son propre symétrique.
6. On suppose que G est fini. Déduire des questions précédentes que le cardinal de
G est une puissance de 2.
Exercice 12. On considère les applications suivantes, de R \ {0, 1} dans lui-même.

1
f1 : x 7→ x ; f2 : x 7→ 1 − x ; f3 : x 7→
1−x
1 x x−1
f4 : x 7→ ; f5 : x 7→ ; f6 : x 7→
x x−1 x
On munit l’ensemble E = {f1 , f2 , f3 , f4 , f5 , f6 } de la composition des applications.
1. Écrire la table de composition de (E, ◦).
2. Montrer que G = (E, ◦) est un groupe.
3. Est-ce un groupe abélien ?
4. Déterminer tous les sous-groupes de G.
5. Déterminer l’ordre de chacun des éléments de G.
6. Quels sont les éléments de hf2 i ?
7. Quels sont les éléments de hf3 i ?
Exercice 13. Soient (E, ∗) et (F, ·) deux groupes. On munit l’ensemble produit E × F
de la loi de composition definie par :
∀(x, y), (x0 y 0 ) ∈ E × F , (x, y) (x0 , y 0 ) = (x ∗ x0 , y · y 0 )
1. Montrer que (E × F, ) est un groupe.

2. Soit E 0 un sous-groupe de E, F 0 un sous-groupe de F . Montrer que E 0 × F 0 est
un sous-groupe de E × F , muni de la loi .
34
Exercice 14. Montrer que les ensembles suivants d’applications de C dans C, munis de
la loi de composition des applications, sont des groupes.
n o
1. z 7→ z + t , t ∈ Z
n o
2. z 7→ z + t , t ∈ C
n o
3. z 7→ eiθ z , θ ∈ R
n o
4. z 7→ sz + t , s ∈ C∗ , t ∈ C
az + b

5. z 7→ , (a, b, c, d) ∈ C4 , ad − bc 6= 0
cz + d
Exercice 15. Soit G un sous-groupe additif de (R, +). On suppose que G 6= {0}.
1. Montrer que G ∩ R+∗ possède une borne inférieure, que l’on notera b.
2. Montrer que b ∈ G.
3. On suppose b > 0. Montrer que G = bZ.
4. On suppose b = 0. Montrer que si x et y sont deux réels tels que x < y, l’intervalle
]x, y[ contient au moins un élément de G (on dit que G est dense dans R).
√
5. Montrer que l’ensemble { m + n 2 , (n, m) ∈ Z2 } muni de l’addition
√ est un sous-
groupe de (R, +), et qu’il est dense dans R (on rappelle que 2 est irrationnel).
Exercice 16. Soit n > 1 un entier. On définit une multiplication ⊗ sur Zn en convenant
que i ⊗ j est l’unique entier 0 6 k 6 n − 1 tel que ij − k est divisible par n.
1. Montrer que (Zn , ⊕, ⊗) est un anneau.
2. Montrer que (Zn , ⊕, ⊗) est un corps si et seulement si n > 2 et n est premier.
Exercice 17. Montrer que l’application de C dans C qui à un nombre complexe associe
son conjugué est un isomorphisme de corps : c’est une bijection, et un morphisme à la
fois pour l’addition et la multiplication.
√
Exercice 18. On note Z[ 2] l’ensemble de réels suivant :
√ n √ o
Z[ 2] = m + n 2 , m, n ∈ Z .
√
1. Montrer que Z[ 2], muni de l’addition et de la multiplication des réels, est un
sous-anneau de R.
√ √
2. On considère l’application φ, de Z[ 2] dans lui-même, qui à m + n 2 associe
√ √
φ(m + n 2) = m − n 2.
√
Montrer que φ est un automorphisme de l’anneau (Z[ 2], +, ×) (c’est une bijec-
tion, et un morphisme pour chacune des deux lois).
35
√
3. Pour √tout x ∈ Z[ 2], on pose N (x) = xφ(x). Montrer que N est une application
de Z[ 2] dans Z, qui est un morphisme pour la multiplication.
√
4. Démontrer que x est un élément inversible de Z[ 2] si et seulement si N (x) = ±1.
√ √ √
5. Vérifier que 3 + 2 2 et −3 + 2 2 sont inversibles dans Z[ 2].
Exercice 19. On considère les deux matrices suivantes.
! !
0 1 0 0
U= et V = .
0 0 1 0
1. Calculer les produits U V et V U .
2. En déduire que M2 (R) est un anneau non commutatif et non intègre.
3. Étendre ce résultat à l’anneau Mn (A) des matrices de taille n > 2 sur un anneau
A quelconque.
Exercice 20.
1. Soit S un ensemble de cardinal au moins 2 et E = {0, 1}S l’ensemble des appli-
cations de S dans {0, 1}. On munit E de l’addition modulo 2 des images et de
leur multiplication : pour tout f, g ∈ E, f ⊕ g et f ⊗ g sont les applications de S
dans {0, 1} définies par :
( (
1 si f (x) 6= g(x), 1 si f (x) = g(x) = 1,
f ⊕ g(x) = et f ⊗ g(x) =
0 si f (x) = g(x), 0 sinon.
Montrer que (E, ⊕, ⊗) est un anneau commutatif.
2. Soit I l’application constante égale à 1. Soit f une application non constante de
S dans {0, 1}. Calculer f ⊗ (I ⊕ f ). En déduire que (E, ⊕, ⊗) n’est pas un anneau
intègre.
3. Soit F = P(S) l’ensemble des parties de S. On munit F de la différence symé-
trique et de l’intersection ensemblistes. On considère l’application φ de F dans
E qui à une partie de S associe sa fonction indicatrice :
φ : A ∈ P(S) 7−→ IA ,
où, pour tout x ∈ S, IA (x) = 1 si x ∈ A et IA (x) = 0 sinon. Montrer que φ est
un isomorphisme de (E, ⊕) vers (F, 4), et également un isomorphisme de (E, ⊗)
vers (F, ∩). En déduire que (F, 4, ∩) est un anneau commutatif non intègre.
2.3 QCM
rapporte 2 points.
36
Question 1. La relation R est une relation d’équivalence sur N.

A ∀n, m ∈ N , nRm ⇐⇒ n|m.
B ∀n, m ∈ N , nRm ⇐⇒ n2 = m2 .
C ∀n, m ∈ N , nRm ⇐⇒ n2 + m2 = 2nm + 2n.
D ∀n, m ∈ N , nRm ⇐⇒ n2 − m2 = 2nm + 2n.
E ∀n, m ∈ N , nRm ⇐⇒ n2 + m2 = 2nm.
Question 2. La relation R est une relation d’ordre sur N.

A ∀n, m ∈ N , nRm ⇐⇒ n − m > 1.
B ∀n, m ∈ N , nRm ⇐⇒ n − m 6 1.
C ∀n, m ∈ N , nRm ⇐⇒ ∃k ∈ N , m2 = k − n2 .
D ∀n, m ∈ N , nRm ⇐⇒ ∃k ∈ N , m2 = k + n2 .
E ∀n, m ∈ N , nRm ⇐⇒ ∃k ∈ N , m = kn.
Question 3.
A La division est une loi de composition interne dans R∗ .
B La division ne possède pas d’élément neutre dans R∗ .
C La division est associative dans R∗
D La division est commutative dans R∗
E Tout élément de R∗ est son propre inverse pour la division.
Question 4. On note ⊕ l’addition des entiers modulo 6.

A ({2, 4}, ⊕) est un groupe.
B ({0, 1, 2}, ⊕) est un groupe.
C ({0, 2, 4}, ⊕) est un groupe.
D ({0, 3}, ⊕) est un groupe.
E ({0, 2, 3}, ⊕) est un groupe.
Question 5. On
√ considère des ensembles de réels, munis de l’addition.
A ({a + b 5 , a, b ∈ N}, +) est un groupe.
√
B ({a + b 5 , a, b ∈ Z}, +) est un groupe.
√
C ({5a + b 5 , a, b ∈ Z}, +) est un groupe.
√
D ({5(a + b 5) , a, b ∈ N}, +) est un groupe.
√
E ({a + b 5 , a ∈ Z , b ∈ N}, +) est un groupe.
Question 6. On considère des ensembles de complexes, munis de la multiplication.

A (C, ×) est un groupe.
B ({1, −1}, ×) est un groupe.
C ({i, −i}, ×) est un groupe.
D ({0, 1, −1}, ×) est un groupe.
E ({1, i, −1, −i}, ×) est un groupe.
37
Question 7. On considère le groupe (C∗ , ×) formé de l’ensemble des nombres complexes

non nuls, muni de la multiplication.
A L’application qui à z ∈ C∗ associe z 2 est un automorphisme de (C∗ , ×).
B L’application qui à z ∈ C∗ associe 2z est un morphisme de (C∗ , ×).
C L’application qui à z ∈ C∗ associe 1/z 2 est un morphisme de (C∗ , ×).
D L’application qui à z ∈ C∗ associe z/z est un automorphisme de (C∗ , ×).
E L’application qui à z ∈ C∗ associe 1/z est un automorphisme de (C∗ , ×).
Question 8.
A L’application qui à x ∈ R associe e(1+i)x est un morphisme de (R, +) dans
(C∗ , ×).
B L’application qui à x ∈ R associe (1 + i)x est un morphisme de (R, +) dans
(C, +).
C L’application qui à x ∈ R associe (1 + i)x est un morphisme de (R, +) dans
(C∗ , ×).
D L’application qui à x ∈ R associe xeix est un morphisme de (R, +) dans (C, +).
E L’application qui à x ∈ R associe (x + i)eix est un morphisme de (R, +) dans
(C∗ , ×).
Question 9.
√ √
A ({a 2 + b 3 , a, b ∈ Z}, +, ×) est un anneau.
√
B ({2a 3 , a ∈ Z}, +, ×) est un anneau.
√
C ({a + b 3 , a, b ∈ Z}, +, ×) est un anneau.
√
D ({2a + b 3 , a, b ∈ Z}, +, ×) est un anneau.
√ √ √
E ({a + b 2 + c 3 + d 6 , a, b, c, d ∈ Z}, +, ×) est un anneau.
Question 10. On considère (Z6 , ⊕, ⊗), c’est-à-dire l’ensemble {0, 1, 2, 3, 4, 5} muni de
l’addition modulo 6 et de la multiplication modulo 6.
A Tout élément non nul de Z6 possède un inverse pour ⊗.
B (Z6 , ⊕, ⊗) est un corps.
C L’élément 4 est son propre inverse pour la multiplication.
D L’élément 5 est son propre inverse pour la multiplication.
E (Z6 , ⊕, ⊗) est un anneau commutatif.
Réponses : 1–BE 2–DE 3–AB 4–CD 5–BC 6–BE 7–CE 8–AB 9–CE 10–DE
2.4 Devoir
répondu.
Questions de cours : Soit G un groupe fini et H un sous-groupe de G.
38
1. Soit ∼ la relation définie sur G par :
∀a, b ∈ G , a ∼ b ⇐⇒ ab−1 ∈ H .
Montrer que ∼ est une relation d’équivalence sur G.

2. Soit a un élément de G et h un élément de H. Montrer que ha ∼ a.
3. Montrer que si a et b sont deux éléments de G tels que a ∼ b, alors il existe un
élément h de H tel que b = ha.
4. Soit a un élément quelconque de G. On note cl(a) sa classe d’équivalence pour
la relation ∼. Soit f l’application qui à un élément h de H associe l’élément ha.
Montrer que f est une bijection de H dans cl(a).
5. En déduire que le cardinal de H divise le cardinal de G.
Exercice 1 : Soient r et s les applications de C dans lui-même définies comme suit.
r s
C −→ C C −→ C
z 7−→ r(z) = iz z 7−→ s(z) = z .
Dans tout l’exercice, on identifiera l’application f de C dans C, avec l’application du

plan complexe dans lui-même, qui à un point M d’affixe z associe le point M 0 d’affixe
f (z).
1. On note r2 et r3 les composées r2 = r ◦ r et r3 = r ◦ r ◦ r. Interpréter comme
transformations géométriques du plan complexe les applications r, r2 , r3 , s, s ◦ r,
s ◦ r2 , s ◦ r3 .
2. On note e l’application indentité du plan complexe. Montrer que l’ensemble
{e, r, r2 , r3 , s, s ◦ r, s ◦ r2 , s ◦ r3 } ,
muni de la composition des applications est un groupe, dont on donnera la table

de composition. Il sera noté G.
3. Montrer que {e, r2 }, {e, s}, {e, s ◦ r}, {e, s ◦ r2 }, {e, s ◦ r3 }, sont des sous-groupes
de G, tous isomorphes à Z2 .
4. Montrer que {e, s, r2 , s ◦ r2 } est un sous-groupe de G, isomorphe à Z2 × Z2 .
5. Montrer que {e, r, r2 , r3 } est un sous-groupe de G, isomorphe à Z4 .
6. On note :
• A1 le point du plan complexe d’affixe 1 + i,
• A2 le point du plan complexe d’affixe −1 + i,
• A3 le point du plan complexe d’affixe −1 − i,
• A4 le point du plan complexe d’affixe 1 − i,
Vérifier que chaque élément du groupe G laisse invariant l’ensemble
{A1 , A2 , A3 , A4 }.
39
7. Étant donné un élément f du groupe G, on lui associe la permutation ϕ(f ) de

{1, 2, 3, 4} définie par :
∀i, j ∈ {1, 2, 3, 4} , ϕ(f )(i) = j ⇐⇒ f (Ai ) = Aj .
On définit ainsi une application ϕ de G dans S4 . Montrer que ϕ est un morphisme

de groupes.
8. Écrire in extenso l’image par ϕ de chacun des éléments de G.
9. Soit H l’image de G par ϕ. Montrer que H est un sous-groupe de S4 , isomorphe
à G.
10. On note :
• B1 le point du plan complexe d’affixe 1 + i,
• B2 le point du plan complexe d’affixe −1 − i,
• B3 le point du plan complexe d’affixe 1 − i,
• B4 le point du plan complexe d’affixe −1 + i,
Reprendre les questions 6, 7, 8, 9, en remplaçant A1 , A2 , A3 , A4 par B1 , B2 , B3 , B4 .
Exercice 2 : On note A l’ensemble de réels suivant :
n √ o
A = m + n 6 , m, n ∈ Z .
1. Montrer que (A, +, ×) (ensemble A muni de l’addition et de la multiplication des

réels), est un sous-anneau de (R, +, ×).
√
2. On considère l’application φ, de A dans lui-même, qui à m + n 6 associe :
√ √
φ(m + n 6) = m − n 6 .
Montrer que φ est un automorphisme de l’anneau (A, +, ×) (c’est-à-dire une

bijection, et un morphisme pour chacune des deux lois).
3. Pour tout x ∈ A, on pose N (x) = xφ(x). Montrer que N est une application de
A dans Z, qui est un morphisme pour la multiplication.
4. Démontrer que x est un élément inversible de A si et seulement si N (x) = ±1.
√
5. Vérifier que 5 + 2 6 est inversible dans A et calculer son inverse.

1. La relation ∼ est :
• réflexive :
Soit a un élément de G. Le produit aa−1 = e appartient à H (tout sous-groupe
de G contient l’élément neutre). Donc a ∼ a.
40
• symétrique :
Soient a et b deux éléments de G. Supposons a ∼ b. Alors ab−1 appartient à H.
Donc l’inverse de ab−1 appartient aussi à H. Or cet inverse est (ab−1 )−1 = ba−1 .
Donc b ∼ a.
• transitive :
Soient a, b, c trois éléments de G. Supposons a ∼ b et b ∼ c. Les deux éléments
ab−1 et bc−1 appartiennent à H, donc leur produit aussi. Ce produit est :
(ab−1 )(bc−1 ) = ac−1 ). Donc a ∼ c.
Donc ∼ est une relation d’équivalence sur G.
2. L’inverse de ha est a−1 h−1 . Donc a(ha)−1 = (aa−1 )h−1 = h−1 ∈ H. Donc a ∼ ha.
3. Si a ∼ b, ab−1 ∈ H. Notons h l’inverse de cet élément : h = (ab−1 )−1 = ba−1 . Il
appartient aussi à H. On a bien ha = ba−1 a = b.
4. D’après la question 2, pour tout a ∈ G, a ∼ ha, donc f (h) ∈ cl(a). Soit b un
élément de cl(a), c’est -à-dire tel que a ∼ b. D’après la question 3, il existe h ∈ H
tel que b = ha, donc b = f (h) : l’application f est surjective.
Montrons que f est injective. Soient h1 et h2 deux éléments de H tels que f (h1 ) =
f (h2 ). Alors h1 a = h2 a, donc h1 aa−1 = h2 aa−1 , soit h1 = h2 .
L’application f est donc une bijection de H dans cl(a).
5. S’il existe une application bijective entre deux ensembles finis, alors ces deux
ensembles ont même cardinal. D’après la question 4, pour tout a ∈ G, le cardinal
de cl(a) est égal au cardinal de H. Or l’ensemble des classes d’équivalence pour ∼
constitue une partition de E. Donc le cardinal de E est la somme des cardinaux
des classes d’équivalence, qui sont tous égaux au cardinal de H. Le cardinal de
E est donc un multiple entier du cardinal de H.
Exercice 1 :
1. Soit O l’origine du plan complexe.
• r est la rotation de centre O et d’angle π/2.
• r2 est la rotation de centre O et d’angle π.
• r3 est la rotation de centre O et d’angle 3π/2 (ou −π/2).
• s est la symétrie par rapport à l’axe horizontal.
• s ◦ r est la symétrie par rapport à la droite d’équation y = −x (seconde
bissectrice).
• s ◦ r2 est la symétrie par rapport à l’axe vertical.
• s ◦ r3 est la symétrie par rapport à la droite d’équation y = x (première
bissectrice).
2. Pour montrer que G est un groupe, il suffit de vérifier que c’est un sous-groupe
de l’ensemble S(C) des bijections du plan complexe dans lui-même. L’ensemble
proposé est non vide. Observons ensuite que r et r3 sont inverses l’un de l’autre,
41
et que chacun des autres éléments de G est son propre inverse. La table de
composition ci-dessous montre que le produit de deux éléments quelconques de
G est encore dans G. Donc G est un sous-groupe de S(C). Dans cette table, nous
omettons les signes ◦ par souci de clarté.
◦ e r r2 r3 s sr sr2 sr3
e e r r2 r3 s sr sr2 sr3
r r r2 r3 e sr3 s sr sr2
r2 r2 r3 e r sr2 sr3 s sr
r3 r 3
e r r2 sr sr2 sr3 s
s s sr sr2 sr3 e r r2 sr3
sr sr sr2 sr3 s r3 e r r2
sr2 2
sr sr 3
s sr r 2
r 3
e r
sr3 sr3 s sr sr2 r r2 r3 e
3. Nous le montrons pour {e, r2 }, le raisonnement est identique pour les 4 autres.
Dans la mesure où r2 est son propre inverse, {e, r2 } est bien un sous-groupe de
G. L’application qui à e associe 0 et à r2 associe 1 est une bijection, et c’est un
morphisme pour la loi ◦ au départ, et pour l’addition modulo 2 à l’arrivée. Il
suffit pour cela de s’assurer que les tables de composition correspondent.
◦ e r2 + 0 1
e e r2 0 0 1
r2 r2 e 1 1 0
4. Ici encore, le plus simple est de définir la bijection, puis de vérifier que c’est
un morphisme pour les deux lois en comparant les tables de composition. Re-
marquons que l’existence d’un isomorphisme entre un sous-ensemble de G et un
groupe connu, nous dispense de montrer que ce sous-ensemble est effectivement
un sous-groupe. Comme bijection nous choisissons l’application ϕ, définie par :
ϕ(e) = (0, 0) , ϕ(s) = (0, 1) , ϕ(r2 ) = (1, 0) , ϕ(s ◦ r2 ) = (1, 1) .
◦ e s r2 sr2 + 00 01 10 11
e e s r2 sr2 00 00 01 10 11
s s e sr2 r2 01 01 00 11 10
r2 r2 sr2 e s 10 10 11 00 01
sr2 2
sr r 2
s e 11 11 10 01 00
5. Même technique ; la bijection est définie par :
ϕ(e) = 0 , ϕ(r) = 1 , ϕ(r2 ) = 2 , ϕ(r3 ) = 3 .
42
◦ e r r2 r3 + 0 1 2 3
e e r r2 r3 0 0 1 2 3
r r r2 r3 e 1 1 2 3 0
r2 r2 r3 e r 2 2 3 0 1
r3 r3 e r r2 3 3 0 1 2
6. Vérifions-le pour r et pour s.
r(A1 ) = A2 , r(A2 ) = A3 , r(A3 ) = A4 , r(A4 ) = A1 .
s(A1 ) = A4 , s(A2 ) = A3 , s(A3 ) = A2 , s(A4 ) = A1 .
Puisque r et s laissent invariant l’ensemble {A1 , A2 , A3 , A4 }, c’est aussi le cas pour
toute transformation du plan composée de r et s, donc pour tous les éléments du
groupe G.
7. Soient f et g deux éléments du groupe G. Soient σ et τ les deux permutations
de S4 telles que pour tout i = 1, 2, 3, 4 :
f (Ai ) = Aσ(i) et g(Ai ) = Aτ (i) .
Alors, pour tout i = 1, 2, 3, 4,
f ◦ g(Ai ) = f (g(Ai )) = f (Aτ (i)) = Aσ(τ (i)) = Aσ◦τ (i) .
Donc ϕ(f ◦g) = σ◦τ = ϕ(f )◦ϕ(g). Donc ϕ est un morphisme pour la composition
des applications dans G au départ, et pour la composition des permutations à
l’arrivée.
8. Voici le tableau donnant l’image par ϕ des éléments de G.
f ϕ(f ) f ϕ(f )
e (1, 2, 3, 4) s (4, 3, 2, 1)
r (2, 3, 4, 1) sr (3, 2, 1, 4)
r2 (3, 4, 1, 2) sr2 (2, 1, 4, 3)
r3 (4, 1, 2, 3) sr3 (1, 4, 3, 2)
9. Puisque ϕ est un morphisme, H est un sous-groupe de G. Le tableau de la question
précédente liste tous les éléments de H, qui sont tous distincts. Donc la restriction
de ϕ à H à l’arrivée est une bijection : ϕ est donc un isomorphisme de G sur H.
10. Les deux ensembles {B1 , B2 , B3 , B4 } et {A1 , A2 , A3 , A4 } sont les mêmes. Les deux
sont invariants par G. Le raisonnement pour montrer que ϕ est un morphisme
est identique. Par contre les permutations images des éléments de G ne sont pas
les mêmes.
f ϕ(f ) f ϕ(f )
e (1, 2, 3, 4) s (3, 4, 1, 2)
r (4, 2, 3, 1) sr (2, 1, 3, 4)
r2 (2, 1, 4, 3) sr2 (4, 3, 2, 1)
r3 (3, 2, 4, 1) sr3 (1, 2, 4, 3)
43
On démontre de la même façon que ϕ est un isomorphisme de G sur son image.

On obtient ainsi un nouveau sous-groupe de S4 , isomorphe au précédent.
Exercice 2 :
1. L’ensemble A est non vide. Il suffit de vérifier que A est un sous-groupe pour
l’addition, et que la multiplication est stable. Soient m, n, m0 , n0 quatre éléments
de Z. √ √ √
(m + n 6) − (m0 + n0 6) = (m − m0 ) + (n − n0 ) 6 .
√ √
Donc (m + n 6) − (m0 + n0 6) ∈ A.
√ √ √
(m + n 6) × (m0 + n0 6) = (mm0 + 6nn0 ) + (mn0 + m0 n) 6 .
√ √
Donc (m + n 6) × (m0 + n0 6) ∈ A.
2. Observons d’abord que pour tout élément a de A, ϕ(ϕ(a)) = a. Donc ϕ est une
bijection, puisque tout élément de A a pour antécédent ϕ(a).
Montrons maintenant que ϕ est un morphisme pour l’addition.
√ √ √
ϕ((m + n 6) + (m0 + n0 6)) = ϕ((m + m0 ) + (n + n0 ) 6)
√
= (m + m0 ) − (n + n0 ) 6
√ √
= (m − n 6) + (m0 − n0 6)
√ √
= ϕ(m + n 6) + ϕ(m0 + n0 6) .
Montrons enfin que ϕ est un morphisme pour la multiplication.
√ √ √
ϕ((m + n 6) × (m0 + n0 6)) = ϕ((mm0 + 6nn0 ) + (mn0 + m0 n) 6)
√
= (mm0 + 6nn0 ) − (mn0 + m0 n) 6
√ √
= (m − n 6) × (m0 − n0 6)
√ √
= ϕ(m + n 6) × ϕ(m0 + n0 6) .
√
3. Soit a = m + n 6 un élément quelconque de A.
√ √
N (a) = aϕ(a) = (m + n 6) × (m − n 6) = m2 − 6n2 .
Donc N est bien une application de A dans Z. Montrons que c’est un morphisme
pour la multiplication. Soient a et a0 deux éléments de A.
N (aa0 ) = aa0 ϕ(aa0 ) = aa0 ϕ(a)ϕ(a0 ) = (aϕ(a))(a0 ϕ(a0 )) = N (a)N (a0 ) ,
en utilisant le fait que ϕ est un morphisme pour la multiplication.
4. Si N (x) = xϕ(x) = 1, alors ϕ(x) est inverse de x, et si N (x) = xϕ(x) = −1,
alors −ϕ(x) est inverse de x : la condition est suffisante. Montrons qu’elle est
nécessaire. Soit x un élément inversible de A : il existe y tel que xy = 1. Mais
comme N est un morphisme pour la multiplication, N (x)N (y) = 1. Or N (x) et
N (y) sont des entiers. Les seuls éléments de Z inversibles pour la multiplication
sont 1 et −1. D’où le résultat.
44
5. Il suffit de calculer l’image par N , et d’appliquer le résultat de la question précé-

dente. √
N (5 + 2 6) = 25 − 24 = 1 .
√ √
L’inverse de 5 + 2 6 est 5 − 2 6.
45
3 Compléments
3.1 Le programme d’Erlangen
Le programme d’Erlangen est un programme de recherche publié par le mathémati-
cien allemand Felix Klein en 1872 dans un mémoire intitulé Vergleichende Betrachtun-
gen über neuere geometrische Forschungen, c’est-à-dire Étude comparée de différentes
recherches récentes en géométrie.
Felix Klein (1849-1925) naît le 25 avril 1849 à Düsseldorf en Rhénanie alors sous do-
mination prussienne, pendant des journées d’émeutes anti-prussiennes. Il sera toujours
très fier d’avoir pour date de naissance trois carrés de nombres premiers (52 , 22 et 432 ).
En juillet 1870, après avoir voulu faire des études de physique, Klein est déjà docteur en
mathématiques et il se trouve à Paris mais la guerre franco-allemande l’oblige à retour-
ner en Allemagne. Il sert un temps dans l’armée prussienne avant d’être nommé lecteur
à Göttingen en 1871. En 1872 (à l’âge de 23 ans !), Klein devient professeur à Erlangen
grâce à l’aide providentielle d’Alfred Clebsch (1833-1872, il était temps. . . ) qui voit
en lui l’un des futurs plus grands mathématiciens de son temps. En 1875, il épouse
Anne Hegel, la petite-fille du philosophe Georg Wilhelm Friedrich Hegel (1770-1831).
Installé à Göttingen de 1886 jusqu’à sa mort, Klein s’y consacre en particulier à faire
de la revue Mathematische Annalen un des journaux de mathématiques les plus connus
au monde. Par ailleurs, grâce à ses efforts et à ceux de quelques autres, les femmes sont
admises à Göttingen à partir de 1893. Klein supervise lui-même le premier doctorat
obtenu par une femme dans une université allemande, toutes disciplines confondues,
en l’occurrence la thèse de mathématiques de Grace Chisolm Young (1868-1944), une
étudiante anglaise d’Arthur Cayley (1821-1895) qui lui rendra hommage à sa mort.
Voici comment elle décrit ses rapports avec Klein au début de sa thèse :
Professor Klein’s attitude is this, he will not countenance the admission
of any woman who has not already done good work, and can bring proof
of the same in the form of degrees or their equivalent [. . . ] and further he
will not take any further steps till he has assured himself by a personal
interview of the solidity of her claims. Professor Klein’s view is moderate.
There are members of the Faculty here who are more eagerly in favour of
the admission of women and others who disapprove altogether.
Les premières découvertes importantes de Klein datent de 1870. En collabora-
tion avec le mathématicien norvégien Sophus Lie (1842-1899) qui lui avait présenté
le concept de groupes, Klein étudie les propriétés fondamentales des lignes asymp-
totiques sur la surface de Kummer. Klein et Lie en viennent ainsi à s’intéresser aux
courbes invariantes sous un groupe de transformations projectives.
En 1871, Klein montre que les géométries euclidienne et non-euclidienne sont des
cas particuliers d’une géométrie définie sur une surface projective. Un corollaire est que
les axiomes de la géométrie non euclidienne sont consistants si et seulement si ceux de
la géométrie euclidenne le sont, ce qui met fin à une controverse persistante autour des
46
géométries non euclidiennes.

À son arrivée à Erlangen en 1872, et comme c’est l’usage en pareil cas, Klein doit
prononcer un cours inaugural. Il rédige alors le texte qui deviendra connu sous le
nom de Programme d’Erlangen. Ce texte ne sera jamais donné comme cours puisque
Klein prononcera finalement un autre discours mais il influencera profondément le
développement et l’évolution de la géométrie et des mathématiques dans leur ensemble.
Klein y propose une vision unifiée de la géométrie et décrit en détails comment les
propriétés fondamentales d’une géométrie donnée se traduisent par l’action d’un groupe
de transformations. Son objectif est donc d’unifier les différentes géométries apparues
au cours du xixe siècle pour en dégager les points de similitude : la géométrie affine, la
géométrie projective, la géométrie euclidienne et la géométrie non euclidienne. La clef
de voûte de ce programme consiste à fonder la géométrie sur les notions d’actions de
groupe et d’invariants, un point de vue révolutionnaire à l’époque qui apparut parfois
comme une remise en question de la géométrie elle-même.
Il n’en est rien et le mathématicien, physicien et philosophe français Henri Poin-
caré (1854-1912) par exemple était arrivé de son côté, dès 1880 et sans connaître le
Programme de Klein, à la conclusion que toute géométrie se réduit fondamentalement
à l’étude d’un groupe de transformations. Poincaré était déjà si bien convaincu de
l’importance des idées de théorie des groupes en géométrie et pour toutes les mathé-
matiques que lors du passage de Sophus Lie à Paris en 1882 il n’hésite pas à lui déclarer
que la géométrie n’est que l’étude de certains groupes de transformations. Lie décrit
alors à Poincaré le Programme d’Erlangen de Klein. Encore aujourd’hui, la philoso-
phie du Programme influence de nombreux mathématiciens ainsi que des programmes
d’enseignement et de recherche. Cette vision est même devenue tellement banale dans
l’esprit des mathématiciens qu’il est difficile de juger de son importance, d’apprécier sa
nouveauté et de comprendre les oppositions à laquelle elle a dû faire face.
Notons que Klein est parfois surtout connu pour avoir le premier décrit en 1882 une
surface maintenant appelée bouteille de Klein. Ce nom résulte d’au moins une et peut-
être même de deux erreurs de traduction ! En effet, l’expression allemande Kleinsche
Fläche signifie surface de Klein et il y a eu confusion entre Fläche (surface) et Flasche
(bouteille). Cependant le terme fautif s’est imposé, y compris en allemand où l’on
utilise maintenant le terme Kleinsche Flasche (bouteille de Klein). Il semble même que
Kleinsche résulte d’une deuxième confusion, cette fois avec kleine (petite), de sorte que
la fameuse bouteille de Klein ne serait finalement qu’une petite surface. . . ce qui ne
l’empêche pas d’être un objet absolument remarquable !
Nous terminerons par une anecdote : le mathématicien et logicien Ernst Zermelo
(1871-1953) enseignait à Göttingen à un moment où « Herr Geheimrat » Felix Klein
régnait sur le légendaire département de mathématiques. Zermelo stupéfia ses étudiants
en leur proposant l’exercice suivant :
On peut ranger tous les mathématiciens de Göttingen en deux catégories :
dans la première catégorie sont ceux qui font ce que Felix Klein aime mais
qu’ils n’aiment pas ; dans la seconde catégorie sont ceux qui font ce qu’ils
47
aiment mais que Felix Klein n’aime pas. À quelle catégorie Felix Klein
appartient-il ?
Les étudiants étaient terrorisés par un tel sacrilège et aucun d’eux ne sut répondre. La
réponse de Zermelo était pourtant simple :
Felix Klein n’est donc pas un mathématicien.
La fin de l’anecdote est que Zermelo n’obtint jamais de poste de professeur à Göttingen.
3.2 Hamilton et les quaternions

On peut voir l’ensemble C des nombres complexes comme l’ensemble R2 des couples
de nombres réels, en identifiant a + ib et (a, b). La multiplication dans C correspond
alors à une façon de multiplier les couples de nombres réels :
(a, b) · (c, d) = (ac − bd, ad + bc).
Ce point de vue a été développé en 1835 par William Hamilton. Par la suite, il essaya
longuement et sans succès de multiplier des triplets de nombres réels de façon satis-
faisante mais il finit par réussir à multiplier des quadruplets, inventant ainsi en 1843
l’ensemble des quaternions, noté H en son honneur.
Sir William Rowan Hamilton (1805-1865), né à Dublin, fut à la fois un enfant
adopté et un enfant surdoué. À 13 ans, il parlait autant de langues que le nombre de
ses années : bien sûr la plupart des langues européennes mais aussi les langues persane,
arabe, hindoue, malaise, et le sanskrit. Il resta toute sa vie au Trinity College de Dublin,
où il avait été nommé professeur d’astronomie à l’âge de 22 ans. Calculateur génial,
il semble avoir pris grand plaisir toute sa vie durant à effectuer des multiplications
monstrueuses. À 10 ans, il découvre par accident une copie en latin des Éléments
d’Euclide et à 12 ans il dévore les Principia de Newton. Pendant l’été 1822, à 17 ans, il
étudie de manière systématique la Mécanique céleste de Laplace et y trouve une faute
sérieuse, qu’il réussit à corriger. Hamilton décide alors de se consacrer principalement
aux mathématiques, ce qui ne l’empêchera pas de fournir également d’importantes
contributions en optique et en mécanique.
Le but de Hamilton était donc d’étendre les propriétés des nombres complexes à des
dimensions supérieures, essentiellement sans succès. D’ailleurs Frobenius démontrera en
1877 qu’une telle structure ne pouvait pas exister pour l’ensemble des triplets. Hamilton
racontera plus tard que, dans la soirée du 16 octobre 1843, il marchait le long du Canal
royal de Dublin avec sa femme, en route vers une soirée, quand la solution pour des
quadruplets lui apparut soudain, sous la forme
i2 = j2 = k2 = ijk = −1,
et qu’il grava aussitôt ces équations au couteau dans une pile du pont le plus proche,
Broom Bridge. Depuis 1989, la National University d’Irlande organise un pèlerinage
48
Figure 3 – Broom Bridge à Dublin
depuis l’observatoire de Dunsink où Hamilton travaillait jusqu’à ce pont où malheureu-

sement, aucune trace de la formule gravée en 1843 ne demeure (par contre une plaque
commémore le geste de Hamilton).
Hamilton aboutit aux quaternions en imposant de respecter la multiplication des
modules et en conservant l’associativité mais, geste révolutionnaire pour l’époque, en
abandonnant la commutativité. Pour présenter l’algèbre H en termes modernes, rap-
pelons que le corps C des nombres complexes peut être représenté par l’algèbre des
matrices à coefficients réels de la forme
!
a −b
.
b a
Une façon de le voir est de représenter le nombre complexe a + bi par la transformation

de C dans C définie par z 7→ (a + bi) · z, transformation R-linéaire dont la matrice dans
la base (1, i) de l’espace vectoriel C sur R est précisément la matrice ci-dessus.
De même on représente un quaternion par une matrice complexe
!
a + bi −c − di
.
c − di a − bi
Cette fois, on considère la base (1, j) de l’espace vectoriel complexe H et il s’agit de la

matrice dans cette base de la transformation de H dans H définie par
h 7→ ((a + bi) + (c + di) · j) · h.
En effet, les formules de Broom Bridge impliquent également les relations
ij = k, ik = −j, ji = −k, jk = i, ki = j, kj = −i,
49
ce qui permet de compléter la « table de multiplication » de {1, i, j, k}. Tout quaternion

h peut donc s’écrire comme une combinaison linéaire à coefficients réels des vecteurs
de la base (1, i, j, k) de H sur R, soit h = a + bi + cj + dk avec (a, b, c, d) ∈ R4 , ou bien
comme une combinaison linéaire à coefficients complexes des vecteurs de la base (1, j)
de H sur C, soit h = z + wj avec (z, w) ∈ C2 .
Il est essentiel ici de considérer H comme un espace vectoriel sur C à droite sinon
la multiplication ainsi définie n’est pas C-linéaire. En particulier, pour identifier la
première colonne, on utilisera la relation
(a + bi) + (c + di)j = (a + bi) + j(c − di).
Cette découverte démontra la nécessité de travailler aussi avec des lois non commuta-
tives, une avancée radicale pour l’époque. Il faut se rappeler que vecteurs et matrices
faisaient encore partie du futur, mais Hamilton venait en quelque sorte d’introduire
avant l’heure le produit vectoriel et le produit scalaire des vecteurs.
On sait à présent que bien avant Hamilton, en 1748, le mathématicien et physicien
suisse Leonhard Euler (1707-1783) connaissait la règle de multiplication des quater-
nions, sous la forme du théorème des quatre carrés, ainsi que le mathématicien, astro-
nome et physicien allemand Carl Friedrich Gauss (1777-1855) en 1819. Hamilton quant
à lui passa le reste de sa vie à explorer cette notion car il pensait que sa découverte
allait révolutionner la physique mathématique. La postérité démentit ce pronostic et
porta un regard souvent sévère sur son invention. D’après le physicien mathématicien
et ingénieur écossais William Thomson alias Lord Kelvin (1824-1907) par exemple (oui,
le Kelvin des degrés Kelvin) :
Quaternions came from Hamilton after his really good work had been done,
and though beautifully ingenious, have been an unmixed evil to those who
have touched them in any way.
3.3 Les idéaux d’Emmy Noether

La théorie des anneaux et de leurs idéaux est un des nombreux produits de la
réflexion sur les équations diophantiennes, et leur cas particulier le plus célèbre, le
Dernier Théorème de Fermat. Au xixe siècle, on se rendit compte que pour étudier
l’équation xp + y p = z p et bien d’autres, il serait utile d’étendre à d’autres ensembles
de nombres que Z le théorème fondamental de l’arithmétique selon lequel on peut
décomposer tout nombre en produit de facteurs premiers. En premier lieu, viennent les
ensembles d’entiers cyclotomiques. Si p est un nombre premier, un entier cyclotomique
est une combinaison linéaire à coefficients entiers des racines p-ièmes de l’unité. Par
exemple pour p = 3 :
√ ! √ !
1 3 1 3
4−5 − +i +2 − +i .
2 2 2 2
50
Le rapport avec Fermat ? Tout simplement le fait que si z p = xp + y p et x, y, z sont

entiers, alors z p , xp et y p sont des produits d’entiers cyclotomiques. Par exemple :
p
xp = z p − y p =
Y
(z − rk y) ,
k=1
où les rk sont les racines p-ièmes de l’unité. En 1847, Lamé annonça avoir démontré le
théorème de Fermat, mais il supposait que tous les entiers cyclotomiques possédaient
une décomposition unique. Or en 1844, Kummer avait montré que ce n’était pas le cas.
Interprétant le fait que la décomposition ne soit pas unique comme l’absence de certains
facteurs premiers, il eut l’idée de les rajouter en les baptisant « nombres idéaux ». La
théorie des idéaux, formalisée plus tard par Dedekind, vise donc à étendre dans un
anneau quelconque la notion de facteur premier dans Z. Qu’est-ce qu’un idéal I dans
un anneau commutatif A ? C’est un sous-groupe pour l’addition, possédant en plus une
propriété de stabilité :
∀a ∈ A , ∀x ∈ I , ax ∈ I .
Dans Z, les idéaux sont les ensembles de multiples d’un même nombre. Petit à petit les
propriétés des anneaux permettant d’étendre les opérations de l’arithmétique prirent
forme, et la théorie des idéaux permit de généraliser à des ensembles de nombres quel-
conques les outils de l’arithmétique.
Emmy Noether 1 naît à Erlangen en 1882, d’un père mathématicien. Elle fait ses
études à Erlangen et y soutient une thèse sur la théorie des invariants en 1907. Après
sa thèse, personne ne s’oppose à ce qu’elle enseigne à Erlangen. . . à condition que ce
soit sous le nom de son père et sans recevoir de salaire ! Au printemps 1915, Hilbert
et Klein la font venir à Göttingen pour travailler sur les problèmes mathématiques
liés à la théorie de la relativité générale d’Einstein. Elle réfléchit aussi à des questions
d’algèbre plus théoriques, qui conduisent en 1921 à la publication de sa « Théorie des
idéaux dans les anneaux ». Elle y atteint une généralité, une simplicité, une efficacité
exceptionnelles, et ouvre la voie à une foule de travaux ultérieurs, au point qu’elle est
considérée comme la mère de l’algèbre moderne. Sa capacité exceptionnelle à abstraire
et à généraliser pour simplifier en se débarrassant des détails inessentiels allait de pair
avec une caractéristique profonde de sa personnalité. Elle ne s’est jamais préoccupée ni
de sa condition sociale, ni de ses revenus, ni de son confort matériel, ni même semble-
t-il de son aspect extérieur. À Göttingen, Hilbert et Klein étaient bien convaincus
que Emmy Noether méritait un poste de professeur. Hilbert disait : « Je ne vois pas
en quoi le sexe d’un candidat pourrait être un argument contre son recrutement en
tant qu’enseignant ; après tout, nous sommes une université, pas un établissement de
bains ! » Il fallut trois tentatives et l’intervention d’Albert Einstein lui-même, pour
qu’on lui accorde en 1922 le titre de plus bas niveau que l’on ait pu inventer, celui de
« professeur non officiel et extraordinaire », avec un salaire minimal. Certains glosèrent
1. Paul Dubreil : Emmy Noether Cahiers du séminaire d’histoire des mathématiques 7, pp. 15–27
(1986)
51
sur le fait qu’un professeur extraordinaire ne savait rien d’ordinaire et un professeur

ordinaire ne savait rien d’extraordinaire.
Mais en 1932 les nazis arrivent au pouvoir, et les juifs sont bientôt chassés de l’uni-
versité ; parmi eux bien sûr Emmy Noether. Lors d’un banquet à l’été 1933, le nouveau
ministre de l’éducation nazi demande à Hilbert : « Comment vont les mathématiques
à Göttingen maintenant qu’elles ont été débarrassées de leur influence juive ? ». Après
un instant de réflexion, Hilbert répond : « Des mathématiques à Göttingen ? Il n’y en
a plus. » Après avoir vainement tenté d’obtenir un travail à Moscou et Oxford, Emmy
Noether finit par obtenir un poste provisoire dans un « college » américain. Vu l’afflux
de scientifiques européens aux États-Unis, embaucher une femme, aux opinions libé-
rales et pacifistes de surcroît, ne coulait pas de source. Heureusement elle était bien
défendue, en particulier par Norbert Wiener :
She is one of the ten or twelve leading mathematicians of the present gene-
ration in the entire world. . . Of all the cases of German refugees, whether
in this country or elsewhere, that of Miss Noether is without doubt the first
to be considered.
Aux États-Unis, Emmy Noether poursuit son activité mathématique avec un rayon-
nement encore accru. Malheureusement elle décéde en avril 1935 d’une infection post-
opératoire. Voici le bel éloge paru le 4 mai 1935 dans le New York Times, sous le nom
d’Albert Einstein.
The efforts of most human-beings are consumed in the struggle for their
daily bread, but most of those who are, either through fortune or some
special gift, relieved of this struggle are largely absorbed in further impro-
ving their worldly lot. Beneath the effort directed toward the accumulation
of worldly goods lies all too frequently the illusion that this is the most
substantial and desirable end to be achieved ; but there is, fortunately, a
minority composed of those who recognize early in their lives that the most
beautiful and satisfying experiences open to humankind are not derived
from the outside, but are bound up with the development of the individual’s
own feeling, thinking and acting. The genuine artists, investigators and thin-
kers have always been persons of this kind. However inconspicuously the
life of these individuals runs its course, none the less the fruits of their en-
deavors are the most valuable contributions which one generation can make
to its successors.
Within the past few days a distinguished mathematician, Professor Emmy
Noether, formerly connected with the University of Göttingen and for the
past two years at Bryn Mawr College, died in her fifty-third year. In the
judgment of the most competent living mathematicians, Fräulein Noether
was the most significant creative mathematical genius thus far produced
since the higher education of women began. In the realm of algebra, in
which the most gifted mathematicians have been busy for centuries, she
52
discovered methods which have proved of enormous importance in the de-

velopment of the present-day younger generation of mathematicians. Pure
mathematics is, in its way, the poetry of logical ideas. One seeks the most
general ideas of operation which will bring together in simple, logical and
unified form the largest possible circle of formal relationships. In this effort
toward logical beauty spiritual formulas are discovered necessary for the
deeper penetration into the laws of nature.
Born in a Jewish family distinguished for the love of learning, Emmy Noe-
ther, who, in spite of the efforts of the great Göttingen mathematician,
Hilbert, never reached the academic standing due her in her own country,
none the less surrounded herself with a group of students and investiga-
tors at Göttingen, who have already become distinguished as teachers and
investigators. Her unselfish, significant work over a period of many years
was rewarded by the new rulers of Germany with a dismissal, which cost
her the means of maintaining her simple life and the opportunity to carry
on her mathematical studies. Farsighted friends of science in this country
were fortunately able to make such arrangements at Bryn Mawr College
and at Princeton that she found in America up to the day of her death
not only colleagues who esteemed her friendship but grateful pupils whose
enthusiasm made her last years the happiest and perhaps the most fruitful
of her entire career.
53
Arithmétique
Guère d’introduction tonitruante à faire, sinon pour souligner que ce chapitre a

le charme de n’utiliser comme notions admises que les notations de la théorie des
ensembles naïve et les connaissances évidentes sur les entiers, et qu’il présente donc
l’agrément de donner une image de démonstrations (que l’on espère) totalement cré-
dibles.
Table des matières

1 Cours 2
1.1 Nombres premiers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Division euclidienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 PGCD et PPCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 Lemme de Gauss et décomposition en facteurs premiers . . . . . . . . . 8
1.5 Sous-groupes de Z . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Congruences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7 Z/nZ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Entraînement 23
2.1 Vrai ou Faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Compléments 39
3.1 Abacistes contre algoristes . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2 Des grains de sable dans l’univers . . . . . . . . . . . . . . . . . . . . . 41
3.3 Les comptes binaires de l’Empereur de Chine . . . . . . . . . . . . . . . 43
3.4 Chasles contre Libri . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.5 Ils sont amicaux, parfaits. . . voire excessifs . . . . . . . . . . . . . . . 48
3.6 Le Théorème des Restes Chinois . . . . . . . . . . . . . . . . . . . . . . 49
3.7 Le Théorème de Ibn al-Haytham . . . . . . . . . . . . . . . . . . . . . 50
3.8 Diophante et Hypathie, tous deux d’Alexandrie . . . . . . . . . . . . . 52
3.9 Le Dernier Théorème de Fermat . . . . . . . . . . . . . . . . . . . . . . 53
3.10 Quatre siècles avant Fermat . . . . . . . . . . . . . . . . . . . . . . . . 57
3.11 Le grand plan de Sophie Germain . . . . . . . . . . . . . . . . . . . . . 58
3.12 Le Théorème de Fermat-Wiles . . . . . . . . . . . . . . . . . . . . . . . 61
13 février 2013
Maths en Ligne Arithmétique UJF Grenoble
3.13 Le code RSA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62

3.14 La course aux nombres premiers . . . . . . . . . . . . . . . . . . . . . . 63
3.15 La répartition des nombres premiers . . . . . . . . . . . . . . . . . . . . 65
1
1 Cours
1.1 Nombres premiers
On appelle entier (ou entier relatif, c’est-à-dire positif ou négatif) tout élément de
n o
Z= . . . , −3, −2, −1, 0, 1, 2, 3, . . .
Définition 1. On dit qu’un entier a est un multiple d’un entier b, ou que b est un
diviseur de a lorsqu’il existe un entier k tel que a = kb.
Définition 2. On dit qu’un entier p ≥ 2 est premier lorsqu’il possède pour seuls
diviseurs positifs 1 et lui-même.
On notera au passage qu’au hasard des définitions, on parlera parfois d’entiers

relatifs (les éléments de Z) et parfois d’entiers naturels (les éléments de N). Ce n’est
qu’exceptionnellement très significatif ; la principale fonction est d’être cohérent avec
le reste du monde. Ainsi, comme partout ailleurs, dans ce cours, le nombre 3 est un
nombre premier alors que −3 n’en est pas un. En revanche, les nombres négatifs étant
autorisés dans la définition de « diviseurs », l’entier 3 possède en tout et pour tout
quatre diviseurs (à savoir −3, −1,1 et 3).
Et tout de suite un joli théorème, qui remonte aux Éléments d’Euclide, écrits au
IIIème siècle avant notre ère (c’est la proposition 20 du livre IX).
Théorème 1. Il existe une infinité de nombres premiers.
Vous connaissez probablement déjà une démonstration, il en existe plusieurs qui

sont toutes bonnes à connaître, en voici une qui est très proche de celle du traité
d’Euclide lui-même.
Démonstration : Soit A l’ensemble des nombres premiers. A est une partie de N, et
est non vide car 2 est premier. On va supposer A finie et aboutir à une absurdité.
Supposons donc A finie. Dès lors que A est une partie finie de N, évidemment non
vide car 2 est premier, A possède un plus grand élément. Notons P ce plus grand
élément, le mystérieux « plus grand nombre premier ».
Considérons alors l’entier N = P ! + 1 (la factorielle de P , plus 1). Pour tout entier
k tel que 2 6 k ≤ P , comme k divise P ! et ne divise pas 1, k ne peut diviser N .
Tout diviseur de N , et en particulier tout diviseur premier de N , est donc strictement
supérieur à P .
Or tout entier, et par exemple N , possède au moins un diviseur premier (pourquoi ?
exercice. . . ). Mais alors, chacun de ces diviseurs premiers contredit la maximalité de
P . Absurdité !
2
1.2 Division euclidienne

Il s’agit de formaliser avec précision la bonne vieille division euclidienne, celle que
vous connaissez depuis l’école primaire.
Théorème 2. Soit a un entier (relatif) et b > 1 un entier strictement positif. Alors il

existe un couple (q, r) unique (d’entiers) vérifiant la double condition :
a = bq + r et 0 6 r < b.
Démonstration : On va prouver successivement l’existence et l’unicité de (q, r).

Existence de (q, r) : la démonstration se prête bien à discuter selon le signe de a.
Le cas où a > 0 est le cas contenant l’essentiel de la démonstration ; lorsque a < 0, on
ne peut utiliser mot à mot la même preuve, mais on se ramène alors sans mal au cas
intéressant déjà traité.
• Premier cas (le cas significatif) : si a > 0.
L’idée de la démonstration est de dire que le quotient de a par b est le plus grand
entier q tel que bq soit encore plus petit que a.
Introduisons donc l’ensemble A = {c ∈ N , bc 6 a}. L’ensemble A est un ensemble
d’entiers naturels ; il est non vide, car il contient 0. Il est fini : en effet soit d un entier
tel que d > a + 1 ; on a alors bd > b(a + 1) > a + 1 > a, donc d 6∈ A et ainsi A ne
contient que des entiers inférieurs ou égaux à a.
L’ensemble A possède donc un plus grand élément q. Posons r = a−bq. La première
condition sur (q, r) est alors évidemment vérifiée, c’est la seconde qui nécessite une
vérification.
Comme q ∈ A, par définition de A, on a bq 6 a. Donc r = a − bq > 0.
Comme q est maximal parmi les éléments de A, q + 1 6∈ A. Donc b(q + 1) > a, donc
r = a − bq < b.
L’existence est démontrée dans ce cas.
• Second cas (preuve sans imagination) : si a < 0.
Posons a0 = a(1 − b). Comme a < 0 et 1 − b 6 0, on obtient a0 > 0.
On peut donc, en appliquant le premier cas, faire la division euclidienne de a0 par
b ; notons (q 0 , r) le couple ainsi obtenu : on a alors a0 = bq 0 + r, avec en outre 0 6 r < b.
En réinjectant la définition de a0 , on écrit alors a − ba = bq 0 + r, donc a = b(q 0 + a) + r.
Si on pose q = q 0 + a, on constate qu’on a réussi la division euclidienne de a par b.
Unicité de (q, r) : soit (q1 , r1 ) et (q2 , r2 ) des couples vérifiant les deux conditions
exigées dans l’énoncé du théorème.
On déduit de a = bq1 + r1 = bq2 + r2 que b(q1 − q2 ) = r1 − r2 . Ainsi, r1 − r2 est un
multiple de b.
Des conditions 0 6 r1 et r2 < b, on déduit que −b < r1 − r2 .
3
Des conditions r1 < b et 0 6 r2 , on déduit que r1 − r2 < b.

Ainsi r1 − r2 est un multiple de b compris strictement entre −b et b. La seule
possibilité est que r1 − r2 soit nul. On en déduit r1 = r2 , puis, en allant reprendre
l’égalité b(q1 − q2 ) = r1 − r2 , que q1 = q2 .
1.3 PGCD et PPCM

Les deux théorèmes qui se suivent sont agréablement parallèles ; il est donc amusant
de constater que leurs preuves sont plus différentes qu’on ne pourrait s’y attendre. Il
est possible de les déduire l’un de l’autre, mais il est instructif de les prouver très
séparément. Vous verrez donc plusieurs preuves de l’un comme de l’autre.
Théorème 3. Soit a > 1 et b > 1 deux entiers. Alors il existe un unique entier m > 1
tel que pour tout entier c > 1,
c est un multiple de a et de b si et seulement si c est un multiple de m.
Théorème 4. Soit a > 1 et b > 1 deux entiers. Alors il existe un unique entier d > 1
tel que pour tout entier c > 1,
c divise a et b si et seulement si c divise d.
Ces théorèmes sont vendus avec deux compléments, le premier occasionnellement

utile, le second totalement fondamental.
Complément 1 Pour tous a et b, md = ab.
Complément 2 (Identité de Bézout)
Pour tous a et b, il existe deux entiers (relatifs) s et t tels que d = sa + tb.
Et tant qu’on y est avant de passer aux démonstrations :
Définition 3. Le plus petit multiple commun de deux entiers a et b est l’entier m

apparaissant dans l’énoncé du théorème 3.
Notation 1. Le plus petit multiple commun de a et b sera noté ppcm(a, b).
Définition 4. Le plus grand commun diviseur de deux entiers a et b est l’entier d

apparaissant dans l’énoncé du théorème 4.
Notation 2. Le plus grand commun diviseur de a et b sera noté pgcd(a, b).
Première démonstration du théorème 3

Cette démonstration est la plus élémentaire ; elle consiste à choisir pour m le mul-
tiple commun de a et b le plus « petit » au sens de la relation habituelle ≤, puis à
4
vérifier qu’il marche. La preuve est en deux parties : d’abord l’existence de m (partie
significative) puis son unicité (partie très facile).
Existence de m
Introduisons l’ensemble A formé des entiers strictement positifs simultanément mul-
tiples de a et de b. L’ensemble A n’est pas vide, puisqu’il contient l’entier ab. Il admet
donc un plus petit élément m. On va vérifier que cet entier m convient.
Pour faire cette vérification, soit un entier n > 1 ; nous avons désormais à montrer
une équivalence, distinguons méthodiquement les deux sens.
• Preuve de l’implication directe : Supposons donc que n est un multiple commun
de a et b, et montrons que n est un multiple de m. Pour ce faire, effectuons la division
euclidienne de n par m, soit n = mq + r, avec 0 6 r < m. Comme n et m sont des
multiples de a, r = n − mq aussi ; de même avec b. Ainsi r est un multiple commun
de a et b. Si r était un entier strictement positif, vu l’inégalité r < m il contredirait la
minimalité de m. C’est donc que r = 0 et donc que n est un multiple de m.
• Preuve de l’implication réciproque : Supposons ici que n est un multiple de m.
Comme m est lui-même multiple de a, n est à son tour multiple de a ; de même avec
b. C’est réglé.
Unicité de m
Soit m et m0 vérifiant les hypothèses du théorème. Comme m est un multiple de m
(eh oui !), c’est un multiple commun de a et b, donc un multiple de m0 . De même, m0
est un multiple de m. Cela implique que m et m0 sont forcément égaux au signe près.
Comme ils sont tous deux strictement positifs, ils sont égaux. Fin de la démonstration.
Voici maintenant une première démonstration de l’existence (et l’unicité) du pgcd,
qui l’obtient à partir du ppcm. Cette démonstration a le confort d’être dépourvue
d’idée subtile et l’avantage de prouver le Complément 1. Elle a l’inconvénient de ne pas
prouver le Complément 2 et de ne pas fournir une méthode rapide de calcul du pgcd.
Première démonstration du théorème 4
Existence de d
On note m le ppcm de a et b et on pose d = ab/m. Remarquons que ce nombre d
est bien un entier : en effet, ab étant un multiple commun évident de a et b, c’est un
multiple de leur ppcm. Reste à prouver qu’il convient.
Pour faire cette vérification, soit n > 1 un entier ; nous avons désormais à montrer
une équivalence, distinguons méthodiquement les deux sens.
• Preuve de l’implication directe : supposons que n est un diviseur commun de a
et b. On peut donc introduire deux entiers k et ` tels que a = kn et b = `n. Pour
travailler sur ce sur quoi nous avons des informations, à savoir les multiples de a et b,
introduisons le nombre n0 = ab/n. Ce nombre n0 vaut aussi (a/n)b = kb et (b/n)a = `a.
C’est donc un entier, et même un multiple commun de a et b. C’est donc un multiple
5
de m. Il existe donc un entier c tel que n0 = cm, soit ab/n = c ab/d, donc d = cn. On
a bien prouvé que n divise d.
• Preuve de l’implication réciproque : puisque a = d (m/b) où m/b est un entier, d
divise a ; symétriquement puisque b = d (m/a), d divise b. Supposons maintenant que
n divise d. On voit alors aussitôt que n divise a et b.
Unicité de d
C’est exactement le même principe que pour le ppcm, on laisse donc cette partie
de la démonstration en exercice (très) facile.
Preuve du Complément 1 : Il tombe immédiatement au vu de la formule qui donne
d à partir de m. Fin de la démonstration.
Comme promis, voici maintenant une deuxième démonstration du théorème 4, très
différente dans son esprit, et qui permet pour guère plus cher de montrer simultanément
le Complément 2.
Deuxième démonstration du théorème 4
La démonstration est une récurrence sur b ; techniquement, on gagne sérieusement
en confort si on autorise b à être nul, ce que l’on n’a pas fait, volontairement, en énonçant
le théorème dans l’espoir qu’il soit plus clair. On montrera donc légèrement mieux que
l’énoncé de la page précédente, puisqu’on prouvera le résultat sous l’hypothèse « a > 1
et b > 0 ».
Avant de se lancer dans la récurrence proprement dite, on va donner un « résumé
de la preuve » sous forme de programme informatique récursif.
Début du programme
* pgcd(a, 0) = a.
* Soit r le reste de la division euclidienne de a par b.
Les diviseurs communs de a et b sont les diviseurs communs de b et r.
D’où : pgcd(a, b) = pgcd(b, r).
Fin du programme
Ce résumé de démonstration convaincra peut-être les esprits les plus agiles, mais à
notre niveau d’entraînement, il est plus prudent de faire ce qui est derrière les formu-
lations récursives : une bonne vieille récurrence.
On va démontrer par « récurrence forte » sur b > 0 l’hypothèse (Hb ) suivante :
(Hb ) Pour tout entier a > 1, il existe deux entiers (relatifs) s et t tels que,
pour tout n > 1, n divise a et b si et seulement si n divise sa + tb.
Vérifions (H0 ).
Soit a un entier avec a > 1 ; tout entier n > 1 qui divise a divise aussi b = 0 puisque
0n = 0. Pour tout n > 1, on a donc : n divise a et 0 si et seulement si n divise a.
Prenons alors s = 1 et t = 0. On a donc bien pour tout n > 1 : n divise a et 0 si et
seulement si n divise sa + t × 0.
6
Soit b un entier fixé, avec b > 1. Supposons la propriété (Hc ) vraie pour tout c avec
0 6 c < b et montrons (Hb ).
Soit a un entier avec a > 1. Notons a = bq + r la division euclidienne de a par b
(qu’on peut réaliser puisque b > 1).
Vérifions l’affirmation intermédiaire suivante : pour tout n > 1, n est un diviseur
commun de a et b si et seulement si n est un diviseur commun de b et r. C’est-à-dire,
avec des mots peut-être plus lisibles : « les diviseurs communs de a et b sont les mêmes
que ceux de b et r. »
Soit n un diviseur commun de a et b, alors n divise aussi r = a−bq ; réciproquement
soit n un diviseur commun de b et r, alors n divise aussi a = bq + r.
L’affirmation intermédiaire est donc démontrée.
On peut alors appliquer l’hypothèse de récurrence (Hr ) (puisque précisément 0 6
r < b) sur l’entier b > 1.
On en déduit qu’il existe deux entiers relatifs s0 et t0 tels que pour tout n > 1, n
divise b et r si et seulement si n divise s0 b + t0 r.
Remarquons enfin que s0 b + t0 r = s0 b + t0 (a − bq) = t0 a + (s0 − q)b, et qu’ainsi, si on
pose s = t0 et t = s0 − q, on a bien prouvé que, pour tout n > 1, n divise a et b si et
seulement si n divise sa + tb.
(Hb ) est donc démontrée.
On a donc bien prouvé (Hb ) pour tout b > 0, donc a fortiori pour tout b > 1, ce
qui prouve le théorème 4 et son Complément 2.
En fait, il reste à prouver l’unicité de d, pour laquelle on renvoie à la démonstration
précédente (où on écrivait qu’on la laissait en exercice).
Fin de la démonstration.
À présent, donnons un petit exemple sur des vrais nombres concrets, pour nous
soulager l’esprit après tant de lettres.
Calcul du pgcd de 137 et 24
On fait des divisions euclidiennes successives et on écrit dans la colonne de droite
les conséquences de ces divisions.
(1) 137 = 5 × 24 + 17 pgcd(137, 24) = pgcd(24, 17)

(2) 24 = 1 × 17 + 7 pgcd(24, 17) = pgcd(17, 7)
(3) 17 = 2 × 7 + 3 pgcd(17, 7) = pgcd(7, 3)
(4) 7 = 2 × 3 + 1 pgcd(7, 3) = pgcd(3, 1)
(5) 3 = 3 × 1 + 0 pgcd(3, 1) = pgcd(1, 0) = 1
Donc pgcd(137, 24) = 1.

Ces calculs permettent ensuite sans mal de reconstituer une identité de Bézout.
– La dernière division avec un reste non nul est (4) qui donne 1 = 7 − 2 × 3.
7
– On va repêcher une expression de 3 comme un reste dans la relation précédente,

soit (3), ce qui donne 3 = 17 − 2 × 7.
– On reporte cette expression de 3 donc 1 = 7 − 2 × (17 − 2 × 7).
– On regroupe les termes en 17 et 7 donc 1 = −2 × 17 + 5 × 7.
soit (2), ce qui donne 7 = 24 − 1 × 17.
– On reporte cette expression de 7 donc 1 = −2 × 17 + 5 × (24 − 1 × 17).
– On regroupe les termes en 24 et 17 donc 1 = 5 × 24 − 7 × 17.
soit (1), ce qui donne 17 = 137 − 5 × 24.
– On reporte cette expression de 17 donc 1 = 5 × 24 − 7 × (137 − 5 × 24).
– On regroupe les termes en 137 et 24 donc
1 = −7 × 137 + 40 × 24.
– Et voilà !
Calcul du pgcd de 141 et 24
Voici les divisions euclidiennes successives et leurs conséquences en termes de pgcd.
(1) 141 = 5 × 24 + 21 pgcd(141, 24) = pgcd(24, 21)

(2) 24 = 1 × 21 + 3 pgcd(24, 21) = pgcd(21, 3)
(3) 21 = 7 × 3 + 0 pgcd(21, 3) = pgcd(3, 0) = 3
Donc pgcd(141, 24) = 3 et on vérifiera que ces calculs permettent de reconstituer

l’identité de Bézout
−141 + 6 × 24 = 3.
Donnons une dernière définition avant de quitter les pgcd.
Définition 5. On dit que deux entiers a > 1 et b > 1 sont premiers entre eux lorsque
leur seul diviseur commun positif est 1.
On veillera à ne pas confondre cette notion avec celle de nombre premier. (Par
exemple, les calculs ci-dessus montrent que 137 et 24 sont premiers entre eux mais 24
n’est pas premier.)
1.4 Lemme de Gauss et décomposition en facteurs premiers

Le lemme de Gauss permet de démontrer l’unicité de la décomposition en facteurs
premiers. Ce dernier résultat semble plus facile d’usage pour un utilisateur peu expéri-
menté, donc on énonce le lemme de Gauss sans commentaire, ou plus exactement sans
autre commentaire que ce commentaire négatif.
8
Lemme 1. Soit a, b et c trois entiers strictement positifs. Si a divise le produit bc et

si a est premier avec c, alors a divise b.
Démonstration : Puisque a est premier avec c, le pgcd de a et c est 1, donc il existe des
entiers relatifs s et t tels que sa + tc = 1. Multiplions cette identité par b : on obtient
b = asb + tbc. Mais dans cette écriture, asb est évidemment multiple de a tandis que
tbc l’est parce que bc est multiple de a. On en déduit que b, somme des deux multiples
de a que sont asb et tbc, est lui-même un multiple de a.
Théorème (énoncé approximatif) Tout entier n > 2 peut être écrit de façon unique
comme produit de facteurs premiers.
L’énoncé est approximatif car il n’est pas si clair de savoir ce que signifie « unique » :
on peut écrire 6 = 2 × 3 = 3 × 2 mais il faut évidemment considérer que c’est la même
chose. Pour pouvoir comprendre voire utiliser le théorème, cet énoncé suffira bien ; mais
pour le démontrer, il faut être plus précis.
Théorème 5 (énoncé précis). Tout entier n > 2 peut être écrit comme produit de
facteurs premiers. De plus, si on dispose de deux écritures
n = pα1 1 pα2 2 · · · pαk k et n = q1β1 q2β2 · · · qiβi ,
dans lesquelles k > 1, i > 1, les entiers p1 < p2 < . . . < pk et q1 < q2 < . . . < qi sont
tous premiers et rangés en ordre croissant, les exposants α1 , α2 , . . . , αk et β1 , β2 , . . . ,
βi sont tous des entiers strictement positifs, alors ces deux écritures sont les mêmes au
sens précis suivant : k = i et pour tout j avec 1 6 j 6 k = i, pj = qj et αj = βj .
Démonstration : À énoncé indigeste, démonstration indigeste.

L’existence provient d’une récurrence élémentaire. Pour tout entier n ≥ 2, considé-
rons l’hypothèse de récurrence (forte) suivante :
(En ) Tout entier 2 6 k 6 n peut s’écrire comme un produit de facteurs
premiers comme dans l’énoncé du théorème.
Alors (E2 ) est évidente car 2 est premier.
Soit n ≥ 2 un entier fixé, supposons (En ) vraie et montrons (En+1 ).
Si n + 1 est premier, (En+1 ) est évidente.
Si n + 1 n’est pas premier, il existe un entier 2 6 k 6 n qui divise n + 1. Notons `
l’entier ` = (n + 1)/k. Alors 2 6 ` 6 n donc on peut appliquer l’hypothèse (En ) aux
deux entiers k et `. Il existe donc des entiers premiers pi et qj et des exposants ai et bj
strictement positifs tels que
k = pa11 pa22 · · · pauu , ` = q1b1 q2b2 · · · qvbv ,
avec p1 < p2 < . . . < pu et q1 < q2 < . . . < qv . Par conséquent,
n + 1 = k × ` = pa11 pa22 · · · pauu × q1b1 q2b2 · · · qvbv .
9
L’ensemble {p1 , p2 , . . . , pu } ∪ {q1 , q2 , . . . , qv } comporte w 6 u + v éléments. Notons et

ordonnons ces éléments comme r1 < r2 < · · · < rw . En regroupant les entiers qui
apparaissent dans les deux factorisations, on obtient
n + 1 = r1c1 r2c2 · · · rwcw ,
où les exposants ck sont définis comme suit :

– ck = ai si rk = pi et rk 6= qj pour tout j,
– ck = bj si rk = qj et rk 6= pi pour tout i,
– et enfin ck = ai + bj si rk = pi = qj .
Donc (En+1 ) est vraie.
Ceci conclut la preuve de l’existence.
Passons à l’unicité. On va donc montrer par récurrence (forte) sur n le résultat
d’unicité (Hn ) écrit dans l’énoncé du théorème.
Démonstration de (H2 ), et en fait même de (Hp ) pour tout nombre premier p
Supposons n = p premier écrit sous forme de produit p = pα1 1 pα2 2 · · · pαk k . Chaque
pi est un diviseur positif de p non égal à 1, donc chaque pi est égal à p. Ceci entraîne
aussitôt que k = 1 et que α1 = 1 (sans cela le produit serait supérieur ou égal à p2
donc distinct de p). L’écriture p = p est donc la seule possible pour p, ce qui démontre
(Hp ) quand p est premier.
Soit maintenant n un entier fixé, non premier, avec n > 2, et supposons l’hypothèse
d’unicité (Hm ) prouvée pour tout entier m avec 2 6 m < n.
Première étape Montrons que pk = qi (toujours dans les notations de l’énoncé du
théorème).
Supposons tout d’abord que pk > qi et montrons que l’on aboutit à une absurdité.
Puisque les qj sont supposés rangés dans l’ordre croissant, pk est alors forcément
distinct de tous les qj ; pk et chaque qj étant premiers, on en conclut que leur seul
diviseur commun positif est 1 : pk et qj sont donc premiers entre eux.
Fixons un j entre 1 et i et montrons par récurrence sur b > 0 l’énoncé fort intuitif
suivant : (Hb0 ) : pk est premier avec qjb .
(H00 ) est évident puisque qj0 = 1.
Soit b > 0 un entier fixé, supposons (Hb0 ) vrai et montrons (Hb+1 0
).
0 b+1
Si (Hb+1 ) était faux, le pgcd de pk et qj ne serait pas 1 ; comme c’est un diviseur
positif de pk , ce serait pk qui diviserait donc qjb+1 . On peut alors appliquer le lemme de
Gauss : comme pk divise qjb+1 = qjb qj et que pk est premier avec qj , pk divise qjb . Mais
ceci contredit l’hypothèse (Hb0 ). L’hypothèse (Hb+1 0
) est donc vraie.
On a donc bien montré que pour tout b > 0, pk est premier avec qjb . En particulier,
β
pk est premier avec qj j . Comme on a prouvé cette affirmation pour un j quelconque,
β
on a prouvé que pour tout j entre 1 et i, pk est premier avec qj j . Ce qu’on a fait avec
10
les puissances de chaque qj , on va maintenant le recommencer avec le produit de ces

puissances. Précisément, on va montrer par récurrence sur l’entier j que pour tout j
β
avec 1 6 j 6 l, on a l’énoncé (Hj00 ) : pk est premier avec q1β1 q2β2 · · · qj j .
Les lecteurs encore éveillés (s’il en reste) comprendront que la preuve est à peu près
la même que celle des (Hb0 ), pour les autres, la voilà :
Pour j = 1, on doit prouver que pk est premier avec q1β1 . C’est déjà fait.
Fixons un entier j avec 1 6 j < i et supposons l’hypothèse (Hj00 ) vraie.
β βj+1
00
Si (Hj+1 ) était fausse, le pgcd de pk et q1β1 q2β2 · · · qj j qj+1 ne serait pas 1 ; comme
β βj+1
c’est un diviseur positif de pk , ce serait pk qui diviserait donc q1β1 q2β2 · · · qj j qj+1 . On
peut alors appliquer le lemme de Gauss : comme pk divise le nombre
β β β β

q1β1 q2β2 · · · qj j qj+1
j+1
= q1β1 q2β2 · · · qj j qj+1
j+1
β β
et comme pk est premier avec qj+1 j+1
, pk divise q1β1 q2β2 · · · qj j . Mais ceci contredit l’hypo-
thèse (Hj00 ). L’hypothèse (Hj+1
00
) est donc vraie.
On a donc montré (Hj00 ) pour tout j entre 1 et i ; en particulier on a montré (Hi00 ),
à savoir que pk est premier avec q1β1 q2β2 · · · qiβi = n. Mais pourtant pk figure dans l’autre
décomposition en facteurs premiers de n (ce n’est pas une illusion d’optique, puisqu’on
a pris soin de supposer αk > 1), donc pk divise n. D’où contradiction. Ouf !
On ne peut donc avoir pk > qi . En échangeant les rôles des coefficients p et q, on
voit qu’on ne peut pas non plus avoir qi > pk . On en déduit donc que qi = pk .
Fin de la première étape
Deuxième étape On va profiter de ce tout petit morceau d’égalité pour arriver à
utiliser l’hypothèse de récurrence et faire tomber toutes les autres égalités requises en
cascade.
Notons N = n/pk = n/qi , on a ainsi :
N = pα1 1 pα2 2 · · · pαk k −1 et N = q1β1 q2β2 · · · qiβi −1 .
De plus N est strictement inférieur à n, et N est strictement plus grand que 1 car
on a fort opportunément supposé n non premier. On va donc appliquer l’hypothèse
de récurrence (HN ) à ces deux écritures de N en facteurs premiers. Si on n’est pas
méticuleux, on oubliera de s’assurer que tous les exposants sont strictements positifs,
et on aura fini tout de suite ; ce sera faux, mais de peu. Hélas, un enseignant scrupuleux
ne peut se le permettre et doit donc veiller à ce petit détail, qui nous force à distinguer
deux sous-cas.
Premier sous-cas : αk = 1. Dans ce cas, la première écriture de m se lit en réalité,
après effacement du p0k qui l’encombre :
α
N = pα1 1 pα2 2 · · · pk−1
k−1
.
11
Ainsi N possède une décomposition en facteurs premiers dans laquelle pk ne figure

pas. Comme sa décomposition est unique, pk ne peut non plus figurer dans l’autre
décomposition, et comme qi = pk , la seule possibilité est que l’exposant βi − 1 soit nul ;
ainsi βi = αk =1, et les deux représentations
α β
N = pα1 1 pα2 2 · · · pk−1
k−1
et N = q1β1 q2β2 · · · qi−1
i−1
sont deux décompositions de N en facteurs premiers. On en déduit que k − 1 = i − 1,

donc k = i, puis l’égalité de tous les facteurs premiers et exposants encore en attente
d’élucidation.
Second sous-cas : αk > 1. C’est la même chanson. On remarque tout d’abord qu’on
a aussi βi > 1 (sans cela, en échangeant les rôles des coefficients p et q et en utilisant
le premier cas, on montrerait que αk = 1) ; donc les deux décompositions
N = pα1 1 pα2 2 · · · pαk k −1 et N = q1β1 q2β2 · · · qiβi −1
vérifient bien les hypothèses du théorème. Elles sont égales, donc k = i et chaque
coefficient p est égal au coefficient q correspondant, avec le même exposant.
Fin de la deuxième étape
(Hn ) est donc prouvée.
La récurrence est donc terminée, et avec elle la démonstration.
La décomposition en facteurs premiers permet d’énumérer facilement les diviseurs

d’un entier.
Proposition 1. Soit n un entier et
n = pα1 1 pα2 2 · · · pαk k
sa décomposition en facteurs premiers. L’ensemble des diviseurs positifs de n est :

D= N= pβ1 1 pβ2 2 · · · pβkk , ∀i = 1, . . . , k 0 6 βi 6 αi
Par exemple l’ensemble des diviseurs positifs de 60 = 22 31 51 est :

D= 20 30 50 , 21 30 50 , 20 31 50 , 22 30 50 , 20 30 51 , 21 31 50 ,

21 30 51 , 22 31 50 , 20 31 51 , 22 31 50 , 22 30 51 , 22 31 51 ,
soit,
D= 1 , 2 , 3 , 4 , 5 , 6 , 10 , 12 , 15 , 20 , 30 , 60
Démonstration : Soit
n = pα1 1 pα2 2 · · · pαk k et N = pβ1 1 pβ2 2 · · · pβkk
12
Si pour tout i = 1, . . . , k, 0 6 βi 6 αi , alors :

n = N × pα1 1 −β1 pα2 2 −β2 · · · pkαk −βk
Donc tout élément de l’ensemble D est diviseur de n.

Réciproquement, soit N un diviseur de n. Tout facteur premier de N divise n, donc
c’est l’un des pi . Si pβi i divise N , alors pβi i divise aussi n, donc βi 6 αi . Ceci montre que
tout diviseur de n est élément de D.
Quand on connaît la décomposition en facteurs premiers de deux nombres, il est
facile de calculer leur pgcd et leur ppcm.
Proposition 2. Soient m et n deux entiers. Quitte à admettre des exposants nuls,
nous pouvons considérer que leurs facteurs premiers sont les mêmes. Ecrivons donc :
n = pα1 1 pα2 2 · · · pαk k et m = pβ1 1 pβ2 2 · · · pβkk ,
où pour i = 1, . . . , k, αi > 0 et βi > 0.

Alors :
pgcd(m, n) = pδ11 pδ22 · · · pδkk et ppcm(m, n) = pγ11 pγ22 · · · pγkk ,
où pour tout i = 1, . . . , k,
δi = min{αi , βi } et γi = max{αi , βi }
Considérons par exemple :
n = 172872 = 23 32 74 et m = 525525 = 31 52 72 111 131
Quitte à admettre des puissances nulles, nous pouvons écrire la décomposition sur les
mêmes facteurs.
n = 23 32 50 74 110 130 et m = 20 31 52 72 111 131
Donc :
pgcd(m, n) = 20 31 50 72 110 130 = 31 72 = 147,
et
ppcm(m, n) = 23 32 52 74 111 131 = 618017400.
Démonstration : Posons :
d = pδ11 pδ22 · · · pδkk .
On vérifie facilement que d est bien un diviseur commun de m et de n. Réciproquement,
soit d0 un diviseur commun de m et n. Tout facteur premier p de d est aussi un facteur
premier de m et de n. Si pδi divise n et m, alors δ 6 αi et δ 6 βi , donc
δ 6 δi = min{αi , βi }.
13
Ceci entraîne que d0 est diviseur de d. Donc d est bien le pgcd de m et n.

L’expression du ppcm se déduit de celle du pgcd par la formule :
pgcd(m, n) ppcm(m, n) = m n.
1.5 Sous-groupes de Z
Notation 3. Soit b un entier. On note bZ l’ensemble des multiples de b.
Par exemple 0Z = {0} et 2Z est l’ensemble des entiers relatifs pairs.

L’objet de la section est un théorème d’énoncé très simple, et assez pratique.
Théorème 6. Les sous-groupes de Z sont exactement les ensembles bZ avec b > 0.
Démonstration : Il y a deux choses à démontrer : que les ensembles bZ sont des sous-
groupes, et que tout sous-groupe est un ensemble bZ.
Commençons donc par vérifier (c’est très facile) que pour b > 0 fixé, bZ est un
sous-groupe de Z.
• 0 est multiple de b, donc bZ n’est pas vide.
• Soit x et y deux éléments de bZ, c’est-à-dire deux multiples de b. Il est clair que
x − y est aussi un multiple de b, donc appartient à bZ.
C’est fait. Pour les amateurs d’abstraction, on pouvait remarquer que bZ = hbi (le
sous-groupe engendré par b), ce qui est camouflé par la notation additive de l’opération.
Soit maintenant H un sous-groupe de Z, montrons qu’il existe un entier b > 0 tel
que H = bZ. On distinguera deux cas.
Premier cas : Si H = {0}, on remarque que H = 0Z et on a fini.
Second cas : Si H 6= {0}, H possède au moins un élément non nul x, donc au moins
un élément strictement positif y (on prendra y = x ou y = −x selon le signe de x).
Si on introduit l’ensemble B = H ∩ N∗ , B est donc un ensemble d’entiers positifs non
vide. Il possède un plus petit élément b. On va montrer que b convient.
Il semble raisonnablement clair que bZ ⊂ H. (Hum, est-ce si clair ou est-ce un petit
moment de paresse du rédacteur ? Le lecteur est invité à se forger par lui-même une
opinion sur cette épineuse question.)
Réciproquement soit a un élément de H. Si on fait la division euclidienne de a par
b, soit a = qb + r, on en déduit que r = a − bq est aussi un élément de H. Comme
r < b, r 6∈ B, et comme r ∈ H ∩ N la seule possibilité est que r = 0. On en déduit donc
que a = bq ∈ bZ. Ceci prouve l’inclusion H ⊂ bZ.
On a donc montré que H = bZ.
On a donc montré, dans les deux cas, que H est de la forme bZ.
14
En application de ce théorème, donnons de nouvelles et élégantes démonstrations

des théorèmes 3 et 4 ; l’outil à la base reste la division euclidienne, mais il aura été
utilisé une seule fois, dans la preuve du théorème qui précède, et on ne fait plus que
d’assez simples manipulations ensemblistes.
Deuxième démonstration du théorème 3 :
Introduisons les sous-groupes de Z que sont H = aZ et K = bZ. Pour tout n > 1,
n est un multiple commun de a et b si et seulement si n est dans H ∩ K. Or H ∩ K,
comme intersection de deux sous-groupes de Z, est lui-même un sous-groupe de Z (bon,
d’accord, on n’a pas mentionné ce résultat dans le cours sur les sous-groupes, mais on
aurait dû, et de toutes façons c’est très facile). Il existe donc un entier m > 0 tel que
H ∩ K = mZ (et il est clair que m > 0, car H ∩ K contient d’autres entiers que 0, par
exemple ab). On a alors pour tout n > 1 les équivalences : n est un multiple commun
de a et b si et seulement si n appartient à H ∩ K si et seulement si n appartient à mZ
si et seulement si n est un multiple de m.
L’unicité reste à prouver comme dans la preuve initiale.
Troisième démonstration du théorème 4 :
Introduisons l’ensemble L ⊂ Z défini par L = {sa + tb , s ∈ Z, t ∈ Z}.
On vérifie sans mal que L est un sous-groupe de Z. C’est si facile, qu’on va le laisser
au lecteur.
Il existe donc un entier d > 0 tel que L = dZ. De plus L n’est manifestement pas
réduit à {0} (il contient par exemple a = 1a + 0b, et même aussi b = 0a + 1b), donc
d > 0. Montrons que d convient.
On a remarqué que a et b sont dans L = dZ. En d’autres termes, ils sont tous deux
multiples de d, ou, pour dire cela encore autrement, d est un diviseur commun de a et
b. Il est donc clair que tout diviseur de d est à son tour un diviseur commun de a et b.
Par ailleurs, d est dans L, donc peut être mis sous forme sa + tb pour des entiers
relatifs s et t. Si on part d’un diviseur commun n ≥ 1 de a et b, sa et tb sont à leur
tour des multiples de n, donc aussi d, et n est donc bien un diviseur de d.
Là aussi, on renvoie à la preuve initiale pour l’unicité.
1.6 Congruences
Juste quelques notations pratiques. La section se réduit à quasiment rien.
Définition 6. Soit a et b des entiers relatifs et n > 1 un entier strictement positif. On
dit que a est congru à b modulo n lorsque b − a est un multiple de n.
Il est tellement évident de vérifier que, pour n fixé, la relation « est congru à » est
une relation d’équivalence sur Z que cet énoncé n’aura pas même l’honneur d’être
qualifié de proposition.
15
Notation 4. Lorsque a est congru à b modulo n, on note :
a ≡ b [n].
Exemple 1. On repère les jours de l’année par leur numéro de 1 à 365 ou 366 selon
les cas. Alors les numéros de tous les lundis sont congrus les uns aux autres modulo 7.
L’intérêt des congruences est d’être compatibles avec l’addition et la multiplication,
au sens suivant :
Proposition 3. Soit n > 1 fixé et soit a, b et c trois entiers relatifs. Alors :
si a ≡ b [n] alors a + c ≡ b + c [n] et ac ≡ bc [n].
Démonstration : C’est vraiment trop facile.

Exemple 2. Quel est le reste de la division par 9 de 12345 ? On commence par écrire
12345 = 104 + 2 · 103 + 3 · 102 + 4 · 10 + 5.
Comme 10 ≡ 1 [9], on en déduit
12345 ≡ 14 + 2 · 13 + 3 · 12 + 4 · 1 + 5 = 1 + 2 + 3 + 4 + 5 = 15,
et
12345 ≡ 1 · 10 + 5 ≡ 1 · 1 + 5 = 1 + 5 = 6,
donc la réponse est 6. Et par 11 ? Ici, on utilise le fait que 10 ≡ −1 [11], donc
12345 ≡ (−1)4 + 2 · (−1)3 + 3 · (−1)2 + 4 · (−1)1 + 5 = 3,
et la réponse est 3.
Exercice : Formaliser les règles de calcul des congruences modulo 9 et modulo 11
utilisées dans l’exemple 2.
Exercice : Montrer qu’une règle de calcul possible pour calculer des congruences
modulo 7 est la suivante. On décompose l’écriture de n en base 10 en groupes de 3
chiffres consécutifs en commençant par le chiffre des unités. Si un bloc vaut B = abc,
on note s(B) = 2a + 3b + c. Puis on effectue la somme alternée s(n) des s(B) en
commençant par le bloc du chiffre des unités. Alors n et s(n) sont congrus modulo 7.
Par exemple, si n = 12345678, les blocs sont B3 = 012, B2 = 345 et B1 = 678.
On calcule s(B3 ) = 2 × 0 + 3 × 1 + 1 × 2 = 5, s(B2 ) = 2 × 3 + 3 × 4 + 1 × 5 = 23,
s(B1 ) = 2 × 6 + 3 × 7 + 1 × 8 = 41, puis
s(n) = s(B1 ) − s(B2 ) + s(B3 ) = 41 − 23 + 5 = 23,
donc n ≡ 23 [7] et enfin n ≡ 2 [7].
16
1.7 Z/nZ
En apparence, cette section est consacrée à un formalisme assez gratuit consistant
à remplacer l’écriture :
a ≡ b [n],
par l’écriture équivalente :
cl(a) = cl(b) dans Z/nZ,
où cl est l’abréviation de « classe ». Maigre progrès en apparence ! Toutefois, comme

des exemples judicieusement choisis le montreront en fin de section, on a fait plus qu’un
simple changement de notations : on a construit un pont entre ce chapitre et le chapitre
précédent, pont par lequel on pourra rapatrier des résultats connus sur les groupes pour
effectivement affiner notre connaissance des entiers.
Définition 7. Soit n > 1 un entier fixé. On appelle Z/nZ l’ensemble-quotient de Z

par la relation d’équivalence « est congru à » (modulo n).
Exemple 3. Pour n = 2, soit a un entier. Si a est pair, la classe d’équivalence cl(a)

pour la relation de congruence modulo 2 est l’ensemble P de tous les nombres pairs
; si a est impair, cl(a) est l’ensemble I de tous les nombres impairs, et finalement
Z/2Z = {I, P }.
Proposition 4. Pour tout n > 1, Z/nZ possède exactement n éléments.
Démonstration : Montrons tout d’abord que Z/nZ = {cl(0), cl(1), . . . , cl(n − 1)}, d’où
on déduit aussitôt que Z/nZ possède au plus n éléments.
Soit x un élément de Z/nZ ; il existe alors a ∈ Z tel que x = cl(a). Effectuons
la division euclidienne de a par n, soit a = nq + r ; on voit alors que a ≡ r [n] ou
encore que x = cl(a) = cl(r). Mais 0 6 r < n, donc on a bien prouvé que x était dans
l’ensemble proposé.
Montrons maintenant que ces n éléments sont deux à deux distincts, prouvant ainsi
que Z/nZ possède au moins n éléments.
Soit a et b deux entiers distincts avec 0 6 a < n et 0 ≤ b < n. Des inégalités 0 6 a
et b < n on déduit que −n < b − a ; des inégalités a < n et 0 6 b on déduit que
b − a < n et de l’hypothèse a 6= b on déduit que b − a 6= 0. On en conclut que a 6≡ b [n],
c’est-à-dire que cl(a) et cl(b) sont deux éléments distincts de Z/nZ.
On a donc bien prouvé que Z/nZ possède exactement n éléments.
Définition 8. Soit cl(a) et cl(b) deux éléments de Z/nZ. On définit la somme de cl(a)
et cl(b) par cl(a) + cl(b) = cl(a + b) et leur produit par cl(a) × cl(b) = cl(ab).
Prudence ! Cette définition est aussi innocente en apparence que celles qui l’ont pré-
cédée. Et pourtant, elle pourrait n’avoir rigoureusement aucun sens.
17
En effet, la définition de la somme de deux éléments x et y de Z/nZ nécessite

implicitement de les mettre préalablement sous forme x = cl(a) et y = cl(b). Mais il y
a plusieurs façons de les mettre sous cette forme ! Il faut donc vérifier que la définition
ne dépend pas du choix fait dans cette phase préparatoire. Pour montrer à quel point
c’est indispensable, donnons une
Fausse définition (buggée) Soit cl(a) et cl(b) deux éléments de Z/nZ. On dira que
cl(a) ≤ cl(b) lorsque a 6 b.
Il est facile de comprendre pourquoi cette « définition » est bonne pour la corbeille
à papier : dans Z/3Z, prenons x = cl(0) et y = cl(2). En les écrivant ainsi, la « défini-
tion » nous donne : x 6 y. Mais on peut aussi écrire x = cl(3) et comme précédemment
y = cl(2). En s’y prenant ainsi, y 6 x. Cette « définition » n’a donc en fait aucun sens.
Sermon (ou : Prudence II, le retour) Malgré ses dehors anecdotiques, il est in-
dispensable de comprendre cette remarque. La fausse définition et la bonne sont sem-
blables formellement, alors que l’une est absurde et l’autre non. Fin du sermon.
Procédons donc à cette indispensable vérification. Soit x = cl(a) = cl(α) et y =
cl(b) = cl(β) deux éléments de Z/nZ. La cohérence de la définition exige de prouver que
cl(a+b) = cl(α+β). La vérification est alors évidente (α+β)−(a+b) = (α−a)+(β −b)
étant un multiple de n parce que α − a et β − b le sont tous les deux. De même
cl(ab) = cl(αβ) car αβ − ab = αβ − αb + αb − ab = α(β − b) + b(α − a).
Ainsi au point où nous en sommes, Z/nZ est muni d’une addition et d’une multipli-
cation. Traçons un exemple de tables, pour voir quelle tête elles ont. Ce sera l’exemple
de Z/5Z.
On note dans cette table et dans les suivantes ȧ = cl(a).
+ 0̇ 1̇ 2̇ 3̇ 4̇ × 0̇ 1̇ 2̇ 3̇ 4̇
0̇ 0̇ 1̇ 2̇ 3̇ 4̇ 0̇ 0̇ 0̇ 0̇ 0̇ 0̇
1̇ 1̇ 2̇ 3̇ 4̇ 0̇ 1̇ 0̇ 1̇ 2̇ 3̇ 4̇
2̇ 2̇ 3̇ 4̇ 0̇ 1̇ 2̇ 0̇ 2̇ 4̇ 1̇ 3̇
3̇ 3̇ 4̇ 0̇ 1̇ 2̇ 3̇ 0̇ 3̇ 1̇ 4̇ 2̇
0̇ 1̇ 2̇ 3̇ 4̇ 0̇ 0̇ 0̇ 4̇ 3̇ 2̇ 1̇
Après la présentation de l’objet, un peu de théorie à son sujet.
Proposition 5. Pour tout n > 1, Z/nZ est un anneau commutatif.
Démonstration : Elle est d’un ennui mortel, et ne présente aucune difficulté. Pour en
faire un tout petit bout, montrons que l’addition est associative : soit x, y et z trois
éléments de Z/nZ. On peut les écrire sous forme x = cl(a), y = cl(b), z = cl(c). Vu la
définition de l’addition dans Z/nZ, on a alors (x + y) + z = (cl(a) + cl(b)) + cl(c) =
18
cl(a+b)+cl(c) = cl((a+b)+c) = cl(a+(b+c)) = cl(a)+cl(b+c) = cl(a)+(cl(b)+cl(c)) =

x + (y + z).
Et toutes les vérifications seraient de ce genre. Nous décidons donc de les laisser au
lecteur.
Plus intéressant et légèrement plus subtil est le résultat suivant.
Théorème 7. Pour tout n > 1, Z/nZ est un corps commutatif si et seulement si n
est un nombre premier.
Démonstration : Montrons tour à tour les deux sens de l’équivalence.

Preuve de l’implication directe. On va montrer cette implication par contraposition.
Supposons donc que n n’est pas premier, et montrons que Z/nZ n’est pas un corps
commutatif (on verra même en passant que ce n’est même pas un anneau intègre).
Traitons à part le cas, « stupide », où n vaudrait 1. Dans ce cas, Z/1Z ne possède
qu’un élément, donc n’est pas un corps commutatif.
Examinons le cas, significatif, où n n’est pas premier, mais n’est pas non plus égal
à 1. Dans ce cas, on peut écrire n = ab, où 1 < a < n et 1 < b < n. Dans l’anneau
Z/nZ, on obtient alors la relation cl(n) = cl(a)cl(b), soit cl(a)cl(b) = cl(0). Pourtant,
au vu des inégalités vérifiées par a et b, ni cl(a) ni cl(b) n’est nul. Donc Z/nZ n’est pas
intègre, et a fortiori n’est pas un corps commutatif.
On a bien prouvé dans les deux cas que Z/nZ n’est pas un corps commutatif.
Preuve de l’implication inverse. Supposons n premier, et montrons que Z/nZ est
alors un corps commutatif.
Nous savons déjà que la multiplication sur Z/nZ est commutative.
Comme Z/nZ possède n éléments, il en possède au moins deux.
Soit x un élément non nul de Z/nZ. On peut écrire x = cl(a) pour un entier a dans
l’ensemble {1, . . . , n − 1}. Puisque n est premier, a ne possède d’autre diviseur positif
commun avec n que 1 et donc a et n sont premiers entre eux. Il existe donc deux entiers
relatifs s et t tels que 1 = sa + tn. En passant aux classes d’équivalence, on obtient :
cl(1) = cl(s)cl(a) + cl(t)cl(n), soit cl(1) = cl(s)cl(a) + cl(t)cl(0) = cl(s)x.
On a donc trouvé un inverse de x, à savoir cl(s).
Finalement, Z/nZ est donc bien un corps commutatif.
Remarque On retiendra de cette démonstration la technique pratique de calcul de
l’inverse d’un élément non nul de Z/nZ : écrire une identité de Bézout entre un repré-
sentant de cet élément et n, et redescendre aux classes d’équivalence.
Et voilà, on sait tout. Reste à donner quelques illustrations afin de convaincre de
l’utilité de l’introduction de cette notion abstraite.
Exemple 4. Résoudre dans Z l’équation suivante, d’inconnue x :
24x + 5 ≡ 0 [137].
19
On peut traiter cet exemple avec ou sans usage de Z/137Z. Faisons les deux successive-
ment ; on constatera que les énoncés simples sur les propriétés algébriques de Z/137Z
remplacent avantageusement les techniques, il est vrai elles aussi simples, d’arithmé-
tique classique.
Première résolution (sans Z/137Z)
Remarquons que 137 est premier, et donc que 137 et 24 sont premiers entre eux ;
cherchons à écrire une identité de Bézout entre 137 et 24 ; en utilisant l’algorithme
décrit plus haut, on découvre que :
1 = 40 × 24 − 7 × 137,
d’où on déduit (par une simple multiplication par 5) que :
5 = 200 × 24 − 35 × 137.
Reportons cette identité dans l’équation, qui devient donc :
24x + 200 × 24 − 35 × 137 ≡ 0 [137].
À son tour, cette équation est équivalente à la condition suivante :
24(x + 200) ≡ 0 [137],
qui signifie que 137 divise 24(x + 200), donc, en utilisant le lemme de Gauss puisque
137 et 24 sont premiers entre eux, que 137 divise x + 200. Finalement, x est solution si
et seulement si x + 200 ≡ 0 [137], c’est-à-dire x ≡ −200 [137], c’est-à-dire x ≡ 74 [137].
Deuxième résolution (avec Z/137Z)
Remarquons que 137 est premier, et donc que Z/137Z est un corps commutatif.
Faisons tous les calculs dans ce corps.
L’équation proposée se réécrit cl(24)cl(x) + cl(5) = cl(0), soit cl(24)cl(x) = −cl(5),
soit cl(x) = −cl(5)(cl(24))−1 .
Calculons donc (cl(24))−1 ; pour cela nous connaissons la bonne méthode : écrire
une identité de Bézout entre 24 et 137, à savoir
1 = 40 × 24 − 7 × 137,
puis redescendre aux classes d’équivalence dans Z/137Z : cl(1) = cl(40) · cl(24), soit :
(cl(24))−1 = cl(40).
On en conclut que l’équation proposée équivaut à :
cl(x) = −cl(5)(cl(24))−1 = −cl(5) × cl(40) = −cl(200) = cl(74) .
20
x4 ≡ 81 [73].
Là aussi, écrire deux solutions serait possible, mais celle utilisant Z/73Z est tellement
plus agréable à écrire que l’on s’en contentera.
Tout d’abord, l’équation s’écrit x4 − 81 ≡ 0 [73] et, dans Z,
x4 − 81 = (x2 − 9)(x2 + 9) = (x − 3)(x + 3)(x2 + 9).
Dans Z/73Z, l’équation s’écrit donc
(cl(x) − cl(3))(cl(x) + cl(3))(cl(x)2 + cl(9)) = cl(0).
Mais cl(9) = −cl(64) donc
cl(x)2 + cl(9) = cl(x)2 − cl(64) = (cl(x) − cl(8))(cl(x) + cl(8)).
Finalement, en utilisant cl(8) = −cl(65) et cl(3) = −cl(70), on voit que l’équation de

départ s’écrit
(cl(x) − cl(3))(cl(x) − cl(70))(cl(x) − cl(8))(cl(x) − cl(65)) = cl(0),
soit cl(x) = cl(3) ou cl(x) = cl(8) ou cl(x) = cl(65) ou cl(x) = cl(70), car Z/73Z est un
corps commutatif, donc intègre.
Les solutions de l’équation proposée sont donc
x ≡ 3 [73] ou x ≡ 8 [73] ou x ≡ 65 [73] ou x ≡ 70 [73].
x17 ≡ 3 [19].
Là encore, on ne saurait trop recommander le passage dans Z/19Z. L’équation s’écrit

dès lors : cl(x)17 = cl(3). Notons a l’inconnue auxiliaire a = cl(x) et remarquons que
cl(0)17 6= cl(3). Il suffit donc de résoudre a17 = cl(3) dans (Z/19Z) \ {cl(0)}.
Mais, si a 6= cl(0), alors a17 = cl(3) si et seulement si a18 = cl(3)a. Maintenant, pour
tout a dans le groupe multiplicatif (Z/19Z) \ {cl(0)}, on sait que l’ordre de a, qui est
le nombre d’éléments du groupe hai, divise le nombre d’éléments de (Z/19Z) \ {cl(0)},
c’est-à-dire 18.
Ainsi, pour tout élément a de (Z/19Z) \ {cl(0)}, a18 = cl(1). L’équation étudiée se
simplifie donc grandement en cl(1) = cl(3)a, c’est-à-dire a = (cl(3))−1 . Sa résolution se
ramène donc à la recherche de l’inverse de cl(3) dans Z/19Z ; on écrit alors une relation
de Bézout : 13 × 3 − 2 × 19 = 1 et on en déduit que (cl(3))−1 = cl(13).
Finalement les solutions de l’équation initiale sont donc
x ≡ 13 [19].
21
x14 ≡ 1 [19].
Ce sont les mêmes idées que dans l’exemple précédent qui font marcher cet exercice,
en un peu plus astucieux encore.
Comme dans l’exemple prédédent, on commence par passer dans Z/19Z, où l’équa-
tion s’écrit dès lors : cl(x)14 = cl(1). On note a = cl(x), on remarque que cl(0) n’est
pas solution, et on décide donc de résoudre a14 = cl(1) dans (Z/19Z) \ {cl(0)}.
Maintenant, on remarque que pour tout a de (Z/19Z) \ {cl(0)}, dire que a14 = cl(1)
équivaut à dire que l’ordre de a divise 14. Par ailleurs, comme dans l’exemple précédent,
pour tout élément a de (Z/19Z)\{cl(0)}, l’ordre de a divise 18. Ainsi, l’ordre de a divise
14 si et seulement s’il divise 14 et 18, donc si et seulement s’il divise pgcd(14, 18) = 2.
On a donc montré que pour tout a de (Z/19Z) \ {cl(0)}, a14 = cl(1) si et seulement
si a2 = cl(1).
Cette nouvelle équation est alors très facile à résoudre : a2 = cl(1) si et seulement
si (a + cl(1))(a − cl(1)) = cl(0) si et seulement si a = cl(1) ou a = −cl(1) = cl(18).
Les solutions de l’équation initiale sont donc
x ≡ 1 [19] ou x ≡ 18 [19].
22
2 Entraînement
2.1 Vrai ou Faux
Vrai-Faux 1. Étant donnés cinq nombres entiers consécutifs, on trouve toujours parmi
eux (vrai ou faux et pourquoi) :
1. au moins deux multiples de 2.
2. au plus trois nombres pairs.
3. au moins deux multiples de 3.
4. exactement un multiple de 5.
5. au moins un multiple de 6.
6. au moins un nombre premier.
fausses et pourquoi ?
1. 60 a plus de diviseurs que 100.
2. 60 a moins de diviseurs que 90.
3. 60 a moins de diviseurs que 120.
4. si un entier divise 60, alors il divise 120.
5. si un entier strictement inférieur à 60 divise 60, alors il divise 90.
6. si un nombre premier divise 120, alors il divise 60.
Vrai-Faux 3. On veut constituer la somme exacte de 59 e seulement à l’aide de pièces
de 2 e et de billets de 5 e. Parmi les affirmations suivantes, lesquelles sont vraies,
lesquelles sont fausses et pourquoi ?
1. Il y a au plus 27 pièces de 2 e.
2. Il peut y avoir exactement 10 pièces de 2 e.
3. Il peut y avoir exactement 12 pièces de 2 e.
4. Il peut y avoir un nombre pair de billets de 5 e.
5. Il y a au moins un billet de 5 e.
1. Si un nombre est divisible par 9, alors il est divisible par 6.
2. Si un nombre est divisible par 100, alors il est divisible par 25.
3. Si un nombre est divisible par 2 et par 3, alors il est divisible par 12.
23
6. Le produit des entiers de 3 à 10 est divisible par 1000.

7. Le produit des entiers de 3 à 10 est divisible par 1600.
8. Si la somme des chiffres d’un entier en écriture décimale vaut 39, alors il est
divisible par 3 mais pas par 9.
9. Si la somme des chiffres d’un entier en écriture décimale vaut 18, alors il est
divisible par 6 et par 9.
1. Si un entier est divisible par deux entiers, alors il est divisible par leur produit.
2. Si un entier est divisible par deux entiers premiers entre eux, alors il est divisible
par leur produit.
3. Si un entier est divisible par deux entiers, alors il est divisible par leur ppcm.
4. Si un nombre divise le produit de deux entiers, alors il divise au moins un de
ces deux entiers.
5. Si un nombre premier divise le produit de deux entiers, alors il divise au moins
un de ces deux entiers.
6. Si un entier est divisible par deux entiers, alors il est divisible par leur somme.
7. Si un entier divise deux entiers, alors il divise leur somme.
8. Si deux entiers sont premiers entre eux, alors chacun d’eux est premier avec
leur somme.
9. Si deux entiers sont premiers entre eux, alors chacun d’eux est premier avec
leur produit.
10. Si deux entiers sont premiers entre eux, alors leur somme et leur produit sont
premiers entre eux.
Vrai-Faux 6. Soient a, b, d trois entiers. Parmi les affirmations suivantes, lesquelles sont
vraies, lesquelles sont fausses et pourquoi ?
1. Si d divise a et b, alors d divise leur pgcd.
2. S’il existe deux entiers u et v tels que au + bv = d, alors d = pgcd(a, b).
3. S’il existe deux entiers u et v tels que au + bv = d, alors d divise pgcd(a, b).
4. S’il existe deux entiers u et v tels que au + bv = d, alors pgcd(a, b) divise d.
5. Si pgcd(a, b) divise d, alors il existe un couple d’entiers (u, v) unique, tel que
au + bv = d.
6. L’entier d est un multiple de pgcd(a, b) si et seulement si il existe un couple
d’entiers (u, v), tel que au + bv = d.
24
1. Si un entier est congru à 0 modulo 6, alors il est divisible par 6.

2. Si le produit de deux entiers est congru à 0 modulo 6 alors l’un des deux est
multiple de 6.
3. Si un entier est congru à 5 modulo 6 alors toutes ses puissances paires sont
congrues à 1 modulo 6.
4. Si deux entiers sont congrus à 4 modulo 6, alors leur somme est congrue à 2
modulo 6.
5. Si deux entiers sont congrus à 4 modulo 6, alors leur produit est congru à 2
modulo 6.
6. Si un entier est congru à 4 modulo 6 alors toutes ses puissances sont aussi
congrues à 4 modulo 6.
1. Si le produit de deux entiers est congru à 0 modulo 5 alors l’un des deux est
multiple de 5.
2. Si un entier est congru à 2 modulo 5 alors sa puissance quatrième est congrue
à 1 modulo 5.
3. Si deux entiers sont congrus à 2 modulo 5, alors leur somme est congrue à 1
modulo 5.
4. Pour tout entier, il existe un entier tel que le produit des deux soit congru à 1
modulo 5.
5. Aucun entier n’est tel que son carré soit congru à −1 modulo 5.
6. Aucun entier n’est tel que son carré soit congru à 2 modulo 5.
7. La puissance quatrième d’un entier quelconque est toujours congrue à 1 modulo
5.
8. La puissance quatrième d’un entier non multiple de 5 est toujours congrue à 1
modulo 5.
2.2 Exercices
Exercice 1. Soit n un entier supérieur ou égal à 2.
√
1. Démontrer que si n n’est divisible par aucun entier inférieur ou égal à n, alors
n est premier.
2. Démontrer que les nombres n! + 2, n! + 3,. . . , n! + n ne sont pas premiers.
3. En déduire que pour tout n, il existe n entiers consécutifs non premiers.
Exercice 2. On choisit un nombre entier, on le divise par 7 et on trouve un reste égal
à 5. On divise à nouveau le quotient obtenu par 7, on trouve un reste égal à 3 et un
quotient égal à 12. Quel était le nombre de départ ?
25
Exercice 3. On donne l’égalité suivante.
96 842 = 256 × 375 + 842
Déterminer, sans effectuer la division, le quotient et le reste de la division euclidienne

de 96 842 par 256 et par 375.
Exercice 4. On donne les deux égalités suivantes.
3379026 = 198765 × 17 + 21, 609806770 = 35870986 × 17 + 8.
On s’intéresse au nombre entier N = 3379026 × 609806770. Quel est le reste de la

division euclidienne de N par 17 ?
Exercice 5. Quel est le plus petit entier naturel, qui divisé par 8, 15, 18 et 24 donne
pour restes respectifs 7, 14, 17 et 23 ?
Exercice 6. Dans une UE de maths à l’université Joseph Fourier, il y a entre 500 et 1000
inscrits. L’administration de l’université a remarqué qu’en les répartissant en groupes
de 18, ou bien en groupes de 20, ou bien aussi en groupes de 24, il restait toujours 9
étudiants. Quel est le nombre d’inscrits ?
Exercice 7. Soient a et b deux entiers tels que 1 6 a < b.
1. Soient q1 et r1 (respectivement : q2 et r2 ) le quotient et le reste de la division
euclidienne de a (respectivement : b) par b − a. Démontrer que
r1 = r2 et q2 = q1 + 1
2. On note q le quotient de la division euclidienne de b − 1 par a. Soit n > 0 un

entier. Exprimer en fonction de q et n le quotient de la division euclidienne de
ban − 1 par an+1 .
3. Soit d le pgcd de a et b. Déterminer le pgcd de A et B, où :
A = 15a + 4b et B = 11a + 3b
4. Montrer que d = pgcd(a + b, ppcm(a, b)).

5. Démontrer que si d = 1, alors pour tout m, n ∈ N, am et bn sont premiers entre
eux.
6. En déduire que pour tout n ∈ N, le pgcd de an et bn est dn .
Exercice 8. Soient a, b et c trois entiers relatifs.
1. Montrer que pgcd(ca, cb) = |c| × pgcd(a, b).
2. Montrer que si pgcd(a, b) = 1 et si c divise a, alors pgcd(c, b) = 1.
3. Montrer que pgcd(a, bc) = 1 si et seulement si pgcd(a, b) = pgcd(a, c) = 1.
26
4. Montrer que si pgcd(b, c) = 1 alors pgcd(a, bc) = pgcd(a, b)pgcd(a, c).

Exercice 9. Soient a, b ∈ N deux entiers tels que 0 < a < b.
1. Démontrer que si a divise b, alors pour tout n ∈ N∗ , na − 1 divise nb − 1.
2. Démontrer que le reste de la division euclidienne de nb − 1 par na − 1 est nr − 1,
où r est le reste de la division euclidienne de b par a.
3. Démontrer que le pgcd de nb − 1 et na − 1 est nd − 1, où d est le pgcd de a et b.
Exercice 10. Soit p un nombre premier.
1. On rappelle que pour tout k = 1, . . . , p − 1,
! !
p p−1
k =p
k k−1
!
p
En déduire que pour tout k = 1, . . . , p − 1, est divisible par p.
k
2. Grâce à la formule du binôme, en déduire que pour tous entiers relatifs a et b
dans Z, (a + b)p − ap − bp est divisible par p.
3. Démontrer par récurrence que pour tout a ∈ N, ap − a est divisible par p. (Bravo !
Vous venez de démontrer le Petit Théorème de Fermat.)
Exercice 11. Soit n un entier relatif. On pose a = 2n + 3 et b = 5n − 2.
1. Calculer 5a − 2b. En déduire le pgcd de a et b en fonction de n.
2. Procéder de même pour exprimer en fonction de n le pgcd de 2n − 1 et 9n + 4.
Exercice 12. Donner la décomposition en facteurs premiers des entiers suivants.
60 ; 360 ; 2400 ; 4675 ; 9828 ; 15200 ; 45864 ; 792792.
Exercice 13. On considère les couples d’entiers (a, b) suivants.

• a = 60, b = 84
• a = 360, b = 240
• a = 160, b = 171
• a = 360, b = 345
• a = 325, b = 520
• a = 720, b = 252
• a = 955, b = 183
• a = 1665, b = 1035
• a = 18480, b = 9828
Pour chacun de ces couples :
1. Calculer pgcd(a, b) par l’algorithme d’Euclide.
2. En déduire une identité de Bézout.
27
3. Calculer ppcm(a, b).

4. Déterminer l’ensemble des couples (u, v) d’entiers relatifs tels que :
au + bv = pgcd(a, b) .
5. Donner la décomposition en facteurs premiers de a et b.

6. En déduire la décomposition en facteurs premiers de pgcd(a, b) et ppcm(a, b), et
retrouver les résultats des questions 1 et 3.
Exercice 14. Soit n un entier naturel.

1. Démontrer qu’il existe deux entiers an et bn tels que :
√ √
(1 + 2)n = an + bn 2
2. Soient u et v deux entiers. Vérifier que
(v − u)an+1 + (2u − v)bn+1 = uan + vbn
3. Démontrer par récurrence que pour tout n, an et bn sont premiers entre eux.
4. Démontrer que an est premier avec bn+1 , pour tout n.
5. Démontrer que bn est premier avec an+1 et avec bn+1 , pour tout n.
Exercice 15. Soit a un entier naturel impair.

1. Démontrer que a2 ≡ 1 [8].
2. Démontrer que a4 ≡ 1 [16].
3. Démontrer que si a ≡ 1 [2n ], alors a2 ≡ 1 [2n+1 ].
4. Démontrer par récurrence que pour tout n > 3,
n−2
a2 ≡ 1 [2n ]
Exercice 16. Soient a et b deux entiers naturels premiers entre eux.

1. Démontrer que pour tout entier relatif n, il existe un couple d’entiers relatifs (s, t)
tels que n = sa + tb.
2. Soit q un entier strictement plus grand que a, et r un entier tel que 0 6 r 6 a.
Vérifier que qa + r = (q − r)a + r(a + 1). En déduire que pour tout entier
n > a(a + 1), il existe un couple d’entiers naturels (s, t) tels que n = sa + t(a + 1).
3. En utilisant une identité de Bézout, montrer qu’il existe deux entiers naturels
consécutifs, l’un multiple de a, l’autre multiple de b.
4. Déduire des questions précédentes qu’il existe un entier n0 tel que pour tout
n > n0 , il existe un couple d’entiers naturels (s, t) tels que n = sa + tb.
28
5. Au rugby, on peut marquer un essai (5 points), une transformation suivant un

essai (2 points), un drop (3 points) ou une pénalité (3 points). Montrer que le
nombre de points qu’une équipe de rugby ne peut pas atteindre à la fin d’un
match est fini. Quel est le plus grand score non réalisable ?
Exercice 17. Soient k un entier supérieur ou égal à 2 et m1 , . . . , mk des entiers, premiers

entre eux deux à deux. Pour tout i = 1, . . . , k, soit ai ∈ Z/mi Z. On note E l’ensemble
des entiers n tels que :
∀i = 1, . . . , k , n ≡ ai [mi ] .
1. On note M le produit m1 · · · mk et pour tout i = 1, . . . , k, m
ci = M/mi . Montrer
que mi et m
ci sont premiers entre eux.
2. Pour tout i = 1, . . . , k, soient ui et vi deux entiers tels que ui mi + vi m
ci = 1. On
ci . Montrer que ei ≡ 1 [mi ] et ei ≡ 0 [mj ], ∀j 6= i.
pose ei = vi m
3. On pose n0 = a1 e1 + · · · + ak ek . Montrer que n0 ∈ E.
4. Soit n un élément quelconque de E. Montrer que n − n0 est un multiple de M .
5. Démontrer que E = n0 + M Z = {n = n0 + hM , h ∈ Z}. (Bravo ! Vous venez de
démontrer le Théorème des Restes Chinois.)
Exercice 18. Calculer le reste de la division par 3, par 4, par 5, par 6, par 7, des
nombres suivants.
314314 ; 999999 ; 20072007 ; 3141631416
Exercice 19.
1. Montrer que 7 divise 22225555 + 55552222
2. Montrer que 11 divise
10 5
105 510
105 510
5 + 10
Exercice 20. Soient a, b, c trois entiers relatifs quelconques.

1. Démontrer que a + b + c divise a3 + b3 + c3 − 3abc.
2. Démontrer que si 7 divise a3 + b3 + c3 , alors 7 divise abc.
Exercice 21. Démontrer que chacune des relations suivantes est vraie pour tout n ∈ N.
1. 5 divise 22n+1 + 32n+1
2. 6 divise n3 − n
3. 6 divise 5n3 + n
4. 6 divise 4(42n − 1)
5. 7 divise 32n+1 + 2n+2
6. 8 divise 5n + 2 × 3n−1 + 1
29
7. 9 divise 4n − 1 − 3n
8. 11 divise 3n+3 − 44n+2
9. 11 divise 26n+3 + 32n+1
10. 16 divise 5n − 1 − 4n
11. 17 divise 26n+3 + 34n+2
12. 17 divise 27n+1 + 32n+1 + 510n+1 + 76n+1
13. 18 divise 22n+2 + 24n + 14
14. 19 divise 23n+4 + 33n+1
6n+2
15. 19 divise 22 +3
4n+1
16. 21 divise 2 +5
Exercice 22. Déterminer l’ensemble des entiers relatifs x, solutions des équations sui-
vantes.
1. 35x − 7 ≡ 0 [4]
2. 22x − 33 ≡ 0 [5]
3. 2x + 3 ≡ 0 [7]
4. 9x + 5 ≡ 0 [8]
5. x2 + x + 7 ≡ 0 [13]
6. x2 ≡ 1 [16]
7. x4 ≡ 7 [11]
8. x2 + x + 7 ≡ 0 [13]
9. x2 − 4x + 3 ≡ 0 [12]
10. x2 + (x + 1)2 + (x + 3)2 ≡ 0 [10]
Exercice 23. Déterminer l’ensemble des entiers naturels x, solutions des équations
suivantes.
1. 22x + 2x + 1 ≡ 0 [21]
2. 22x + 2x + 1 ≡ 0 [7]
3. 3x + 4x + 1 ≡ 0 [8]
4. 1x + 2x + 3x + 4x ≡ 0 [5]
Exercice 24. Dans tout l’exercice, a et b sont deux entiers naturels.

1. Démontrer que
aZ ∩ bZ = ppcm(a, b)Z .
2. Démontrer que a divise b si et seulement si bZ ⊂ aZ.
3. Démontrer que 2Z ∪ 3Z n’est pas un sous groupe de Z.
30
4. Démontrer que aZ ∪ bZ est un sous-groupe de Z si et seulement si a divise b ou

b divise a.
Exercice 25.
1. Écrire l’ensemble des multiples de cl(x) dans Z/5Z, pour x = 0, . . . , 4.
4. Soient n et x deux entiers naturels. Démontrer que les trois propositions suivantes
sont équivalentes.
(a) cl(x) admet un inverse pour la multiplication dans Z/nZ.
(b) x et n sont premiers entre eux.
(c) tout élément de Z/nZ est multiple de cl(x) dans Z/nZ.
5. Calculer l’inverse de cl(4) dans Z/9Z.
6. Calculer l’inverse de cl(8) dans Z/15Z.
7. Soit n un entier non premier. Montrer qu’il existe deux éléments de Z/nZ dont
le produit est cl(0). En déduire que (n − 1)! est divisible par n.
8. Soit p un entier premier. Montrer que pour tout entier x = 2, . . . , p − 2 il existe
un entier y = 2, . . . , p − 2, différent de x, tel que le produit xy soit congru à 1
modulo p. En déduire que (p − 1)! + 1 est divisible par p. (Bravo ! vous venez de
démontrer le Théorème de Wilson.)
2.3 QCM
rapporte 2 points.
Question 1. Étant donnés 7 nombres entiers consécutifs, on trouve toujours parmi

eux :
A au moins 4 multiples de 2.
B au moins un multiple de 6.
C au moins un nombre premier.
D au moins 2 multiples de 3.
E au moins deux multiples de 4.
Question 2. Soit n un entier.

A Si n est divisible par 4, alors n a au moins 4 diviseurs.
B Si n est divisible par 8, alors n a au moins 4 diviseurs.
31
C Si n a au moins 3 diviseurs, alors n n’est pas premier.

D Si n a au moins 3 diviseurs, alors n est pair.
E Si n est pair, alors n a au moins 3 diviseurs.
Question 3. On veut constituer la somme exacte de 63 e seulement à l’aide de pièces

de 2 e et de billets de 5 e.
A Il y a au plus 31 pièces de 2 e.
B Il peut y avoir exactement 10 pièces de 2 e.
C Il peut y avoir exactement 6 billets de 5 e.
D Il peut y avoir exactement 19 pièces de 2 e.
E Il peut y avoir 12 billets de 5 e.
Question 4.
A Si un nombre est divisible par 6 et par 9, alors il est divisible par 12.
B Si un nombre est divisible par 6 et par 4, alors il est divisible par 24.
C Si un nombre est divisible par 9 et par 4, alors il est divisible par 36.
D Si un nombre est divisible par 36 alors il est divisible par 24.
E Si un nombre est divisible par 24, alors il est divisible par 12.
Question 5. Soient a et b deux entiers quelconques.

A Si a divise b, alors pgcd(a, b) = a.
B Si un nombre divise ppcm(a, b), alors il divise a ou b.
C Si b = pgcd(a, b) × a alors b = a2 .
D Si a2 = pgcd(a, b) × b, alors a2 = b.
E Si ppcm(a, b) × a divise ab alors b = 1.
Question 6. Soient a et b deux entiers quelconques.

A Si a et b sont premiers entre eux, alors tout multiple commun de a et b est
multiple de ab.
B Si a et b sont pairs, alors ppcm(a, b) = ab/4.
C Si un entier est divisible à la fois par a et b, il est divisible par 2a − 3b.
D L’entier a2 − b2 est divisible par pgcd(a, b).
E L’entier a2 + b2 est divisible par ppcm(a, b).
Question 7. Soient a et b deux entiers premiers entre eux.

A Les entiers a + b et a − b sont premiers entre eux.
B Les entiers a + 2b et 2a + b sont premiers entre eux.
C Les entiers ab et a − b sont premiers entre eux.
D Les entiers a2 b et ab2 sont premiers entre eux.
E Les entiers a et b sont chacun premiers avec a + b et avec a − b.
Question 8. Soient a, b, d trois entiers.
32
A S’il existe 2 entiers u et v tels que au + bv = d, alors d = pgcd(a, b).

B S’il existe 2 entiers u et v tels que au + bv = d, alors d divise a et b.
C S’il existe 2 entiers u et v tels que au + bv = d, alors tout diviseur commun de
a et b divise d.
D Si d = pgcd(a, b), alors il existe un couple unique d’entiers (u, v) tel que au +
bv = d.
E Si a et b sont premiers entre eux, alors pour tout entier k, il existe deux entiers
u et v tels que au + bv = dk.
Question 9.
A Si un entier est congru à 0 modulo 12, alors, il est divisible par 9.
B Si le produit de deux entiers est congru à 0 modulo 12, alors l’un des deux au
moins est pair.
C Si le produit de deux entiers est congru à 1 modulo 12, alors l’un des deux au
moins est pair.
D Si le produit de deux entiers est congru à 1 modulo 12, alors ces deux entiers
sont congrus entre eux modulo 12.
E Si on divise par 12 le produit de 7 et d’un entier quelconque, on n’obtient jamais
un reste égal à 1.
Question 10.
A Si un entier est congru à 6 modulo 7, alors sa puissance troisième est congrue
à 1 modulo 7.
B Aucun entier n’est tel que son carré soit congru à −3 modulo 7.
C La puissance troisième de tout entier est congrue à 0 ou 1 modulo 7.
D Si le produit de deux entiers est congru à 0 modulo 7, alors l’un des deux au
moins est multiple de 7.
E Si un entier est congru à 2 modulo 7, alors sa puissance neuvième est congrue
à 1 modulo 7.
Réponses : 1–BD 2–BC 3–AD 4–CE 5–AC 6–AD 7–CE 8–CE 9–BD 10–DE
2.4 Devoir
répondu.
1. Soit a un entier. Montrer que l’ensemble des multiples entiers de a, noté aZ est
un sous-groupe de Z.
33
2. Soit G un sous-groupe de Z. Montrer qu’il existe un entier positif ou nul a tel

que G = aZ.
3. Soient a et b deux entiers non nuls. Montrer qu’il existe un entier strictement
positif d tel que :
{ sa + tb , s, t ∈ Z } = dZ .
4. Montrer que tout entier n qui divise à la fois a et b est un diviseur de d.
5. Soient a, b deux entiers premiers entre eux. Montrer qu’il existe deux entiers s et
t tels que sa + tb = 1 (identité de Bézout). En déduire que si c est un troisième
entier tel que a divise le produit bc, alors a divise c (lemme de Gauss).
Exercice 1 :
1. Démontrer par récurrence
√ que pour√tout n ∈ N, il existe deux nombres entiers an
et bn tels que (2 + 3)n = an + bn 3.
2. Soient u et v deux entiers et n ∈ N. Vérifier l’égalité suivante :
(2u − v)an+1 + (2v − 3u)bn+1 = uan + vbn .
3. Démontrer par récurrence que pour tout n, an et bn sont premiers entre eux.
4. Démontrer que pour tout n ∈ N, bn et bn+1 sont premiers entre eux.
5. Démontrer que pour tout n ∈ N, soit an et bn+1 sont premiers entre eux, soit
leurs diviseurs communs sont 1 et 2.
Exercice 2 : On pose a = 960 et b = 528.
1. Calculer pgcd(a, b) par l’algorithme d’Euclide, et en déduire une identité de Bé-
zout. Calculer ppcm(a, b).
2. Déterminer l’ensemble des couples (u, v) d’entiers relatifs tels que :
au + bv = pgcd(a, b) .
3. Donner la décomposition en facteurs premiers de a et b.

4. En déduire la décomposition en facteurs premiers de pgcd(a, b) et ppcm(a, b), et
retrouver les résultats de la question 1.
Exercice 3 :
1. Montrer que pour tout n ∈ N, 82n ≡ 1 [21].
n+1
2. En déduire que pour tout n ∈ N, 24 + 5 ≡ 0 [21].
2 2 2
84 84 84
3. Calculer les restes de la division par 21 de 6416 , 216 et 3216 .
Exercice 4 :
1. Résoudre dans Z l’équation 18x − 31 ≡ 0 [7].
2. Résoudre dans Z l’équation 18x2 − 31x + 11 ≡ 0 [7].
3. Résoudre dans Z l’équation 18x3 − 31x2 + 11x − 45 ≡ 0 [7].
34

1. Il suffit de vérifier que l’ensemble des multiples de a est stable par addition et
passage à l’opposé. Si s et t sont deux entiers, alors sa − ta = (s − t)a est bien
un multiple de a, d’où le résultat.
2. Le groupe G peut être réduit à {0} = 0Z. Sinon, il contient un élément non nul,
et son opposé. Il contient donc forcément un élément strictement positif. Donc
G ∩ N∗ est non vide. Notons a le plus petit élément de G strictement positif.
Puisque G est un sous-groupe de Z, aZ ⊂ G. Nous voulons montrer que G ⊂ aZ.
Soit b un élément quelconque de G. Effectuons la division euclidienne de b par
a : b = aq + r, avec r ∈ {0, . . . , a − 1}. Or b, aq et r = b − aq appartiennent
à G. Puisque a est le plus petit élément strictement positif de G, r = 0, donc
b = aq ∈ aZ.
3. D’après la question précédente, il suffit de vérifier que l’ensemble proposé est un
sous-groupe de Z, non réduit à {0}.
G = { sa + tb , s, t ∈ Z } .
Observons que G n’est pas réduit à {0} car a et b sont non nuls. Soient s, s0 , t, t0
4 entiers :
(sa + tb) − (s0 a + t0 b) = (s − s0 )a + (t − t0 )b ∈ G .
Donc G est bien un sous-groupe de Z. Donc G = dZ, où d est le plus petit élément
strictement positif de G.
4. Soit k un diviseur commun à a et b : k divise tout entier de la forme sa + tb, donc
tout élément de G, en particulier d. Donc d est le pgcd de a et b.
5. Si a et b sont premiers entre eux, leur pgcd est 1 et le groupe G de la question 3
est Z tout entier. Donc il existe deux entiers s et t tels que sa+tb = 1. Multiplions
les deux membres par c : sac + tbc = c. Or a divise ac et bc, donc sac + tbc. D’où
le résultat.
Exercice 1 :
1. La propriété est vraie pour n = 0 : a0 = 2 et b0 = 1. Supposons-la vraie pour
n ∈ N.
√ √ √
(2 + 3)n+1 = (2 + 3)(an + bn 3)
√
= (2an + 3bn ) + (an + 2bn ) 3 .
Donc la propriété est vraie pour n + 1, avec :
an+1 = 2an + 3bn et bn+1 = an + 2bn .
35
2. Il suffit d’utiliser les relations de récurrence donnant an+1 et bn+1 en fonction de

an et bn .
(2u − v)an+1 + (2v − 3u)bn+1 = (2u − v)(2an + 3bn ) + (2v − 3u)(an + 2bn )
= uan + vbn .
3. La propriété est vraie pour n = 0, car a0 = 1 et b0 = 1 sont premiers entre eux.

Supposons-la vraie pour n : il existe deux entiers u et v tels que uan + vbn = 1.
D’après la question précédente, (2u − v)an+1 + (2v − 3u)bn+1 = 1, donc an+1 et
bn+1 sont premiers entre eux. Donc pour tout n ∈ N, an et bn sont premiers entre
eux.
4. Reprenons la relation donnant bn+1 en fonction de an et bn : bn+1 = an + 2bn .
Soit d un entier divisant à la fois bn et bn+1 . Alors d divise an . Or le seul diviseur
commun de an et bn est 1, d’après la question précédente. Donc le seul diviseur
commun à bn et bn+1 est 1 : bn et bn+1 sont premiers entre eux.
5. Soit d un diviseur commun à an et bn+1 . Alors d divise bn+1 −an = 2bn . Or puisque
d divise an , d est premier avec bn , donc d divise 2, d’après le lemme de Gauss.
Exercice 2 : On pose a = 960 et b = 528.
1.
960 = 528 + 432 48 = 5 × 960 − 9 × 528
528 = 432 × 1 + 96 48 = −4 × 528 + 5 × 432
432 = 96 × 4 + 48 48 = 432 − 4 × 96
96 = 48 × 2 + 0
Le pgcd de a et b est 48. Le ppcm est leur produit divisé par 48, soit 10560.
2. Posons a0 = a/pgcd(a, b) = 20 et b0 = b/pgcd(a, b) = 11. Deux entiers u et v
vérifient au + bv = pgcd(a, b) si et seulement si a0 u + b0 v = 1. Par l’algorithme
d’Euclide, nous avons déterminé deux entiers u0 = 5 et v0 = −9 tels que au0 +
bv0 = pgcd(a, b), soit a0 u0 + b0 v0 = 1. Deux entiers u et v vérifient a0 u + b0 v = 1 si
et seulement si a0 (u − u0 ) + b0 (v − v0 ) = 0. Or a0 et b0 sont premiers entre eux. Par
le lemme de Gauss, a0 divise (v − v0 ) et b0 divise (u − u0 ). Donc deux entiers u et
v vérifient a0 u + b0 v = 1 si et seulement s’il existe un entier k tel que u = u0 + kb0
et v = v0 − ka0 . L’ensemble demandé est donc :
{ (5 + 11k, −9 − 20k) , k ∈ Z } .
3. On trouve :
a = 26 × 3 × 5 et b = 24 × 3 × 11 .
4. De la décomposition de a et b en facteurs premiers, on déduit :
pgcd(a, b) = 24 × 3 = 48 et ppcm(a, b) = 26 × 3 × 5 × 11 = 10560 .
36
Exercice 3 :
1. Le résultat est vrai pour n = 0. Il est vrai aussi pour n = 1, car 82 = 64 =
63 + 1 ≡ 1 [21]. Supposons-le vrai pour n ∈ N. Alors :
82(n+1) = 82 82n ≡ 1 × 1 ≡ 1 [21] .
Donc pour tout n ∈ N, 82n ≡ 1 [21].
2. Observons que pour tout entier n :
n+1 n n
n+1 −4n
n
n
n
n

24 − 24 = 24 24 − 1 = 24 23×4 − 1 = 24 84 − 1 .
n
Or pour n > 1, 84 est une puissance paire de 8, qui d’après la question pré-
n+1 n
cédente, est congrue à 1 modulo 21. Donc pour n > 1, 24 ≡ 24 [21]. Or
24 + 5 = 21 ≡ 0 [21]. Le résultat s’ensuit, par récurrence.
3. On déduit de la première question que :
2 2
84 84
6416 = 82×16 ≡ 1 [21] .
On déduit de la deuxième question que :
42 42
168 42×8
2 =2 ≡ −5 [21] .
Or : 2 2 2
84 84 84
6416 = 216 3216 .
4 2
168
Donc le reste de la division par 21 de 32 est l’entier r compris entre 0 et 20
tel que −5r ≡ 1 [21], à savoir r = 4.
Exercice 4 :
1. Observons que 18 ≡ 4 [7] et 31 ≡ 3 [7]. Le tableau suivant donne les valeurs de
4x quand x parcourt Z/7Z.
x 0 1 2 3 4 5 6
4x 0 4 1 5 2 6 3
L’ensemble des solutions de l’équation 18x − 31 ≡ 0 [7] est l’ensemble des entiers
congrus à 6 modulo 7.
2. Procédons de même, en observant que −11 ≡ 3 [7].
x 0 1 2 3 4 5 6
4x2 0 4 2 1 1 2 4
3x 0 3 6 2 5 1 4
4x2 − 3x 0 1 3 6 3 1 0
Donc l’ensemble des solutions de l’équation proposée est l’ensemble des entiers
congrus à 2 ou à 4 modulo 7.
37
3. On procède comme dans les questions précédentes, après avoir ramené l’équation
proposée à 4x3 + 4x2 + 4x ≡ 3 [7].
x 0 1 2 3 4 5 6
x2 0 1 4 2 2 4 1
x3 0 1 1 6 1 6 6
3 2
4x + 4x + 4x 0 5 0 2 0 4 3
L’ensemble des solutions est l’ensemble des entiers congrus à 6 modulo 7.
38
3 Compléments
3.1 Abacistes contre algoristes
Dans toutes les civilisations ayant développé un système d’écriture, une notation
pour les nombres est apparue. La majorité de ces systèmes de numération étaient
décimaux (en base 10) à l’exception notable des Babyloniens (base 60 : il nous en
reste des traces dans notre manière de diviser les heures et les minutes) et des Mayas
(base 20). Quelle que soit la base, le système de notation par chiffres que nous utilisons
actuellement ne s’imposait aucunement. Les Babyloniens, les Égyptiens, les Grecs et
les Romains avaient des notations différentes pour chaque puissance de la base. Vous
connaissez sans doute la notation en chiffres romains : I pour un, V pour cinq, X pour
dix, C pour cent, D pour cinq cent, M pour mille. Mais l’écriture de très grands nombres
était vite limitée.
Parallèlement aux systèmes de notation des chiffres, des outils de calcul, permettant
de réaliser les opérations usuelles sont également apparus très tôt. On les désigne sous
le nom générique d’abaques (qui vient d’un mot grec signifiant « table à poussière »).
Le principe commun est de constituer des colonnes dans lesquelles on place de petits
cailloux (calculus en latin, d’où le mot « calcul ») ou des jetons. Chaque colonne est
associée à une puissance de dix : le nombre de jetons dans la colonne de droite indique
le chiffre des unités, dans la colonne suivante le chiffre des dizaines, etc. Les bouliers
sont des abaques dont les colonnes sont remplacées par des tiges le long desquelles
on fait descendre les jetons. Pour passer d’un abaque à la numération de position, il
fallait d’une part avoir l’idée de représenter par un symbole chacune des 9 quantités
de jetons que l’on pouvait trouver dans une colonne, et aussi inventer un symbole pour
noter une colonne vide. Ce passage a été effectué en Inde, semble-t-il dès les premiers
siècles de notre ère. Mais noter ainsi un nombre en calquant sa représentation sur un
abaque, ne signifiait pas pour autant que l’on sache effectuer des calculs sans abaque,
en écrivant seulement des nombres. Il fallait pour cela accepter de considérer le symbole
de la colonne vide, le zéro, comme un nombre ayant ses propres règles de calcul. Il est
difficile de dater précisément l’apparition du zéro. La première trace indiscutable se
trouve dans l’œuvre du mathématicien-astronome Āryabhata, en 499 après J.-C. On y
trouve explicitement énoncée la notion de position. Voici le début de son poème, écrit
en strophes de deux vers.
Ayant rendu hommage à Brahma, à la Terre, à la Lune, à Mercure, à Vénus,
au Soleil, à Mars, à Jupiter, à Saturne et aux constellations, Āryabhata en la
Cité des Fleurs (Pataliputra), expose comme suit les éléments de la science
très vénérable.
Eka (unités), daçan (dizaines), çata (centaines), sahasra (milliers), ayuta
(dix-milliers), niyuta (cent milliers), prayuta (millions), kôti (dix-millions),
arbuda (cent millions), et vārnda (milliards) sont, de place en place, dé-
cuples l’un de l’autre.
39
Brāhmagupta (598–668) est l’un des plus célèbres mathématiciens-astronomes indiens.

Il reprend la nomenclature des puissances de 10, la pousse jusqu’à 1017 , et ne laisse lui
non plus aucun doute sur la nouveauté de la notation.
Eka, daçann, çata, sahasra, ayuta, laxa, prayuta-kôti, arbuda, abja (ou
padna), kharva, nikharva, nahāpadma, çanku, jahadri, anlya, madhya, pa-
rārdha, sont les places successives, croissant par multiplication de dix en
dix, établies pour la pratique par les anciens.
Son œuvre principale, Brāhmasphutasiddhānta (écrite en 628), contient deux chapitres
de mathématiques. Pour la première fois les règles de calcul avec le zéro sont énoncées
explicitement. Pour Brāhmagupta, le zéro est défini comme la somme de deux quantités
opposées : un bien et une dette. Les commerçants indiens ne tardent pas à diffuser la
découverte, qui se répand rapidement vers le monde musulman alors en plein essor
(l’Égire date de 622). Plus tard en Inde, Bhāskara II (1114–1185) donne les règles de
multiplication et de division par zéro, et donc invente l’infini.
Cette quantité appelée « celle dont le diviseur est zéro », ni l’addition ni la
soustraction d’aucune quantité finie ne peut la modifier, exactement comme
nulle altération n’a lieu en Brahman immuable et infini quand en Lui la
totalité des mondes est résorbée à la fin d’une création ni quand de Lui est
soustraite la totalité des mondes au début d’une création nouvelle.
Au nom de Bhāskara est souvent associé Achārya (le Professeur) ; appréciez sa façon
de poser un exercice.
Dis-moi, chère et belle Lilavati, toi qui as des yeux comme ceux du faon,
dis-moi quel est le résultat de la multiplication de 135 par 12.
La première mention des chiffres indiens hors de l’Inde est due à Sévère Sebôkht, figure
de proue de l’Église nestorienne en Syrie au viie siècle.
J’éviterai toute discussion sur la science des Indiens, [. . . ] sur leurs décou-
vertes subtiles en astronomie, découvertes qui sont plus ingénieuses que
celles des Grecs et des Babyloniens, sur leurs méthodes de calcul de grande
valeur qui dépassent la description. Je désire seulement dire que leurs cal-
culs sont faits au moyen de neuf signes. Si ceux qui croient, parce qu’ils
parlent Grec, qu’ils sont arrivés aux limites de la science, lisaient les textes
indiens, ils seraient convaincus bien qu’un peu tard, que d’autres savent des
choses de valeur.
Ces « méthodes de calcul de grande valeur » convainquirent les savants musulmans, qui
se mirent à les diffuser. Al-Khawarizmi écrit son livre « sur le calcul avec les nombres
Hindous » en 825, puis al Kindi publie quatre tomes sur le même sujet en 830. Ces
livres furent responsables de la diffusion du système de numération indien dans le
monde islamique, puis finalement en occident. Le mot algorithme s’est d’abord écrit
algorizme en l’honneur d’al-Khawarizmi puis a changé d’orthographe sous l’influence
du grec. Son sens a beaucoup varié au cours des siècles. L’Encyclopédie de Diderot et
40
d’Alembert le définit joliment comme « l’Art de supputer avec justesse et facilité ». Il

a longtemps désigné le calcul par la numération de position, dont les partisans étaient
nommés algoristes.
La diffusion de la numération décimale en Europe a certainement démarré en Es-
pagne, où marchands et savants musulmans, juifs et chrétiens ont eu de très nombreux
contacts au cours des siècles. D’ailleurs la première trace écrite des chiffres arabes dans
un texte en latin se trouve dans le « Codex Vigilianus » écrit dans un monastère arago-
nais en 976. On ignore si Gerbert d’Aurillac (938–1003) a eu connaissance de ce texte.
Fils de serf auvergnat, il entre très jeune au monastère d’Aurillac et y commence ses
études. Emmené à Barcelone par le comte Borel II en 963, il y découvre la numération
de position. Devenu évêque, puis pape sous le nom de Sylvestre II, il use de son autorité
pour la promouvoir auprès des savants occidentaux. Il invente en particulier un système
d’abaque dans lequel il remplace les cailloux dans une colonne par un jeton portant
l’un des chiffres arabes. Certains voient dans ce genre d’artifice une des origines pos-
sibles de la grande variété de forme qu’ont pu prendre les chiffres au cours du temps.
Encore de nos jours, deux séries de chiffres cohabitent : ceux que vous connaissez, et
les chiffres « arabes orientaux » utilisés dans de nombreux pays. Elles ont émergé petit
à petit de quantités d’écritures différentes. Ce qui frappe pourtant dans les différentes
formes qu’ont pu prendre les dix symboles c’est qu’elles se déduisent souvent les unes
des autres par rotation. Dans leur forme actuelle, le 2 et le 3 sont des rotations de 90
degrés des chiffres arabes orientaux correspondants. D’où sont venues ces rotations ?
Deux explications sont avancées. L’une tient à la pratique d’écrire ces chiffres sur des
jetons pour le calcul sur abaque, comme le préconisait Gerbert d’Aurillac : ces jetons
étant ronds, on a pu facilement oublier la position exacte dans laquelle il convenait de
les placer. L’autre explication tient à l’habitude des copistes d’écrire horizontalement
sur des rouleaux de payrus qui pouvaient ensuite être lus verticalement. Nous vous
laissons choisir. . .
Même après Gerbert, la numération de position mit encore très longtemps à s’im-
poser en Europe. Quand Fibonacci écrit son « Liber Abaci » en 1202, il fait encore
figure de précurseur. Il est probablement responsable de l’équivalent latin « zephirum »
du mot arabe Sifr signifiant « vide », qui a donné chiffre, et zéro (mais pas zéphir, qui
vient du Grec). La controverse entre abacistes et algoristes bat son plein pendant la
Renaissance (figure 1). Elle mettra très longtemps à s’éteindre : en France sous Louis
XIV, on enseignait encore l’usage du boulier plutôt que le calcul sur papier. La victoire
des algoristes ne sera totale qu’au xviiie siècle.
3.2 Des grains de sable dans l’univers

Cherchant à évaluer le nombre de grains de sable contenus dans l’univers dans son
« Arénaire », Archimède est amené à théoriser la notation des grands nombres. Dans
ce texte, il désigne par « myriade » notre dizaine de milliers.
41
Figure 1 – Abacistes et algoristes : illustration du livre de Georg Reisch, Margarita

philosophica cum additionibus novis, Basilae, Schottus, (1508)
Il est des personnes, ô roi Gélon, qui pensent que le nombre des grains de
sable est infini. Je ne parle point du sable qui est autour de Syracuse et qui
est répandu dans le reste de la Sicile, mais bien de celui qui se trouve non
seulement dans les régions habitées, mais encore dans les régions inhabitées.
Quelques-uns croient que le nombre des grains de sable n’est pas infini, mais
qu’il est impossible d’assigner un nombre plus grand. Si ceux qui pensent
ainsi se représentaient un volume de sable qui fût égal à celui de la terre, qui
remplît toutes ses cavités, et les abîmes de la mer, et qui s’élevât jusqu’aux
sommets des plus hautes montagnes, il est évident qu’ils seraient bien moins
persuadés qu’il pût exister un nombre qui surpassât celui des grains de sable.
Quant à moi, je vais faire voir par des démonstrations géométriques aux-
quelles tu ne pourras refuser ton assentiment, que parmi les nombres dé-
nommés par nous dans les livres adressés à Zeuxippe, il en est qui excèdent
le nombre des grains d’un volume de sable égal non seulement à la grandeur
de la terre, mais encore à celui de l’univers entier.
[. . . ]
Telles sont les suppositions que nous faisons. Mais je pense qu’il est néces-
saire à présent d’exposer les dénominations de nombres ; si je n’en disais
rien dans ce livre, je craindrais que ceux qui n’auraient pas lu celui que j’ai
adressé à Zeuxippe ne tombassent dans l’erreur. On a donné des noms aux
42
nombres jusqu’à une myriade et au-delà d’une myriade, les noms qu’on a
donné aux nombres sont assez connus, puisqu’on ne fait que répéter une
myriade jusqu’à dix mille myriades.
Que les nombres dont nous venons de parler et qui vont jusqu’à une my-
riade de myriades soient appelés nombres premiers, et qu’une myriade de
myriades des nombres premiers soit appelée l’unité des nombres seconds ;
comptons par ces unités, et par les dizaines, les centaines, les milles, les
myriades de ces mêmes unités, jusqu’à une myriade de myriades. Qu’une
myriade de myriades des nombres seconds soit appelée l’unité des nombres
troisièmes ; comptons par ces unités, et par les dizaines, les centaines, les
milles, les myriades de ces mêmes unités, jusqu’à une myriade de myriades ;
qu’une myriade de myriades des nombres troisièmes soit appelée l’unité des
nombres quatrièmes ; qu’une myriade de myriades de nombres quatrièmes
soit appelée l’unité des nombres cinquièmes, et continuons de donner des
noms aux nombres suivants jusqu’aux myriades de myriades de nombres
composés de myriades de myriades des nombres troisièmes.
Bon, vous avez compris, Archimède sait compter jusqu’à beaucoup !
3.3 Les comptes binaires de l’Empereur de Chine

Voici ce qu’on trouve à l’article « Numération » dans l’Encyclopédie de Diderot et
d’Alembert.
Weigelius enseigne comment on pourroit nombrer sans passer le chiffre 4,
c’est-à-dire, en répétant seulement les chiffres 1, 2, 3, 4 ; & M. Léibnitz,
dans ce qu’il appelloit son arithmétique binaire, s’est servi des deux chiffres
1, 0, seulement, pour exprimer toutes sortes de nombres. Mais ces sortes de
manieres de calculer sont plus curieuses qu’utiles. Voyez Binaire.
Les informaticiens apprécieront le « plus curieuses qu’utiles ». Mais Leibniz est-il bien
l’inventeur de l’arithmétique binaire ? Reportons-nous à l’article « Binaire ».
[. . . ] ainsi dans toute l’arithmétique binaire il n’y auroit que deux caracteres,
1 & 0. Le zéro auroit la puissance de multiplier tout par deux, comme dans
l’Arithmétique ordinaire il multiplie tout par dix : 1 seroit un ; 10, deux ;
11, trois ; 100, quatre ; 101, cinq ; 110, six ; 111, sept ; 1000, huit ; 1001,
neuf ; 1010, dix, &c. ce qui est entierement fondé sur les mêmes principes
que les expressions de l’Arithmétique commune. Il est vrai que celle-ci se-
roit très incommode par la grande quantité de caracteres dont elle auroit
besoin, même pour de très-petits nombres. Il lui faut, par exemple, quatre
caracteres pour exprimer huit, que nous exprimons par un seul. Aussi M.
Leibnitz ne vouloit-il pas faire passer son arithmétique dans un usage po-
pulaire ; il prétendoit seulement que dans les recherches difficiles elle auroit
des avantages que l’autre n’a pas, & qu’elle conduiroit à des spéculations
43
plus élevées. Le P. Bouvet, jésuite, célebre missionnaire de la Chine, à qui

M. Leibnitz avoit écrit l’idée de son arithmétique binaire, lui manda qu’il
étoit très-persuadé que c’étoit-là le véritable sens d’une ancienne énigme
chinoise laissée il y a plus de 4000 ans par l’empereur Fohi, fondateur des
Sciences à la Chine, aussi-bien que de l’empire, entendue apparemment
dans son siecle, & plusieurs siecles après lui, mais dont il étoit certain que
l’intelligence s’étoit perdue depuis plus de 1000 ans, malgré les recherches
& les efforts des plus savans lettrés, qui n’avoient vû dans ce monument
que des allégories puériles & chimériques. Cette énigme consiste dans les
différentes combinaisons d’une ligne entiere & d’une ligne brisée, répetées
un certain nombre de fois, soit l’une, soit l’autre. En supposant que la ligne
entiere signifie 1, & la brisée 0, on trouve les mêmes expressions des nombres
que donne l’arithmétique binaire. La conformité des combinaisons des deux
lignes de Fohi, & des deux uniques caracteres de l’arithmétique de M. Leib-
nitz, frappa le P. Bouvet, & lui fit croire que Fohi & M. Leibnitz avoient eu
la même pensée.
Loin d’être vexé de n’être pas le premier, Leibniz s’était montré très intéressé, et avait
beaucoup réfléchi aux implications philosophiques de l’arithmétique binaire. Voici ce
qu’il écrit le 18 août 1705 dans une lettre au Révérent Père Verjus.
Et comme il s’est trouvé que ma nouvelle Arithmétique binaire (qui au lieu
de la progression décadique se sert de la dyadique, et n’a point d’autres
notes que 0 et 1, et par conséquent montre d’abord beaucoup d’ordre des
périodes et une liaison merveilleuse en toute sorte de suites des nombres) est
parfaitement exprimée par les anciens caracteres de Fohi dont les Chinois
des le temps de Confucius avaient déja perdu la signification ; il me semble
que cette découverte, petite a la vérité, mais surprenante, doit contribuer a
nous éveiller, tant en Europe qu’a la Chine, parce qu’elle pourra faire une
grande impression sur l’empereur de la Chine et sur des personnes intelli-
gentes de ce pays, pour réveiller leur curiosité par rapport a la recherche
des origines et de la théologie et philosophie des anciens Chinois, que ce
rapport des caracteres de Fohi montre de n’avoir pas toujours été des gens
aussi superficiels qu’on pourrait bien avoir cru. Je crois qu’a Rome meme
la connaissance de cette découverte pourra faire un bon effet, pour don-
ner une meilleure opinion de l’antiquité reculée de ces peuples éloignés. Et
aupres des Chinois memes elle peut servir a leur rendre plus recevable un
des grands articles, et non pas des plus aisés de notre religion, et de notre
métaphysique, qui porte que Dieu et rien font l’origine de toutes choses, que
Dieu a tout créé de rien, et le fait encore, la conservation n’étant qu’une
création continuelle. Car cette origine des choses de Dieu et de rien, re-
çoit un grand éclaircissement de l’analogie qu’elle a avec l’origine de tous
les nombres de l’unité et du zéro, puisque tous les nombres se peuvent et
meme se doivent exprimer le plus scientifiquement par les deux notes 1 et
44
0, et par conséquent par un rapport unique et continuel a ces deux premiers

éléments des nombres.
Il développera encore plus sa philosophie du binaire dans un « Discours sur la théologie
naturelle des Chinois » (1716). Mais qu’en est-il de la numération binaire chinoise, et
d’abord qui était ce Fohi ?
Premier empereur mythique de la Chine, Fohi (ou Fu-xi ou Fu Hsi) aurait inventé,
quelque 3000 ans avant notre ère, à peu près tout : mariage, noms de famille, écriture,
numération décimale. . . Quid des symboles binaires ? Ils apparaissent dans le Yi Jing,
ou traité des mutations, sur l’auteur duquel on ne sait à peu près rien, sauf qu’il a
dû vivre au moins 800 ans avant notre ère. À la base se trouvent le Yin (solaire,
masculin. . . ) et le Yang (lunaire, féminin. . . ) Le Yin est représenté par un trait plein
et le Yang par un trait discontinu. On forme alors les huit trigrammes qui sont les huit
manières de représenter 3 traits, pleins ou discontinus. Chacun est associé à plusieurs
interprétations. Par exemple − − a pour image naturelle le feu, comme qualités la
clarté, la lucidité, la vivacité, l’éclat, et est aussi associé à ce qui s’attache, à la fille
cadette, à l’œil, etc. Observez le drapeau actuel de la République de Corée du Sud :
quatre des des huit trigrammes y entourent le symbole du Yin et du Yang. En combinant
deux à deux chacun des huit trigrammes, on obtient 64 hexagrammes, chargés à leur
tour chacun d’une signification symbolique. Mais faut-il voir pour autant dans cet outil
de divination le premier code ascii ? Ce serait aller un peu vite. Rien n’indique que les
Chinois aient associé les 64 premiers entiers aux 64 hexagrammes. D’ailleurs dans le
Bagua, les 8 trigrammes sont toujours représentés autour d’un octogone, et dans un
ordre autre que lexicographique.
Il est bien possible que Leibniz se soit laissé quelque peu emporter par son enthou-
siasme, et que l’invention de l’informatique ne soit pas à mettre entièrement au crédit
de Fohi, comme celles du mariage et de l’écriture.
3.4 Chasles contre Libri

À l’article « Inde » de l’Encyclopédie de Diderot et d’Alembert, publiée entre 1751
et 1772, on lit :
L’Arithmétique n’y étoit pas moins perfectionnée ; les chiffres dont nous
nous servons, & que les Arabes ont apportés en Europe du tems de Char-
lemagne, nous viennent de l’Inde.
Il n’y avait donc pas de doute sur l’origine de la numération. Et pourtant il ne fut
pas facile pour les savants occidentaux, pétris d’humanisme et de belles lettres, formés
aux mathématiques par Euclide, d’admettre qu’une invention aussi fondamentale que
la numération de position ne venait pas des Grecs, mais des Indiens et des Arabes.
L’un des débats les plus virulents oppose à partir de 1836, Michel Chasles (1793–1880)
à Guillaume Libri (1803–1869).
Le second, aristocrate italien d’origine, est un personnage peu ordinaire. Son nom
complet est « Guglielmo Bruto Icilio Timoleone Libri Carruci dalla Sommaja ». Nommé
45
à 20 ans professeur de physique mathématique à Pise, il part dès l’année suivante pour
une année sabbatique en France, où ses origines et ses connaissances lui permettent
de se lier avec les plus grands scientifiques de l’époque. De retour en Italie, ses idées
libérales et son activisme politique le compromettent vite, et il doit s’exiler. Revenu
en France, sa réputation scientifique grandit. Il est naturalisé français en 1833 et est
élu la même année à l’Académie des Sciences. Il obtient une chaire de professeur à la
Sorbonne puis au Collège de France, et reçoit la Légion d’Honneur. Il est même nommé
Inspecteur Général des Bibliothèques en 1841. Les doutes des bibliothécaires sur les
coïncidences entre ses visites et des disparitions de manuscrits, conduisent à sa mise en
accusation. Il est expulsé de l’Académie en 1847 par un billet laconique.
Monsieur, vous ignorez sans doute la découverte qui a été faite du rap-
port judiciaire concernant votre inspection dans les bibliothèques publiques.
Croyez-moi, épargnez à la Société Nouvelle des réactions qui lui répugnent ;
ne venez plus à l’Institut.
Il a la sagesse de suivre le conseil, et quitte Paris pour l’Angleterre avant d’être
condamné par contumace à 10 ans de réclusion par la cour d’assise du département
de la Seine en 1850. On trouve dans le jugement des détails impressionnants sur la
masse de livres et de manuscrits que Libri avait accumulés : 17 caisses saisies chez lui,
sans compter tous ceux qu’il avait réussi à expédier à l’étranger, en tout une collection
estimée à 30 000 documents. On y trouve aussi quelques détails savoureux.
Le jeune Abry aurait déclaré à deux témoins qu’il avait travaillé chez Libri ;
que pendant quinze jours ou trois semaines il avait été employé à gratter
et à faire disparaître des cachets et timbres sur les livres ; que Libri avait
voulu se mêler de ce travail mais qu’il avait dû l’abandonner parce qu’il s’en
acquittait mal et qu’il faisait des trous dans le papier.
Libri se défend vigoureusement depuis Londres dans un long plaidoyer, intitulé « Lettre
à M. De Falloux, Ministre de l’Instruction Publique et des cultes contenant le récit d’une
odieuse persécution et le jugement porté sur cette persécution par les hommes les plus
compétents et les plus considérables de l’Europe. » Elle commence ainsi.
On ne me taxera pas l’impatience. Il y a aujourd’hui un an, que le
Moniteur Universel, obéissant aux ordres de mes ennemis personnels, me
calomniait officiellement au nom du Gouvernement provisoire de la Répu-
blique française ! Cette publication a rencontré le blâme général : ce Rapport,
à l’aide duquel on avait espéré me perdre, est devenu la risée de l’Europe,
et pourtant je n’ai encore vu mettre un terme à aucune des mesures ex-
ceptionnelles qui ont été prises contre moi. Tous mes biens saisis et mal
protégés ; ma bibliothèque, mes travaux scientifiques, ma correspondance
la plus intime, tous mes papiers, livrés sans inventaire, sans aucune forme
protectrice à mes ennemis devenus maîtres absolus chez moi [. . . ]
Rien n’y fera : malgré le soutien de quelques amis, dont Prosper Mérimée qui ira même
en prison pour une défense un peu trop vigoureuse, son procès ne sera pas révisé et il
46
ne reviendra jamais en France. Il réussira tout de même à revendre une partie de sa

collection en Angleterre à des acheteurs de bonne foi, que les bibliothèques devront plus
tard dédommager pour récupérer leur bien. On découvre encore de temps en temps,
éparpillés ici ou là, des manuscrits de la « collection Libri » d’une importance cruciale
pour l’histoire des mathématiques : une lettre de Descartes, un mémoire d’Abel, les
manuscrits de Sophie Germain. . .
Mais Libri (un nom prédestiné pour un bibliophile aussi acharné) n’est pas connu
que pour sa condamnation. Il est l’auteur de plusieurs mémoires de mathématiques, et
surtout d’une monumentale « Histoire des Sciences Mathématiques en Italie depuis la
renaissance des lettres jusqu’à la fin du dix-septième siècle », en quatre tomes. Dans
un style très vivant, il y laisse libre cours aux trois passions de sa vie : son combat pour
la nation italienne, son goût pour les livres et manuscrits anciens, et les sciences.
[. . . ] à la fin du seizième siècle, lorsque le peuple italien ne savait même
plus murmurer, Galilée a rendu à sa patrie une gloire qu’elle ne semblait
pas pouvoir espérer. Ces exemples devraient de nos jours servir de guide
en Italie aux esprits élevés et imposer silence à ces hommes qui attribuent
toujours au peuple la cause de leur petitesse, et qui voudraient trouver dans
les circonstances politiques une excuse à leur nullité.
Dans le premier tome, il défend vigoureusement l’origine indienne de la numération de
position, et règle au passage quelques comptes.
L’Histoire de l’astronomie ancienne de Delambre (Tom. I, p.400–556) con-
tient un exposé assez détaillé des méthodes astronomiques des Hindous.
Cependant, il faut avouer que Delambre, plus occupé à combattre Bailly
qu’à suivre la marche des sciences, a toujours montré une trop grande pré-
vention contre les travaux des Orientaux. Quoiqu’il eût connaissance des
Mémoires de la société asiatique de Calcutta, ainsi que du Liliwati et du
Bija Ganita, où se trouvent exposées tant de belles recherches mathéma-
tiques, il ne craignit pas d’écrire le passage suivant : « Après ce que nous
avons annoncé des Chinois et des Indiens, il serait fort inutile d’exposer
ici des travaux grossiers ou tardifs de ces deux peuples, qui sont toujours
restés étrangers aux progrès de la science. Nous renverrons aux deux cha-
pitres que nous avons consacrés à leur histoire. Qu’il nous suffise de rappeler
qu’on ne leur connaît aucun instrument, aucune science géométrique, au-
cune méthode qui n’ait été tirée directement ou indirectement des écrits
des Grecs. »
Dans le tome 2, paru en 1840, Libri s’étend longuement sur sa controverse avec Chasles
à propos de l’origine de la numération de position, même si au détour d’une page, il
reconnaît :
Au reste, M. Chasles et moi nous nous trouvons d’accord sur beaucoup
d’autres points. Je suis heureux de voir qu’il a adopté mes idées sur la
47
prétendue géométrie de position des Arabes et sur le peu de cas que l’on
doit faire de l’inexactitude de Delambre.
Qu’avait donc affirmé Chasles qui prête autant à controverse ? Il avait publié en 1836 à
Bruxelles un mémoire « sur le passage du premier livre de la géométrie de Boèce relatif
à un nouveau système de numération »
De ce qui précède nous croyons pouvoir conclure que le système de numéra-
tion exposé par Boèce est le système décimal, dans lequel les neuf chiffres,
dont il se sert prenaient des valeurs de position, croissant en progression
décuple de droite à gauche.
Boèce (480-524) est bien l’auteur d’une « Institution Arithmétique » dans laquelle il
traduit en Latin et commente les œuvres de Nicomaque de Gérase, il a peut-être écrit
un traité de géométrie commentant l’œuvre d’Euclide, mais celui-ci n’a jamais été
retrouvé. La « Géométrie » que Chasles lui attribue est un faux. Le bibliophile averti
qu’est Libri n’a aucune peine à tailler en pièces le mémoire de Chasles. La controverse
a eu au moins deux suites heureuses : l’étude des sources mathématiques arabes en a
été ravivée, et Chasles, après la condamnation de Libri a finalement obtenu comme il
le souhaitait depuis si longtemps son siège à l’Académie. Mais le manuscrit de Boèce
n’était qu’un galop d’essai : trente ans plus tard, Chasles réalisera son coup de maître
en achetant à un certain Vrain-Lucas des milliers de faux grossiers dont il tirera encore
quelques communications retentissantes à l’Académie des Sciences.
3.5 Ils sont amicaux, parfaits. . . voire excessifs

Si n est un entier, ses diviseurs autres que lui-même sont dits propres : 1, 2, et 5
sont les diviseurs propres de 10. On disait autrefois « partie aliquote », du mot latin
signifiant « plusieurs fois ». Notons s(n) la somme des diviseurs propres de n.
• Si s(n) < n, n est dit déficient
• Si s(n) = n, n est dit parfait
• Si s(n) > n, n est dit excessif, excédent ou abondant
• Si s(n) = n + 1, n est dit quasi-parfait
En bon successeur de Pythagore, Nicomaque de Gérase accompagne cette classifica-
tion d’une interprétation symbolique dans son « Introduction à l’arithmétique », au iie
siècle ap. J.C. Il associe aux nombres abondants l’excès, l’ambition. . . et aux nombres
déficients le manque, les défauts, la pauvreté, les nombres parfaits étant parés de toutes
les vertus :
Il arrive que, de même que le beau et le parfait sont rares et se comptent
aisément, tandis que le laid et le mauvais sont prolifiques, les nombres ex-
cédents et déficients sont en très grand nombre et en grand désordre ; leur
découverte manque de toute logique. Au contraire, les nombres parfaits se
comptent facilement et se succèdent dans un ordre convenable ; on n’en
trouve qu’un seul parmi les unités, 6, un seul dans les dizaines, 28, un
48
troisième assez loin dans les centaines, 496 ; quant au quatrième, dans le
domaine des mille, il est voisin de dix mille, c’est 8128. Ils ont un carac-
tère commun, c’est de se terminer par un 6 ou par un 8, et ils sont tous
invariablement pairs.
Il n’y a bien que 4 nombres parfaits inférieurs à 10000 : 6, 28, 496 et 8128. La Proposition
IX.36 des Éléments d’Euclide affirme que tous les nombres de la forme 2k−1 (2k −1) pour
k ∈ N sont parfaits si 2k − 1 est premier : sauriez-vous le démontrer ? Le problème de
la réciproque (tous les nombres parfaits sont-ils de cette forme ?) a été posé par Thabit
ibn Qurra au ixe siècle, Ibn al-Haytham vers l’an 1000, puis par Descartes en 1638 dans
une lettre à Mersenne, puis par Franz van Schooten en 1658 dans une lettre à Fermat.
Ce n’est qu’en 1732 qu’Euler montre qu’il n’y a pas d’autre nombre parfait pair. On
ignore toujours s’il y en a une infinité, et s’il existe des nombres parfaits impairs : aucun
n’a été trouvé jusqu’à 10300 , mais qui sait ? De même, on ignore toujours s’il existe des
nombres quasi-parfaits. Le plus petit nombre abondant impair est 945 mais il en existe
une infinité : tout multiple strict d’un nombre parfait ou abondant est abondant.
Deux nombres n et m tels que s(n) = m et s(m) = n sont dits amicaux ou amiables.
Les nombres amicaux sont depuis très longtemps chargés d’une forte connotation sym-
bolique. Dans la Bible, Jacob donne deux cent chèvres et vingt boucs, et autant de
brebis et de béliers à son frère aîné Ésaü (pour éviter que celui-ci le tue. . . ) ; pourquoi
220 ? On rapporte que Pythagore aurait qualifié un ami d’« un autre lui, comme le
sont 220 et 284 ». Ce couple de nombres amicaux était apparemment le seul connu des
Grecs, mais les Arabes en trouvèrent bien d’autres. Thabit ibn Qurra (826-901) ouvrit
la première voie systématique, en démontrant le résultat suivant.
Soit n un entier supérieur à 1, et soient a = 3(2n ) − 1, b = 3(2n−1 ) − 1 et c =
9(2 2n−1
) − 1. Si a, b et c sont premiers, alors 2n (ab) et 2n (c) sont amicaux.
Al-Farisi (1260-1320) découvrit le couple (17 296 , 18 416), Muhammad Baqir Yazdi
le couple (9 363 584 , 9 437 056). Comme souvent, ces résultats furent ignorés puis re-
découverts par les Européens, et c’est ainsi que le couple d’Al Farisi porte le nom de
Fermat, celui de Yazdi le nom de Descartes, les nombres de la forme 2n − 1 sont les
nombres de Mersenne. Les nombres de la forme 3(2n )−1 ont tout de même été nommés
« nombres de Thebit », en l’honneur de Thabit ibn Qurra.
3.6 Le Théorème des Restes Chinois

On trouve des traces de ce résultat, que nous vous avons proposé en exercice, dans les
travaux mathématiques d’à peu près tous les pays, du Sunzi suanji (« Classique de calcul
de Sunzi »), au Liber Abaci de Fibonacci, en passant par Āryabhata et Brāhmagupta
en Inde, ainsi que par les mathématiciens arabes Ibn Tahir et al-Haytham ; mais cu-
rieusement, il n’est pas énoncé par les grecs. Au travers de ses multiples généralisations,
le théorème des restes chinois est à la base de nombreux algorithmes de calcul arith-
métique et symbolique, ainsi que de méthodes de cryptographie.
49
Le Sunzi suanji n’a pas pu être daté précisément : probablement entre le iiie et le
vie siècle. Voici le problème 26, chapitre 3 1 .
Soit des objets dont on ignore le nombre. En les comptant 3 par 3 il en
reste 2 ; en les comptant 5 par 5, il en reste 3 et en les comptant 7 par 7, il
en reste 2. Combien y a-t-il d’objets ?
Réponse : 23.
Règle : « En comptant par 3, il en reste 2 » : poser 140 ; « En comptant par
5, il en reste 3 » : poser 63 ; « En comptant par 7, il en reste 2 » : poser 30.
Faire la somme de ces 3 nombres, obtenir 233. Soustraire 210 de ce total,
d’où la réponse.
En général : pour chaque unité restante d’un décompte par 3, poser 70 ;
pour chaque unité restante d’un décompte par 5, poser 21 ; pour chaque
unité restante d’un décompte par 7, poser 15. Si la somme ainsi obtenue
vaut 106 ou plus, ôter 105 pour trouver la réponse.
Si vous avez bien compris le théorème, vous ne devriez pas avoir de peine à retrouver les
nombres que Sunzi recommande de « poser », et à reconnaître le produit 3×5×7 = 105.
Tant que vous y serez, renseignez le cuisinier sur son bateau de pirates :
Dix-sept pirates s’emparent d’un lot de pièces d’or toutes identiques. Leur
loi exige un partage à égalité : chacun doit recevoir le même nombre de
pièces d’or et, s’il en reste, elles sont attribuées au cuisinier de bord. Dans
le cas présent, la part du cuisinier serait de trois pièces, mais les pirates se
querellent et six d’entre eux sont tués, ce qui porte la part du cuisinier à
quatre pièces. Au cours d’une terrible tempête, le bateau fait naufrage et ne
survivent que six pirates et le cuisinier. Par bonheur, le butin est sauvé. La
part du cuisinier est maintenant de cinq pièces. Que peut espérer gagner le
cuisinier lorsqu’il décide d’empoisonner le reste de l’équipage, sachant que
c’est la plus petite des solutions possibles ?
3.7 Le Théorème de Ibn al-Haytham

Selon son histoire, rapportée par Roshdi Rashed 2 , il devrait s’appeler Théorème
d’Al-Haytham-Leibniz-Wilson-Waring-Lagrange-Euler-Gauss ; mais c’est sous le nom
de Théorème de Wilson qu’il est connu dans la littérature, et que nous vous l’avons
proposé en exercice.
Théorème 8. Si n est un nombre premier, alors (n − 1)! est congru à −1 modulo n.
Cette condition nécessaire est aussi suffisante, puisque si n n’est pas premier, (n−1)!
est divisible par tous les facteurs premiers de n, et est donc congru à 0 modulo n.
1. J.C. Martzloff : Histoire des Mathématiques Chinoises, Masson, Paris 1987
2. R. Rashed : Ibn al-Haytham et le Théorème de Wilson, Archive for History of Exact Sciences,
22(4) p.305–321 (1980)
50
Le théorème apparaît dans un livre en latin de « Meditationes Algebraicae » publié

en 1770 par E. Waring. Celui-ci attribue le résultat à un de ses élèves, John Wilson,
qu’il qualifie de « vir clarissimus, rerumque mathematicorum peritissimus ». Pourtant,
ni Wilson ni Waring ne savaient en donner de démonstration ; selon Waring : « demons-
trationes vero hujusmodi propositionum eo magis difficiles erunt ». En fait, le résultat
avait déjà été énoncé, et peut-être démontré, par Leibniz au siècle précédent. Lagrange
en 1771, Euler, puis Gauss en publieront différentes démonstrations. Mais bien avant,
autour de l’an mil, le mathématicien Ibn al-Haytham (965-1040) avait déjà publié un
court « Opuscule » dans lequel il énonçait le résultat, et où il apparaît clairement qu’il
en possédait la justification, probablement basée sur une forme de l’identité de Bézout.
Malheureusement, beaucoup de ses écrits n’ayant pas été retrouvés, ses connaissances
exactes n’ont pas pu être reconstituées.
L’Opuscule d’al-Haytham commence par l’énoncé du problème suivant.
Trouver un nombre tel que si on le divise par deux il en reste un ; si on le
divise par trois, il en reste un ; si on le divise par quatre il en reste un ; si
on le divise par cinq il en reste un ; si on le divise par six il en reste un ; si
on le divise par sept il n’en reste rien ;
Al-Haytham donne deux méthodes. La première, qu’il qualifie de « canonique » consiste
à exhiber le nombre 6! + 1 = 721, qui répond à la question. La seconde permet de
trouver toutes les solutions du problème, qui en a une infinité. On pourrait penser
qu’al-Haytham n’a résolu qu’un problème particulier, une devinette arithmétique en
quelque sorte. Mais voici comment il poursuit son exposé, après la description des deux
méthodes dans le cas particulier n = 7.
Ceci étant posé, nous disons que cette propriété est nécessaire pour tout
nombre premier, c’est-à-dire que pour tout nombre premier – qui est un
nombre qui n’est multiple que de l’unité –, si on multiplie les nombres qui le
précèdent les uns par les autres selon la manière que nous avons introduite,
et si on ajoute un au produit, alors si on divise la somme par chacun des
nombres qui précèdent le nombre premier, il en reste un, et si on la divise
par le nombre premier, il n’en reste rien.
Le cas particulier n = 7 n’est qu’un artifice pédagogique. Al-Haytham a bien conscience
que son exposé est tout à fait général, et parfaitement clair. Beaucoup plus clair
d’ailleurs que ceux de certains de ses successeurs qui reprendront le même problème à
partir de ses écrits.
Laissons la conclusion à al-Haytham, qui ne semble pas juger que son résultat mérite
une aussi longue postérité.
Ce que nous venons de mentionner englobe les réponses à tous les problèmes
de ce genre, et que Dieu nous assiste. La réponse au problème numérique
est achevée. Louange à Dieu Seigneur du Monde ; Béni soit Son Prophète
Mohammed, l’Élu, et tous les siens.
51
3.8 Diophante et Hypathie, tous deux d’Alexandrie

Immédiatement après les Éléments d’Euclide, peu de livres ont eu autant d’influence
sur l’histoire des mathématiques que les Arithmétiques de Diophante. Pourtant, prati-
quement rien n’est connu de façon certaine sur son auteur, dont on pense qu’il aurait
vécu au iiie siècle ap. J.C. C’est une collection de problèmes particuliers portant tous
sur des équations polynomiales à coefficients rationnels dont on cherche des solutions
rationnelles (ces équations s’appellent depuis « équations diophantiennes »). Sur les
13 chapitres, 6 nous sont parvenus. Quatre autres ont été retrouvés au siècle dernier
en Iran dans une traduction arabe, mais il n’est pas certain qu’ils aient fait partie de
l’ouvrage original. Diophante serait mort à 84 ans, si on en croit cette épitaphe sous
forme d’équation diophantienne, parue au moins un siècle après sa mort.
Voici la tombe qui renferme les cendres de Diophante ; elle est merveilleuse
car, en utilisant un artifice arithmétique, elle apprend toute sa vie. Il resta
enfant pendant le sixième de sa vie ; après un autre douzième ses joues
se couvrirent de barbe ; après un septième, il alluma le flambeau du ma-
riage ; cinq ans après, il lui naquit un fils ; mais celui-ci, enfant malheureux,
quoique passionnément aimé, mourut arrivé à peine à la moitié de l’âge
atteint par son père. Diophante vécut encore quatre ans, adoucissant sa
douleur par des recherches sur la science des nombres.
Avant l’imprimerie, les livres devaient être copiés à la main. Mais cela n’effrayait
pas les savants : il est difficile d’imaginer l’ampleur qu’a pu prendre dans l’antiquité la
célèbre bibliothèque d’Alexandrie. Ou plutôt les bibiothèques successives puisqu’elle fut
plusieurs fois détruite, dont la première fois par César (accidentellement prétendit-il).
On raconte que chaque navire qui accostait à Alexandrie devait confier immédiatement
tout écrit qui se trouvait à son bord à la bibliothèque où il était copié puis restitué à
son propriétaire avant le départ du navire. À Alexandrie, les rouleaux de papyrus se
comptaient par centaines de milliers. Autour de la bibliothèque s’était créé ce que nous
appellerions maintenant un centre de recherche et d’enseignement, bref une université,
qui attirait les savants de tout le monde ancien ; de sorte qu’il est impossible de savoir
si Diophante « d’Alexandrie » en était vraiment originaire.
Il était d’usage que certaines copies soient des « commentaires » dont l’auteur
ajoutait au texte initial ses propres solutions aux problèmes posés, voire insérait des
problèmes de son cru. Parmi ces commentateurs figure un certain Théon (toujours
d’Alexandrie), professeur de mathématiques et d’astronomie, qui décida vers 350 d’édu-
quer sa fille Hypathie de façon plutôt originale pour l’époque : il lui apprit à penser !
Cela fit d’elle une professeure reconnue de mathématiques et de philosophie et une
femme très écoutée et admirée ; mais aussi considérée par certains comme dangereuse :
elle mourut assassinée en 415. Sa mort en « martyre de la libre-pensée » a été telle-
ment instrumentalisée par les idéologies successives, qu’il est impossible de savoir ce qui
s’est réellement passé. Aucun écrit d’elle ne nous est parvenu, mais il est possible que
l’Arithmétique de Diophante telle qu’elle a été traduite plus tard par les Arabes puis
52
encore plus tard les Européens, ait été en fait un de ses « commentaires ». Finalement
la seule chose certaine à propos d’Hypathie est qu’elle est la première femme a avoir
laissé un nom dans l’histoire des mathématiques.
L’édition europénne la plus célèbre de l’Arithmétique de Diophante est une traduc-
tion latine datée de 1621, due à Gaspard Bachet de Méziriac, natif de Bourg-en-Bresse.
À part cette traduction, Bachet de Méziriac est aussi connu pour un ouvrage intitulé
« Problèmes plaisans et délectables qui se font par les nombres », et pour être le premier
découvreur (européen) de l’identité de Bézout. Pourquoi cette édition de 1621 est-elle
si célèbre ? Parce que Pierre de Fermat en possédait une copie, dont il griffonnait les
marges de ses réflexions. Le livre fut plus tard réédité par son fils Samuel en incluant
les remarques du père, dont celle-ci :
Cubum autem in duos cubos, aut quadratoquadratum in duos quadrato-
quadratos et generaliter nullam in infinitum ultra quadratum potestatem in
duos eius-dem nominis fas est dividere cuius rei demontrationem mirabilem
sane detexi. Hanc marginis exiguitas non caperet.
Mmh . . . « aucune puissance jusqu’à l’infini ». . . « j’en ai découvert une démonstration
merveilleuse ». . . « Cette marge est trop étroite pour la contenir ». . . hein ? Voici ce
qu’en pensait Legendre en 1825.
Les dernières paroles de cette note autorisent à croire que la démonstration
dont parle Fermat, n’aurait occupé qu’un petit nombre de pages, s’il les
avait eues à sa disposition. Cette démonstration était donc beaucoup plus
simple que celle dont nous nous servons dans cet écrit pour prouver seule-
ment que la solution, s’il y en avait une dans quelque cas, ne pourrait être
donnée que par des nombres d’une grandeur prodigieuse. Mais ne poussons
pas trop loin des observations qui nous induiraient à penser que Fermat a
pu se méprendre sur l’exactitude ou la généralité de sa solution.
La « merveilleuse démonstration » de Fermat est un élément tellement central de l’his-
toire des mathématiques des trois derniers siècles qu’elle mérite bien qu’on lui consacre
quelques sections, non ?
3.9 Le Dernier Théorème de Fermat

Les triplets Pythagoriciens sont les triplets d’entiers positifs (x, y, z) vérifiant x2 +
y 2 = z 2 . Observons que si (x, y, z) répond à la question, alors il en est de même de
(kx, ky, kz) et (ky, kx, kz), pour tout entier k. On peut donc se ramener à l’étude des
triplets avec x < y et tels que (x, y, z) n’aient pas de diviseur commun. Le triplet
pythagoricien le plus simple est (3, 4, 5), mais bien d’autres exemples sont connus de-
puis l’antiquité. Certains pensent que la tablette d’argile dite Plimpton 322, gravée en
caractères cunéiformes vers 1800 av. J.C. doit être interprétée comme une liste de tri-
plets pythagoriciens. Ce qui est avéré en tout cas, c’est l’utilisation par les architectes
depuis l’Égypte ancienne, de la corde à treize nœuds, qui délimite 12 intervalles égaux,
53
et permet de tracer toutes sortes de figures géométriques dont un triangle rectangle

de côtés 3, 4 et 5 intervalles. Vers 800 av. J.C., le mathématicien indien Baudhayana
connaissait (3, 4, 5), (5, 12, 13), (8, 15, 17), (7, 24, 25) et (12, 35, 37). Pythagore (569–
475 av. J.C.) est bien le premier à avoir donné une formule permettant d’en produire
à volonté. D’autres formules furent données par Platon (428–347 av. J.C.), puis par
Euclide (325–265 av. J.C.). Voici ces formules (en langage actuel).
– Pythagore : ∀n ∈ N , (2n+1 , 2n2 +2n , 2n2 +2n+1) est un triplet pythagoricien,
– Platon : ∀n ∈ N , (2n , n2 − 1 , n2 + 1) est un triplet pythagoricien,
– Euclide : ∀a > b ∈ N , (2ab , a2 − b2 , a2 + b2 ) est un triplet pythagoricien.
Euclide démontre que sa formule permet en fait de les obtenir tous. Peut-être s’était-il
posé la même question pour la puissance 3 : existe-t-il des triplets d’entiers (x, y, z) tels
que x3 + y 3 = z 3 ? On n’en a pas de trace, pas plus que chez Diophante. Par contre les
mathématiciens arabes, grands exégètes des grecs, y avaient répondu par la négative
dès le xe siècle, mais sans apporter de démonstration convaincante. Voici ce qu’écrit
al-Khasin, dans son « Épître à al-Hasib ». 3
J’ai déjà démontré que ce qu’avance Abu Mohammed al-Khujandi – que
Dieu soit miséricordieux avec lui – dans sa démonstration que la somme de
deux nombres cubiques n’est pas un cube, est défectueux et incorrect.
Pourquoi al-Khazin donne-t-il lui aussi une démonstration incomplète ? Cela reste un
mystère. Un peu plus tard ibn Sina (plus connu comme médecin que comme mathé-
maticien, sous le nom d’Avicenne) affirme lui aussi le résultat et précise qu’il n’a pas
été démontré, puis ibn al-Khawam au xie siècle affirme sans non plus la démontrer
l’impossibilité du cas n = 4.
Quelques siècles passent avant Pierre de Fermat (1601–1665). Il est né à Beaumont
de Lomagne d’un père négociant en cuir, assez riche pour que Pierre fasse des études
de droit à l’Université, puis achète une charge de conseiller au parlement de Toulouse.
Amateur de sciences et de mathématiques en particulier, il entretient une relation épis-
tolaire suivie avec les plus grands savants de son temps : Descartes, Pascal, Mersenne,
Roberval, Toricelli. . . L’image qu’il a laissé est celle d’un amateur génial, avec des in-
tuitions certes fulgurantes, mais très peu de faits établis 4 . Voici un extrait de sa lettre
d’août 1640 à Frénicle :
n
Je suis quasi-persuadé que 22 + 1 est premier quel que soit n. Je n’en ai
pas la démonstration exacte, mais j’ai exclu si grande quantité de diviseurs
par démonstrations infaillibles, et j’ai de si grandes lumières qui éclairent
ma pensée, que j’aurais peine à me dédire.
3. R. Rashed : l’analyse diophantienne au Xe siècle : l’exemple d’al-Khasin, Revue d’Histoire des
Sciences, 32(3) pp. 193-222 (1979).
4. C. Goldstein : l’arithmétique de Pierre de Fermat dans le contexte de la correspondance de
Mersenne : une approche microsociale. Annales de la Faculté des Sciences de Toulouse XVIII, pp.
25–57 (2009)
54
Il l’avait sans doute vérifié jusqu’à n = 4. C’est malheureusement faux dès n = 5 et au

moins jusqu’à n = 32. Sa soi-disant « merveilleuse démonstration » de l’impossibilité
de trouver trois entiers strictement positifs tels que xn + y n = z n pour n > 2 a fait
beaucoup pour sa réputation. Il avait tout de même résolu le cas n = 4 et nous allons
voir comment.
Fermat commence par affirmer qu’il n’existe pas de triangle rectangle à côtés entiers
dont l’aire soit un carré d’entier. Voici ce que qu’il écrit ensuite dans la marge des
Arithmétiques de Diophante. La traduction du latin est due à C. Henri et P. Tannery ;
nous avons ajouté la numérotation.
1. Si l’aire d’un triangle était un carré, il y aurait deux bicarrés dont la
différence serait un carré ;
2. il s’ensuit qu’on aurait également deux carrés dont la somme et la
différence seraient des carrés.
3. Par conséquent, on aurait un nombre carré, somme d’un carré et du
double d’un carré, avec la condition que la somme des deux carrés qui
servent à le composer soit également un carré.
4. Mais si un nombre carré est somme d’un carré et du double d’un carré,
sa racine est également somme d’un carré et du double d’un carré, ce
que je puis prouver sans difficulté. On conclura de là que cette racine
est la somme des deux côtés de l’angle droit d’un triangle rectangle
dont l’un des carrés composant formera la base et le double de l’autre
carré la hauteur.
5. Ce triangle rectangle sera donc formé par deux nombres carrés dont
la somme et la différence seront des carrés.
6. Mais on prouvera que la somme de ces deux carrés est plus petite que
celle des deux carrés, dont on a également supposé que la somme et
la différence soient des carrés. Donc, si on donne deux carrés dont la
somme et la différence soient deux carrés, on donne par là-même en
nombres entiers, deux carrés jouissant de la même propriété et dont la
somme est inférieure.
7. Par le même raisonnement, on aura ensuite une somme plus petite que
celle déduite de la première et en continuant indéfiniment on trouvera
toujours des nombres entiers de plus en plus petits satisfaisant aux
mêmes conditions. Mais cela est impossible, puisque, un nombre entier
étant donné, il ne peut y avoir une infinité de nombres entiers qui soient
plus petits.
8. La marge est trop étroite pour recevoir la démonstration complète avec
tous ses développements.
Re-voilà le gag de la marge trop étroite, mais cette fois-ci tout est juste. Par contre,
il faut quand même travailler beaucoup pour arriver à la « démonstration complète ».
55
Pour commencer, les différentes affirmations méritent une traduction mathématique.

Les problèmes successifs évoqués par Fermat sont les suivants.
(
∗ a2 + b 2 = c 2
∃(a, b, c, d) ∈ N , (P1)
ab/2 = d2
∃(a, b, c) ∈ N∗ , a4 − b4 = c2 (P2)
(
∗ a2 + b 2 = c 2
∃(a, b, c, d) ∈ N , (P3)
a2 − b2 = d2
(
∗ a2 + 2b2 = c2
∃(a, b, c, d) ∈ N , (P4)
a2 + b 2 = d 2
(
∗ a2 + 2b2 = c2
∃(a, b, c, d) ∈ N , (P5)
(a2 )2 + (2b2 )2 = d2
Observez que si a4 − b4 = c2 n’a pas de solution (problème (P2)), alors x4 + y 4 = z 4
n’en a pas non plus. Les cinq premières affirmations disent respectivement :
1. (P1) =⇒ (P2)
2. (P2) =⇒ (P3)
3. (P3) =⇒ (P4)
4. (P4) =⇒ (P5)
5. (P5) =⇒ (P3)
Vous pouvez chercher vous-mêmes les démonstrations de ces implications, qui ne sont
pas immédiates. Les deux principaux ingrédients sont :
1. la caractérisation d’Euclide des triplets pythagoriciens,
2. le fait que si le produit de deux nombres premiers entre eux est un carré, chacun
des deux nombres est lui-même un carré (commencez par le démontrer).
Au fil des arguments revenant de (P3) à (P3) en passant par (P4) et (P5), les sommes
d’entiers concernés diminuent strictement (affirmation 6). Arrive alors l’argument mas-
sue de la « descente infinie » (affirmation 7) : si partant de 4 entiers a, b, c, d solution
d’un problème donné, on construit 4 autres entiers (a0 , b0 , c0 , d0 ) solution du même pro-
blème et vérifiant a0 + b0 + c0 + d0 < a + b + c + d, alors le problème n’a pas de solution.
Pas convaincu ? Démontrez rigoureusement par récurrence sur n qu’il n’existe pas de
solution vérifiant a + b + c + d 6 n, pour tout n. Fermat n’a pas inventé cet argument
que l’on trouve déjà chez Euclide. Mais il en a fait un usage tellement intensif et astu-
cieux qu’on l’a baptisé depuis « descente infinie de Fermat ». En 1654 il avait promis à
Pascal un traité rassemblant tous ses résultats basés sur la descente infinie ; il n’écrira
finalement cette compilation qu’en 1659. Rappelons que Pascal est le premier à avoir
formalisé le raisonnement par récurrence. . . en 1654.
56
Les affirmations péremptoires de Fermat ont occupé beaucoup de mathématiciens

après lui. Mais à la mort d’Euler en 1783 tous les énoncés de Fermat avaient été soit
démontrés soit infirmés. Tous sauf un : le Dernier Théorème de Fermat.
3.10 Quatre siècles avant Fermat

Le livre le plus profond et le plus abouti de Fibonacci, le Liber Quadratorum 5 , ou
« Livre des carrés », écrit en 1225, n’a été retrouvé et traduit qu’en 1851. Sur différents
problèmes arithmétiques, Fibonacci y élabore des solutions astucieuses, et son approche
est du même niveau que les recherches mathématiques arabes de l’époque, sans qu’il
soit possible de démontrer qu’il en ait eu connaissance : certes, il s’était fait l’ardent
propagandiste de la numération de position qu’il avait apprise dans sa jeunesse auprès
des commerçants de Béjaïa, mais rien n’indique qu’il ait étudié des travaux plus avancés.
Dans la dédicace, Fibonacci raconte qu’il a été présenté à la cour de l’Empereur à Pise,
et que Magister Johannes de Palermo lui avait proposé un problème pour tester ses
capacités. Il s’agissait de trouver un nombre carré, qui augmenté ou diminué de 5
donnerait encore des nombres carrés. Plus généralement, Fibonacci cherche à trouver
trois carrés x2 < y 2 < z 2 en progression arithmétique, c’est-à-dire tels que x2 +z 2 = 2y 2 .
Voici en gros son raisonnement. Si x2 + z 2 est pair, alors x et z ont la même parité,
donc x + z = 2p et z − x = 2q sont pairs. Écrivons x = p − q, z = p + q. On arrive ainsi
à x2 + z 2 = 2p2 + 2q 2 = 2y 2 . Donc (p, q, y) est un triplet pythagoricien. En utilisant la
caractérisation d’Euclide, on peut se ramener au cas où il existe deux entiers m et m
tels que :
p = m2 − n2 , q = 2mn , y = m2 + n2 .
On obtient alors :
y 2 − x2 = z 2 − y 2 = 4mn(m + n)(m − n) .
Vérifiez le calcul et ayez une pensée admirative pour Fibonacci qui ne raisonnait que
sur des rapports de surfaces et de longueurs, sans utiliser notre notation littérale.
Fibonacci appelle congruum les nombres de la forme 4mn(m + n)(m − n), et étudie
leurs propriétés. Il démontre en particulier qu’ils sont forcément divisibles par 24. Plus
loin dans le même ouvrage, il démontre que si x > y, le rapport (x + y)/(x − y) n’est
jamais égal au rapport x/y (vérifiez-le vous-mêmes). De là, dit Fibonacci, on peut
démontrer qu’aucun nombre carré ne peut être un congruum. Dommage qu’il n’ait pas
dit pourquoi ! Car si un congruum n’est jamais un carré, alors avoir à la fois y 2 −c2 = x2
et y 2 + c2 = z 2 est impossible : la somme et la différence de deux carrés ne peuvent
pas être toutes deux des carrés. C’est le problème (P3) de la section précédente, dont
nous avons vu qu’il menait au cas n = 4 du Dernier Théorème de Fermat. Fibonacci
n’en était pas loin. . . plus de quatre siècles avant Fermat.
5. R. B. McClenon : Leonardo of Pisa and his Liber Quadratorum, Amer. Math. Monthly, 26(1)
(1919)
57
3.11 Le grand plan de Sophie Germain

Après la démonstration du cas n = 4 par Fermat lui-même, il n’y eut pas beaucoup
de progrès jusqu’à Euler, qui annonce avoir démontré le cas n = 3 dans une lettre à
Goldbach de 1753. Sa démonstration contenait une erreur, laquelle pouvait être corrigée
par d’autres méthodes également dues à Euler ; de sorte que l’on s’accorde à lui en faire
crédit : après tout, c’était le mathématicien le plus prolifique de tous les temps.
Vient ensuite Sophie Germain. En 1789 elle a 13 ans, elle vit à Paris, et deux
événements ont pu l’impressionner durablement cette année-là. La Révolution Française
est l’un d’entre eux : son père, d’une famille bourgeoise de commerçants était député
du tiers-état. L’autre événement est sa lecture dans une histoire des mathématiques de
la mort tragique d’Archimède. Elle se met à étudier les mathématiques avec passion,
au point que ses parents lui confisquent bougies et couvertures pour qu’elle ne passe
plus ses nuits à travailler. Devant la détermination de la jeune fille, ils finissent par
lui laisser le champ libre : elle continue son apprentissage, mais sans jamais suivre le
moindre cours. En 1794, l’École Polytechnique nouvellement créée compte parmi ses
professeurs un des plus grands mathématiciens du moment, Joseph-Louis Lagrange.
Sans que l’on sache comment, Sophie Germain réussit à se procurer les notes de cours
de Lagrange et les étudie à fond. Elle a alors l’idée d’écrire à l’auteur sous le nom
emprunté d’un élève de l’école. Lagrange, intrigué par la justesse et la profondeur des
remarques qu’il reçoit, demande à rencontrer ce « Monsieur Le Blanc » qui a si bien
compris ses cours. Face à la jeune fille de 19 ans, il est impressionné : il devient son ami
et son mentor en sciences. Quatre ans plus tard, Adrien-Marie Legendre (1752–1833)
publie une synthèse de nombreux résultats nouveaux d’arithmétique obtenus par Euler,
Lagrange et lui-même. Sophie Germain étudie cet « Essai sur la théorie des nombres »
avec passion, et entame une correspondance avec son auteur. Plusieurs autres éditions
complétées suivront, dont un « second supplément » en 1825, portant « sur quelques
objets d’analyse indéterminée et particulièrement sur le théorème de Fermat ». Voici
ce qu’on y lit, dans une note de bas de page.
Cette démonstration qu’on trouvera sans doute très ingénieuse, est due
à Mlle Sophie Germain, qui cultive avec succès les sciences physiques et
mathématiques, comme le prouve le prix qu’elle a remporté à l’Académie
sur les vibrations des lames élastiques. On lui doit encore la proposition de
l’art. 13 et celle qui concerne la forme particulière des diviseurs premiers
de α, donnée dans l’art. 11.
Et voilà Sophie Germain adoubée pour les siècles à venir : un théorème (d’ailleurs sou-
vent cité de façon erronée) porte désormais son nom. Elle est l’auteur, certes d’autant
plus remarquable qu’elle est une femme, d’un résultat accessoire qui a conduit à la ré-
solution de quelques cas particuliers, méritant une note de bas de page. Est-ce vraiment
tout ? Récemment, des chercheurs 6 ont pris la peine de lire les manuscrits de Sophie
6. R. Laubenbacher, D. Pengelley : « Voici ce que j’ai trouvé » Sophie Germain’s grand plan to
58
Germain qui nous sont parvenus. Il ressort de leur étude que Sophie Germain avait un
plan d’attaque sur le théorème de Fermat bien plus ambitieux que ne le laisse croire
la place marginale à laquelle elle a été reléguée. Elle comptait, en procédant par l’ab-
surde, démontrer que s’il y avait une solution, alors nécessairement les trois nombres
x, y, z vérifiant xp + y p = z p devraient être arbitrairement grands. Dans le mémoire de
Legendre on lit un plan analogue, mais avec des méthodes de démonstration complè-
tement différentes. Pourtant, autant Legendre que Sophie Germain connaissaient les
raisons pour lesquelles leurs plans ne suffiraient pas à démontrer le théorème dans toute
sa généralité. Celui de Legendre a permis de régler de nombreux cas. Qu’en aurait-il
été si tous les travaux de Sophie Germain avaient été publiés ? On ne le saura jamais,
mais certaines de ses techniques n’ont été redécouvertes qu’au siècle suivant. Voici ce
qu’elle en dit.
Je n’ai jamais pu arriver à l’infini, quoique j’aie reculé bien loin les limites
par une méthode de tâtonnement trop longue pour qu’il me soit possible
de l’exposer ici. Je n’oserais même pas affirmer qu’il n’existe pas une limite
au-delà de laquelle tous les nombres de la forme 2N p + 1 auraient deux
résidus p-ièmes placés de suite dans la série des nombres naturels. C’est le
cas qui intéresse l’équation de Fermat.
Vous concevrez aisément, Monsieur, que j’ai dû parvenir à prouver que
cette équation ne serait possible qu’en nombres dont la grandeur effraie
l’imagination. Car elle est encore assujettie à bien d’autres conditions que
je n’ai pas le temps d’énumérer à cause des détails nécessaires pour en
établir [la véracité ( ?)]. Mais tout cela n’est encore rien, car il faut l’infini
et non pas le très grand.
La lettre dont ce passage est extrait date de 1819 et est adressée à Gauss. Il avait
un an de moins qu’elle, mais était devenu célèbre très vite. En 1801 (à 24 ans) il pu-
blie « Disquisitiones Arithmeticae », un livre très moderne dans sa manière d’aborder
l’arithmétique, que Sophie Germain étudie soigneusement. Elle écrit alors à l’auteur
pour lui faire part de ses découvertes en utilisant le même stratagème qu’avec Lagrange
quelques années plus tôt. On trouve dans la correspondance de Gauss des traces de
ce « Monsieur Leblanc » de Paris qu’il tient en haute estime. Mais à l’automne 1806,
les troupes de Napoléon envahissent la Prusse où réside Gauss. Sophie Germain, se
souvenant peut-être du sort d’Archimède lors du siège de Syracuse, avertit un ami de
la famille, le général Pernety, qu’il convient de protéger à tout prix ce grand savant.
Pernety s’acquitte de sa mission, rencontre Gauss, et lui dit à qui il doit sa recomman-
dation. Sophie Germain écrit alors à Gauss sous son vrai nom et dévoile la supercherie.
Dans la réponse (en français alors qu’il n’écrivait qu’en latin ou en allemand) que Gauss
envoie en remerciement à Sophie Germain le 30 avril 1807, on sent au-delà des formules
de politesse, une réelle admiration : le grand Gauss, connu pour son exigence et son ca-
ractère difficile, est clairement impressionné. Voici le début de cette lettre (orthographe
prove Fermat’s Last Theorem, (2010)
59
de Gauss).
Votre lettre du 20 février, mais qui ne m’est parvenue que le 12 mars, a
été pour moi la source d’autant de plaisir que de surprise. Combien l’acqui-
sition d’une amitié aussi flateuse et précieuse est-elle douce à mon cœur !
L’intérêt vif, que vous avez pris à mon sort pendant cette guerre funeste,
mérite la plus sincère reconnaissance. Assurément, votre lettre au général
Pernety m’eût été fort utile, si j’avais été dans le cas d’avoir recours à une
protection spécielle de la part du gouvernement françois. Heureusement les
evenements et les suites de la guerre ne m’ont pas touché de trop près jus-
qu’ici, bien que je sois persuadé qu’elles auront une grande influence sur
le plan futur de ma vie. Mais comment vous décrire mon admiration et
mon étonnement, en voïant se metamorphoser mon correspondant estimé
M. Leblanc en cette illustre personnage, qui donne un exemple aussi brillant
de ce que j’aurois peine de croire. Le goût pour les sciences abstraites en
général et surtoût pour les mysteres des nombres est fort rare : on ne s’en
étonne pas ; les charmes enchanteurs de cette sublime science ne se decelent
dans toute leur beauté qu’à ceux qui ont le courage de l’approfondir. Mais
lorsqu’une personne de ce sexe, qui, par nos mœurs et par nos préjugés, doit
rencontrer infiniment plus d’obstacles et de difficultés, que les hommes, à
se familiariser avec ces recherches epineuses, sait neansmoins franchir ces
entraves et penétrer ce qu’elles ont de plus caché, il faut sans doute, qu’elle
ait le plus noble courage, des talens tout à fait extraordinaires, le génie su-
périeur. En effet, rien ne pourroit me prouver d’une manière plus flatteuse
et moins équivoque, que les attraits de cette science, qui ont embelli ma vie
de tant de jouissances, ne sont pas chimériques, que la predilection, dont
vous l’avez honorée.
Les notes savantes, dont toutes vos lettres sont si richement remplies, m’ont
donné mille plaisirs. Je les ai étudiées avec attention, et j’admire la facilité
avec laquelle vous avez pénétré toutes les branches de l’Arithmetique, et la
sagacité avec laquelle vous les avez su généraliser et perfectionner.
Comment les lettres et les manuscrits de Sophie Germain nous sont-ils parvenus, alors
qu’elle-même n’a jamais rien publié de ses résultats arithmétiques ? Grâce à Guillaume
Libri, qui a lui-même publié ses propres réflexions sur le théorème de Fermat, mais
qui est surtout resté dans l’histoire pour s’être constitué à force de vols dans les bi-
bliothèques publiques, une collection personnelle phénoménale. Il avait lié connaissance
avec Sophie Germain lors d’une année sabbatique passée à Paris en 1824 et se disait
son ami. La renommée mathématique de Sophie Germain était alors bien établie, et elle
siégait (comme auditrice, n’exagérons rien tout de même) à l’Académie des Sciences,
que Libri fréquentait assidument. Aujourd’hui les manuscrits de Sophie Germain sont
partagés entre la Bibliothèque Nationale à Paris et la Biblioteca Moreniana, à Florence.
60
3.12 Le Théorème de Fermat-Wiles

Il faudra encore 350 ans après l’énoncé de Fermat pour que l’on démontre vraiment
que xn + y n = z n n’a pas de solution entière pour n > 2. Courbes elliptiques, fonctions
modulaires, groupes de Galois absolus, la construction mathématique qui a abouti au
succès d’Andrew Wiles s’appuie sur des notions qui vont très au-delà des mathéma-
tiques du temps de Fermat, et qui ont pour l’essentiel été élaborées au xxe siècle. Wiles
s’est appuyé sur de nombreux travaux de ses prédécesseurs, prolongés en une construc-
tion impressionnante qu’il a bâtie secrètement pendant 7 ans, avant de l’annoncer en
juin 1993. Une « petite » erreur dans cet immense édifice lui a encore coûté un an
d’efforts avant que sa démontration soit vraiment complète. Au bilan, le théorème qui
porte désormais le nom de Fermat-Wiles n’est plus qu’un petit cas particulier de la
théorie qu’il a suscitée.
Avant Wiles, de nombreux mathématiciens ont cru de bonne foi avoir réussi, avant
que l’on ne découvre une faille dans leur démonstration : parmi les plus célèbres, Lamé,
Cauchy, Lindemann, Kummer. . . Il est impossible de citer tous les mathématiciens qui
ont apporté leur contribution avant Wiles, et encore moins tous ceux qui ont tenté de le
faire. Il faut dire que ce résultat était devenu plus que toute autre conjecture, le Saint-
Graal des mathématiques. C’est en partie dû au fait que son énoncé soit si simple ;
Wiles lui-même raconte que vers l’âge de 10 ans il avait été frappé par le fait qu’il soit
capable de le comprendre bien que personne ne l’aie encore démontré.
C’est aussi dû aux nombreux prix dont le résultat a fait l’objet. Un des plus célèbres
est le prix Wolfskhel 7 . Héritier d’une famille de banquiers, Paul Wolfskhel avait une
formation de médecin mais, atteint de sclérose, il avait compris très vite qu’il ne pourrait
pas exercer. Il s’était alors tourné vers les mathématiques, et avait étudié auprès de
Kummer, grand spécialiste du Théorème de Fermat. À son décès en 1906, il laissait
par testament un prix de 100 000 Deutsche Marks (de l’ordre d’un million et demi
d’euros d’aujourd’hui). Du fait des dévaluations successives, ce ne sont que 75 000
DM (environ 38 000 euros) que Wiles a reçu en 1997. Ne croyez pas les histoires qui
circulent sur le fait que Wolfskhel aurait été sauvé par l’arithmétique d’une tentative
de suicide suite à un chagrin d’amour, ni qu’il aurait voulu écarter de sa succession
une épouse acariâtre et avide ; rien n’est avéré, à part le fait que les mathématiques
ont adouci une vie par ailleurs bien difficile. Ce qui est certain en revanche, c’est qu’à
compter de 1908, l’Institut de Mathématiques de Göttingen a eu la charge d’examiner
chacun des manuscrits sur le Théorème de Fermat qui lui parvenaient, de détecter
l’erreur, d’écrire à l’auteur pour la lui signaler, de recevoir ses protestations parfois
véhémentes etc. L’année suivant l’annonce du prix, 621 manuscrits sont parvenus à
Göttingen. En tout des milliers de textes, provenant de tous les pays, auront été écrits
sur le Théorème de Fermat ; et ce n’est sans doute pas fini : certains sont toujours
en quête de la fameuse « démonstration merveilleuse ». Au vu de l’énorme édifice que
7. K. Barner : Paul Wolfskhel and the Wolfskhel prize, Notices of the A.M.S. 44(10) p. 1294–1303
(1997)
61
représente la démonstration de Wiles, et n’en déplaise à Boris Vian, il est difficile de

croire qu’un bricoleur puisse faire en amateur des bombes atomiques.
Mais que cela ne vous empêche pas de réfléchir : il reste de nombreuses conjectures
non démontrées en arithmétique. La plus ancienne et l’une des plus simples est la
conjecture de Goldbach (1742) : tout entier pair strictement supérieur à 2 est somme
de deux nombres premiers. Cela a été vérifié par ordinateur jusqu’au-delà de 1018 , mais
pas encore démontré. À moins qu’au fin fond de l’Amazonie, un perroquet bavard. . . 8
3.13 Le code RSA

Le plus célèbre des codes à clé publique est dû à Ron Rivest, Adi Shamir et Leonard
Adleman du MIT. La clé publique est connue de tous et est utilisée pour coder les
messages. Par contre un message codé par la clé publique ne peut être décodé que par
quelqu’un qui connaît la clé privée. Les clés sont constituées de la façon suivante.
1. Choisir deux (grands) nombres premiers p et q.
2. Calculer n = pq : les opérations s’effectueront modulo n.
3. Calculer ϕ(n) = (p−1)(q−1).
4. Choisir un entier e inférieur à ϕ(n) et premier avec ϕ(n) : c’est l’exposant de la
clé publique.
5. Calculer l’inverse d de e pour la multiplication modulo ϕ(n) (il existe et est unique
puisque e et φ(n) sont premiers entre eux : calcul par l’algorithme d’Euclide).
L’entier d est l’exposant de la clé privée.
La clé publique se compose de l’entier n et de l’exposant e, connus de tous. La clé
privée est l’exposant d qui doit être tenu secret. Évidemment, quelqu’un qui connaît n
peut théoriquement retrouver ses deux facteurs premiers p et q et donc calculer ϕ(n)
puis d connaissant e. La sécurité du système repose sur le fait que la décomposition
d’un nombre en produit de facteurs premiers est très coûteuse en temps de calcul :
il est virtuellement impossible de décomposer un nombre produit de deux très grands
facteurs premiers. Cela n’empêche pas les utilisateurs de changer assez souvent de clé
par mesure de sécurité.
Voici comment fonctionnent le codage et le décodage. Le message à transmettre est
d’abord transformé en un entier (par exemple par concaténation des codes ascii des
caractères qui le composent). Notons m cet entier qui est censé être inférieur à n. Le
codage le transforme en c = me modulo n. Pour décoder, il faut connaître d et calculer
cd modulo n. Miracle, on retrouve m. Vous pouvez nous croire sur parole, mais ce serait
dommage, car la démonstration est parfaitement à votre portée.
Définition 9. On appelle caractéristique d’Euler la fonction qui à un entier n fait
correspondre le nombre d’entiers premiers avec n, compris entre 1 et n. On note cette
fonction ϕ.
8. D. Guedj : Le théorème du perroquet, Éditions du Seuil, Paris (1998)
62
Si p est premier, alors ϕ(p) = p − 1, puisque tout entier strictement inférieur à

p est premier avec p. Si n = pq est le produit des 2 nombres premiers p et q, alors
ϕ(n) = (p−1)(q−1). Pourquoi ? Vous pouvez trouver tout seul : comptez les multiples
de p puis les multiples de q, entre 1 et pq (ne comptez pas pq deux fois). Voici maintenant
la généralisation du petit théorème de Fermat, que nous vous avons posé en exercice.
Théorème 9. Soit n un entier et a un entier premier avec n. Alors aϕ(n) ≡ 1 [n].
Cela aussi, vous pouvez le démontrer vous-mêmes : considérez le sous-ensemble
de Z/nZ, noté P , constitué des ϕ(n) entiers premiers avec n compris entre 1 et n.
Montrez ensuite que l’application qui à r ∈ P associe ar modulo n est une bijection de
P sur lui-même (raisonnez par l’absurde et utilisez le lemme de Gauss). Cela signifie
que {ar [n] , r ∈ P } est égal à P . Maintenant faites le produit modulo n de tous les
éléments de chacun des deux ensembles :
ar = aϕ(n)
Y Y Y
r≡ r [n] .
r∈P r∈P r∈P
Allez, vous y êtes presque : un dernier coup de lemme de Gauss peut-être ?

Après un tel effort, vérifier que le codage RSA fonctionne, c’est presque du repos :
Puisque ed ≡ 1 [ϕ(n)], il existe un entier k tel que ed = k(p − 1)(q − 1) + 1. Alors :
(me )d = med = m (mk )ϕ(n) ≡ m [n].
Euh. . . à condition que m soit premier avec n, pour pouvoir appliquer le théorème
ci-dessus à mk . Si m n’est pas premier avec n, il est divisible par p ou par q, mais pas
les deux (car il est inférieur à pq). Supposons qu’il soit divisible par p et écrivons :
m = pα h, où h est premier avec p et avec q. Allez, vous allez encore devoir travailler :
montrez d’abord que pαed ≡ pα [p], puis que pαed ≡ pα [q]. Maintenant, vous pouvez
en déduire que pαed ≡ pα [n]. Recollez les morceaux : med = pαed hed ≡ pα h [n]. Vous
y êtes, le message est bien décodé ! Par pure bonté d’âme, nous vous dispensons de
recommencer ce qui précède si m est multiple de q : merci qui ?
3.14 La course aux nombres premiers

Comme vous l’avez vu pour le codage RSA, la cryptographie est grande consom-
matrice de nombres premiers, les plus imposants possibles évidemment. Un moyen de
trouver de grands nombres premiers est de les chercher parmi les nombres dits « de
Mersenne », autrement dit sous la forme 2k − 1. Pourquoi ? Parce qu’il existe un test de
primalité extrêmement simple pour de tels nombres : le test de Lucas-Lehmer. Consi-
dérons la suite définie par a0 = 4 et pour k > 0, ak = a2k−1 − 2. Il se trouve que pour
k > 2, le nombre 2k − 1 est premier si et seulement si il divise ak−2 . Essayez pour les
premiers termes :
• 23 − 1 = 7 divise a1 = 14
• 24 − 1 = 15 ne divise pas a2 = 194
• 25 − 1 = 31 divise a3 = 37634
63
. . . étonnant non ? Avec un peu d’astuce, le test peut être implémenté en

O(p2 ln(p) ln(ln(p))) opérations pour un nombre de p bits, ce qui est bien plus rapide
que tous les algorithmes généraux connus. Un gigantesque effort collaboratif de calcul
distribué (Great Internet Mersenne Prime Search) vise à trouver des nombres de Mer-
senne premiers les plus grands possibles. Le plus grand connu à ce jour est 243112609 − 1
qui a plus de 12 millions de chiffres en écriture décimale. Rien de vous empêche de
participer en offrant le temps de calcul de votre ordinateur. Vous ferez progresser le
calcul distribué, mais pas la cryptographie : les nombres de Mersenne sont trop connus
pour offrir un niveau de sécurité suffisant. S’il suffisait de tester quelques nombres de
Mersenne pour décomposer une clé publique en deux facteurs premiers, le code RSA
perdrait beaucoup de son intérêt.
Gauss écrivait :
Le problème de distinguer les nombres premiers des nombres composés, et
de décomposer ces derniers en facteurs premiers est connu pour être un des
plus importants et des plus utiles en arithmétique. Il a engagé l’industrie et
la sagesse des géomètres anciens et modernes à un tel point que la dignité de
la science elle-même requiert que tous les moyens possibles soient explorés
pour la résolution d’un problème si important et si célèbre.
La véritable difficulté est de tester des nombres quelconques, et donc de disposer d’un
algorithme permettant de décider de façon certaine si un nombre est premier ou non.
Ératosthène (276–194 av. J.C.) savait déjà comment énumérer tous les nombres pre-
miers inférieurs à un nombre n donné. L’algorithme, qui porte le nom de « Crible
d’Ératosthène », est bien connu : 2 est le plus petit nombre premier. On peut élimi-
ner tous les multiples de 2. On itère ensuite en conservant le plus petit entier qui n’a
pas encore été éliminé et en éliminant tous ses multiples. Mais pour décider si n est
premier en utilisant cet algorithme, le nombre d’opérations est gigantesque, beaucoup
trop grand pour la pratique. Une autre manière de tester la primalité est d’utiliser le
théorème de Wilson : n est premier si et seulement si (n−1)! est congru à −1 modulo
n. Cela requiert de l’ordre de n multiplications modulo n, ce qui est encore beaucoup
trop lent.
Quand en 2002 Agrawal, Kayal et Saxena ont annoncé « PRIMES is in P », la
nouvelle a fait sensation. Enfin un test de primalité, dont on peut démontrer qu’il
décide de façon certaine si n est premier, en un nombre d’opérations polynomial en
ln(n). L’article original était théorique, mais très vite des implémentations ont suivi,
avec des raffinements et des améliorations. Les algorithmes AKS sont maintenant toute
une famille et sont couramment utilisés. Deux points méritent d’être soulignés dans
cette histoire. Le premier est que l’algorithme utilise un résultat d’arithmétique vieux
de deux siècles élaboré dans la quête du Dernier Théorème de Fermat, précisément celui
qui porte le nom de Sophie Germain. L’autre est que Neeraj Kayal et Nitin Saxena, à
l’époque de leur découverte, étaient deux étudiants en Btech (équivalent d’un Master
Professionnel) d’Informatique à l’Indian Institute of Technology de Kampur, effectuant
64
leur mémoire sous la direction de Manindra Agrawal.
3.15 La répartition des nombres premiers

Il suffit d’observer un crible d’Érathostène rempli pour réaliser que les nombres
premiers sont relativement rares parmi les entiers. Vers la fin du xviiie siècle, Gauss et
Legendre avaient examiné de près la répartition expérimentale des nombres premiers
et proposé chacun une fonction pour ajuster cette répartition. Les deux avaient en
commun leur comportement asymptotique. Si π(n) désigne le nombre d’entiers premiers
inférieurs ou égaux à n, alors :
π(n)
lim =1.
n→∞ n/ ln(n)
Il faudra un siècle d’efforts après Legendre et Gauss pour démontrer ce résultat, mais
la même année 1896, deux mathématiciens y parviennent indépendamment : Charles-
Jean de la Vallée Poussin (1866–1962) et Jacques Hadamard (1865–1965). Le second est
un des plus grands mathématiciens français 9 . Élève brillant, il avait été classé premier
aux deux concours de l’École Normale Supérieure et de l’École Polytechnique, avec
une moyenne record de 18.34 au second. D’une longévité scientifique exceptionnelle, il
écrivit son dernier livre sur les équations aux dérivées partielles à plus de 90 ans. On dit
qu’il a inspiré le personnage du « Savant Cosinus » (mais on le dit aussi d’Émile Picard).
Ce qui est sûr c’est que sa distraction a plus d’une fois fait trembler ses proches. À
l’occasion de vacances dans les Alpes en 1882, il était allé au glacier des Bossons avec
sa petite sœur Germaine, alors âgée de sept ans, ramasser des plantes pour son herbier.
De retour à la maison, sa mère lui demanda ce qu’il avait fait de Germaine. Il avoua
qu’il l’avait oubliée et il courut pour la retrouver. Le début de sa carrière d’enseignant
ne fut pas particulièrement facile. En 1892, le Vice-Recteur de l’Académie de Paris en
appelle au Ministre 10 .
Le dernier rapport bimensuel de M. le Proviseur du Lycée Buffon contient
au sujet de M. Hadamard la note suivante.
« Les classes de M. Hadamard laissent de plus en plus à désirer. Aucun
souci des intérêts moraux des élèves petits et grands. Aucune autorité sur
eux. Une discipline cassante et capricieuse. Des plaintes continuelles et des
demandes de punition faciles à éviter avec un peu de fermeté et de bonté
sérieuse. Nulle préparation pratique des classes. M. Hadamard se croit dis-
pensé de tout par ses remarquables aptitudes mathématiques. Plus nous
allons, plus nous sacrifions le bien public aux convenances personnelles de
ce jeune savant ».
9. V.G. Maz’ia, T. Shaposhnikova : Jacques Hadamard, un mathématicien universel, EDP Sciences,
2005
10. Cette lettre m’a été aimablement communiquée par Claudine Schwartz, petite-nièce de Jacques
Hadamard
65
J’invite M. l’Inspecteur d’Académie Piéron à voir la classe de M. Hadamard.

J’aurai l’honneur de vous rendre compte.
Je suis avec respect, M. le Ministre, votre très humble et très obéissant
serviteur.
Comme le dit Paul Montel,
Heureusement, une admirable compagne veillait sur lui. Madame Hadamard
avait tout de suite compris le rôle qu’elle pouvait jouer auprès d’un homme
de génie. Avec une générosité constante, elle a su protéger son travail. D’une
grande intelligence, la Mathématique agissait sur elle comme par induction.
Qualifiée par Mittag-Leffler de « secrétaire admirable et infatigable », elle débarrassa
son mari de toute contingence matérielle, et se chargea de sa correspondance et de ses
écrits. Hadamard lui dictait en sténo ses lettres et ses articles, lui indiquant simplement
les espaces qu’elle devait laisser pour les formules mathématiques. La vie n’a pourtant
pas épargné le couple. Leurs deux fils aînés étaient morts à quelques semaines d’in-
tervalle à Verdun en 1916. Leur troisième fils devait mourir durant la seconde guerre
mondiale. Ni la célébrité du père, ni le sacrifice des fils n’empêchèrent la famille d’être
victime des persécutions anti-juives de Vichy, et de devoir s’exiler en 1941. À son ar-
rivée aux États-Unis, Hadamard est d’abord nommé sur un poste de professeur invité
à l’Université de Columbia à New-York. Mais la guerre se prolonge et Hadamard doit
chercher un travail pour nourrir sa famille. Il a beau être célèbre, il a tout de même
77 ans et les scientifiques européens sont nombreux à chercher du travail. Son neveu
Laurent Schwartz rapporte l’anecdote suivante.
Il arriva dans une petite université et fut reçu par le directeur du dépar-
tement de mathématiques. Il expliqua qui il était et remit son Curriculum
Vitæ. Le directeur lui dit : « Nos possibilités sont limitées et je ne peux pas
vous promettre de vous prendre ».
Hadamard remarqua que parmi les portraits accrochés au mur figurait le
sien. « C’est moi » dit-il. « Bien, revenez la semaine prochaine ». Lorsqu’il
se présenta, la réponse était négative et son portrait avait été enlevé.
66
Polynômes et fractions rationnelles

Tout le monde connaît les fonctions polynomiales : ce sont simplement les fonctions
comme t 7→ 4 + 5t2 + 7t3 + t5 . Les polynômes en sont une version plus algébrique, dont
les avantages peuvent paraître assez subtils la première fois qu’on les découvre ; soyez
cependant assurés qu’ils existent, y compris si on en reste à un point de vue purement
pratique. Un bagage minimum suffit pour aborder ce chapitre : un peu d’arithmétique
des entiers et quelques notions sur les espaces vectoriels, sans même que ce soit vraiment
indispensable.
Table des matières

1 Cours 1
1.1 Anneau des polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Arithmétique des polynômes . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Racines des polynômes . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Polynômes versus fonctions polynomiales . . . . . . . . . . . . . . . . . 15
1.5 Formule de Taylor pour les polynômes . . . . . . . . . . . . . . . . . . 16
1.6 Polynômes sur C versus polynômes sur R . . . . . . . . . . . . . . . . . 18
1.7 Corps des fractions rationnelles . . . . . . . . . . . . . . . . . . . . . . 19
1.8 Décomposition en éléments simples . . . . . . . . . . . . . . . . . . . . 22
2 Entraînement 28
2.1 Vrai ou Faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3 Compléments 47
3.1 Algorithme de Horner . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Règle des signes de Descartes . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Suites de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.4 Division suivant les puissances croissantes . . . . . . . . . . . . . . . . 49
3.5 Formule de Cardan . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
8 novembre 2011
Maths en Ligne Polynômes et fractions rationnelles UJF Grenoble
1 Cours
1.1 Anneau des polynômes
L’idée de la construction sera peut-être compréhensible si on se demande comment
stocker une fonction polynomiale de R dans R dans une mémoire de machine : stocker
toutes les valeurs de la fonction étant impossible, un bon procédé pour représenter la
fonction t 7→ 4 + 5t2 + 7t3 + t5 , par exemple, sera de stocker la suite de ses coefficients ;
on entrera donc dans la machine la suite 405701, ce qui indique que le coefficient de t0
est 4, celui de t est 0, celui de t2 est 5, etc.
Ce procédé de stockage sera tout bonnement la définition même des polynômes.
Simplement, comme un polynôme peut en théorie être de degré gigantesque, bien plus
grand que les capacités de stockage de toute machine, il faudra se résigner à stocker une
infinité de coefficients, dont seuls les N premiers seront non nuls (la métaphore technolo-
gique s’écroule alors) : ainsi notre polynôme-exemple sera stocké comme 4057010000 . . .
(puis encore une infinité de 0), occupant inutilement une infinité de cases-mémoire.
Définition 1. Soit (A, +) un groupe de neutre 0. Une suite (an )n∈N d’éléments de A
est dite à support fini, ou bien nulle à partir d’un certain rang, si le nombre d’indices
n pour lesquels an 6= 0 est fini. En d’autres termes, il existe un indice N fini tel que
an 6= 0 implique n 6 N .
Définition 2. Soit (A, +, ·) un anneau commutatif. Notons provisoirement B l’en-

semble des suites d’éléments de A, à support fini. On définit sur B une addition et une
multiplication par les formules
(an )n∈N + (bn )n∈N = (an + bn )n∈N ,
et n
X
(an )n∈N · (bn )n∈N = (cn )n∈N où cn = ak bn−k .
k=0
Proposition 1. L’ensemble B muni des deux lois définies ci-dessus est un anneau
commutatif.
Démonstration : Il est facile de vérifier que (B, +) est un sous-groupe du groupe

abélien (additif) de toutes les suites d’éléments de A. En effet, le neutre de A est la
suite identiquement nulle, qui appartient à B ; la somme de deux suites à supports
finis est à support fini : si an = 0 pour tout n > N et si bn = 0 pour tout n > M ,
alors an + bn = 0 pour tout n > max{N, M } (et peut-être pour d’autres indices n
également mais ce n’est pas important) ; enfin si −a désigne l’opposé d’un élément a de
A, alors l’opposé d’un élément (an )n∈N de B est la suite (−an )n∈N , qui est effectivement
à support fini.
1
Pour ce qui concerne la deuxième loi, on doit tout d’abord vérifier que (cn )n∈N est
bien une suite de B. Avec les mêmes notations que pour l’addition, pour tout indice
n > M + N , dans le calcul de
n
X N
X n
X
cn = ak bn−k = ak bn−k + ak bn−k ,
k=0 k=0 k=N +1
tous les termes de la première somme sont nuls, car les indices utilisés sont tels que
n − k > M + N − k > M donc bn−k = 0. Tous les termes de la deuxième somme sont
nuls aussi car k > N donc ak = 0. Tous les coefficients cn pour n > M + N sont donc
nuls et (cn )n∈N est bien un élément de B.
On va ensuite vérifier que pour ces formules, B est un anneau commutatif. C’est
peu engageant et il n’y a guère d’astuces. Il faut calculer brutalement.
Commutativité
Soient (ai )i∈N et (bj )j∈N deux éléments de B ; notons (ck )k∈N le produit de (ai )i∈N
k
X k
X
par (bj )j∈N . Alors pour tout k > 0, ck = ai bk−i = ak−j bj (en posant j = k − i) ;
i=0 j=0
cette expression est bien celle qu’on trouverait en faisant le produit dans l’autre sens
(en utilisant la commutativité de A).
Associativité
Soient (an )n∈N , (bn )n∈N et (cn )n∈N trois éléments de B ; notons (dn )n∈N le produit
de (bn )n∈N par (cn )n∈N . Notons (en )n∈N le produit de (an )n∈N par (dn )n∈N . Pour n > 0,
calculons
n
X n
X n−i
X X
en = ai dn−i = ai cj bn−i−j = ai bn−i−j cj ,
i=0 i=0 j=0 (i,j)
où la dernière somme porte sur tous les couples (i, j) ∈ N2 tels que i + j 6 n.
On trouverait la même chose en calculant de la même façon le produit de (an )n∈N ·
(bn )n∈N par (cn )n∈N .
Existence d’un élément neutre
La suite (1, 0, 0, 0, . . .) est neutre pour cette multiplication.
Distributivité
Encore une vérification ennuyeuse, celle-là on va l’omettre.
On a bien vérifié que B est un anneau commutatif.
Notation 1. On note 0 la suite nulle. On appelle indéterminée l’élément
(0, 1, 0, 0, . . .)
de B dont tous les termes sont nuls sauf le terme de numéro 1 qui vaut 1. On note
souvent (mais pas toujours) X l’indéterminée.
2
Proposition 2. Pour tout élément P de B tel que P 6= 0, il existe un unique entier

d > 0 et un unique (d + 1)-uplet (ai )06i6d d’éléments de A tels que ad 6= 0 et
P = ad X d + ad−1 X d−1 + · · · + a1 X + a0 .
Démonstration : Il suffit de remarquer que, pour tout n > 1, X n est la suite dont
tous les termes sont nuls sauf le terme de numéro n qui vaut 1. Ensuite, on réécrit les
définitions.
Notation 2. Si X est l’indéterminée de B, on note B = A[X] et on appelle A[X]
l’anneau des polynômes sur A.
Profitons-en pour faire quelques calculs.
Exemple 1. Soient P = X 3 − 3X 2 + 2 et Q = X 2 − X + 2. Il s’agit de calculer le
polynôme P Q.
On pourra décomposer un des deux polynômes, par exemple Q, en somme de mo-
nômes, donc X 2 , −X et 2, puis effectuer chacune des multiplications de P par ces
monômes, et enfin tout regrouper. Une présentation claire, en alignant les monômes de
mêmes degrés, est une condition nécessaire de calcul sans erreurs.
X2 × P = X 5 −3X 4 +2X 2
−X × P = −X 4 +3X 3 −2X
3 2
2×P = 2X −6X +4
Q×P = X 5 −4X 4 +5X 3 −4X 2 −2X +4
Définition 3. Pour tout élément P non nul de A[X], l’unique entier d > 0 intervenant
dans l’écriture de P en fonction de l’indéterminée dans la proposition 2 est appelé le
degré de P . Par convention, le degré du polynôme nul est le symbole −∞.
Notation 3. Le degré d’un polynôme P est noté deg P .
Définition 4. Pour P élément non nul de A[X], le coefficient dominant de P est le
coefficient ad du terme de plus haut degré dans l’écriture de P en fonction de l’indé-
terminée. Par convention, le coefficient dominant du polynôme nul est 0. Enfin, un
polynôme est dit unitaire lorsque son coefficient dominant est égal à 1.
Proposition 3. Soient P et Q deux polynômes de A[X]. Alors :
deg(P + Q) 6 max(deg P, deg Q).
Démonstration : Si P ou Q est nul, le résultat est évident. Sinon, notons d le degré de

P et e le degré de Q puis P = ad X d + · · · + a0 et Q = be X e + · · · + b0 pour des ai et bi
dans A. Si d > e, on peut alors écrire :
P + Q = ad X d + · · · + ae+1 X e+1 + (ae + be )X e + · · · + (a0 + b0 ).
3
Il apparaît alors que deg(P +Q) = d = max(deg P, deg Q). Le cas où d < e est similaire.
Enfin, lorsque d = e, on a un regroupement :
P + Q = (ad + bd )X d + · · · + (a0 + b0 ).
Ou bien tous les coefficients y sont nuls, et deg(P + Q) = −∞ rendant l’inégalité

évidente, ou bien un au moins est non nul et le coefficient non nul de plus fort indice
est le degré de P + Q qui est bien inférieur ou égal à d.
Proposition 4. Soit A est un anneau commutatif intègre (sans diviseur de zéro).

Soient P et Q deux polynômes de A[X]. Alors :
deg(P Q) = deg P + deg Q.
Remarque : Pour un anneau non intègre, on a encore une inégalité, mais cela ne semble
pas indispensable à mémoriser (d’autant que la preuve en est très facile).
Démonstration : Essentiellement déjà faite.
Si P ou Q est nul, c’est évident ; sinon notons d le degré de P et e le degré de Q
puis P = ad X d + · · · + a0 et Q = be X e + · · · + b0 pour des ai et bi dans A. On a alors
P Q = ad be X d+e + (ad be−1 + ad−1 be )X d+e−1 + · · · + a0 b0 .
Si on n’est pas convaincu par les points de suspension, on écrira plus précisément :
d+e k
!
ai bk−i X k ,
X X
PQ =
k=0 i=0
en ayant préalablement convenu que ai = 0 pour i > d et bi = 0 pour i > e.

Comme l’anneau a été supposé intègre, le produit ad be n’est pas nul, donc le degré
de P Q est exactement égal à d + e.
Définition 5. Pour un polynôme P = ad X d + ad−1 X d−1 + · · · + a1 X + a0 non nul dans

A[X], le polynôme dérivé de P est le polynôme :
dad X d−1 + (d − 1)ad−1 X d−2 + · · · + a1 .
Si P = 0, le polynôme dérivé de P est le polynôme nul.
Notation 4. Le polynôme dérivé de P est noté P 0 . Par analogie avec les fonctions, on
notera ensuite P 00 la dérivée de P 0 , puis P (n) la dérivée n-ième.
Proposition 5. Soient P et Q deux polynômes de A[X]. Alors :
(P + Q)0 = P 0 + Q0 et (P Q)0 = P 0 Q + P Q0 .
4
Démonstration : Simple vérification évidente pour l’addition et ennuyeuse pour la

multiplication.
Définition 6. Soit
P = ad X d + ad−1 X d−1 + · · · + a1 X + a0
un polynôme de A[X] et x un élément de A. La valeur de P en x, notée P (x), est

l’élément de A égal à
ad xd + ad−1 xd−1 + · · · + a1 x + a0
Proposition 6. Soient P et Q deux polynômes de A[X] et x un élément de A. Alors
(P + Q)(x) = P (x) + Q(x) et (P Q)(x) = P (x)Q(x)
Démonstration : Simple vérification ; on pourrait aussi énoncer 1(x) = 1 qui est évident
et complète la collection d’évidences.
La notation P (x) n’a pas que des avantages : elle incite hélas à confondre le po-
lynôme P avec la fonction qu’il n’est pas. Bien que la notation soit la même, cette
définition ne se confond pas avec celle de valeur d’une application en un point.
La définition qui suit cherche à reproduire la notion de composition des fonctions
(encore une fois, insistons sur le fait que les polynômes ne sont pas des fonctions).
Elle est utilisée une seule fois plus loin, pour écrire la formule de Taylor relative aux
polynômes.
Définition 7. Soient P et Q deux polynômes de A[X], avec P = ad X d + ad−1 X d−1 +

· · · + a1 X + a0 . On appelle composé de P par Q le polynôme
ad Qd + ad−1 Qd−1 + · · · + a1 Q + a0
Notation 5. Ce composé est noté, selon le contexte P ◦ Q ou P (Q). Typiquement,

pour Q = X n , la notation P (X n ) s’impose et est d’ailleurs d’interprétation évidente.
Nous terminons cette section par quelques remarques d’algèbre linéaire, valables
uniquement dans le cas où l’anneau commutatif des coefficients est un corps K. Tout
d’abord, K[X] est un espace vectoriel sur K. Le plus simple est encore de vérifier à la
main la définition des espaces vectoriels, ce que l’on va se garder de faire explicitement
ici d’autant que la démonstration sera faite dans le chapitre Espaces vectoriels.
En fait, la définition de l’anneau des polynômes devrait évoquer le concept de base,
avec son existence et unicité d’écriture comme une sorte de combinaison linéaire. La
seule différence avec les vraies combinaisons linéaires est qu’on va chercher les vecteurs
de « base » dans une famille infinie.
5
Proposition 7. Soit K un corps commutatif. La suite (X i )i∈N est une « base » de

K[X] au sens suivant. Pour tout élément P de K[X], il existe une suite unique (an )n>0
d’éléments de K, à support fini, telle que
an X n ,
X
P =
n∈N
au sens où, si N est tel que an = 0 pour tout n > N , on a

N
an X n .
X
P =
n=0
La démonstration étant quasiment tautologique, on l’omettra, se bornant à remar-

quer que seule la deuxième somme, comportant un nombre fini de termes, est bien
définie.
Quoi qu’il en soit, K[X] est votre premier exemple raisonnablement simple d’espace
vectoriel ayant une base infinie. Toutefois, on est toujours plus à l’aise dans les espaces
de dimension finie. Il est donc intéressant d’introduire la
Notation 6. Soit K un corps commutatif et n > 0 un entier. On note Kn [X] l’ensemble
des polynômes sur K de degré inférieur ou égal à n.
Proposition 8. Pour tout entier n > 0, Kn [X] est un sous-espace vectoriel de K[X].
Une base de Kn [X] est (1, X, . . . , X n ). La dimension de Kn [X] est n + 1.
Démonstration : On remarque que Kn [X] est l’ensemble engendré par (1, X, . . . , X n ) :

c’est donc un sous-espace vectoriel. De plus cette famille génératrice est libre (soit par
une vérification directe, soit d’après l’unicité de la décomposition de la proposition 7),
c’est donc une base de Kn [X].
Définition 8. La base (X i )i∈N de K[X] est appelée sa base canonique.
La base (1, X, . . . , X n ) de Kn [X] est aussi appelée sa base canonique.
Remarque : Le lecteur pourra avoir l’impression qu’on passe son temps à définir de
partout des « bases canoniques » : on en a vu pour Kn , puis pour les espaces de
matrices, et maintenant pour les polynômes. C’est fini pourtant. Insistons bien sur le
fait qu’un espace « abstrait » n’a pas de base canonique : le mot est réservé à certaines
bases, remarquables par leur simplicité, d’espaces très particuliers.
Le lemme qui suit servira pour prouver la formule de Taylor et est une redite du
chapitre Espaces vectoriels. Un énoncé séparé n’était donc peut-être pas nécessaire
mais, même si ce n’est pas indispensable, cela ne peut faire de mal de le connaître ; le
plus important étant de comprendre et savoir refaire sa brève démonstration.
Lemme 1. Soit K un corps commutatif et (P0 , P1 , . . . , Pn ) une famille de polynômes
de K[X] tels que 0 6 deg P0 < deg P1 < · · · < deg Pn . Alors (P0 , P1 , . . . , Pn ) est une
famille libre.
6
Démonstration : La famille (P0 ) est libre, car il résulte de l’hypothèse 0 6 deg P0 que
P0 n’est pas nul. Puis le système (P0 , P1 ) est libre puisque P1 , de degré strictement
plus grand que P0 , ne peut lui être proportionnel. Puis (P0 , P1 , P2 ) est libre, puisque
toute combinaison linéaire de (P0 , P1 ) est de degré inférieur ou égal à deg P1 donc P2
ne peut en être une. Et ainsi de suite (ou plus proprement on fait une récurrence sur
n).
1.2 Arithmétique des polynômes

Il s’agit de répéter pour les polynômes des résultats similaires à ceux qui ont été
énoncés pour les entiers.
Premier point à observer : l’arithmétique sur les polynômes est tout à fait analogue à
celle sur les entiers à condition de travailler sur des polynômes sur un corps commutatif.
Sur un anneau commutatif quelconque (même intègre) se glissent quelques bizarreries.
Second point à observer : les énoncés donnés sur les entiers l’ont été sur des en-
tiers positifs. Ils se modifient sans trop de mal pour des entiers de Z mais parfois en
s’alourdissant un peu ; ainsi dans Z on ne peut plus affirmer l’existence d’un entier d
unique tel que n divise 10 et 6 si et seulement si n divise d (le pgcd de 10 et 6) : il en
existe toujours un, mais il n’est plus unique, on peut prendre d = 2 mais aussi d = −2.
Les polynômes unitaires joueront un rôle analogue aux entiers positifs mais ils sont
légèrement moins confortables, dans la mesure où la somme de deux entiers positifs
est positive alors que la somme de deux polynômes unitaires n’est pas nécessairement
unitaire. Attention à ces petits détails donc, en apprenant les énoncés.
Commençons par donner une définition, à partir de laquelle on ne montrera guère
de théorèmes que dans K[X] mais que ça ne coûte pas plus cher de donner sur un
anneau commutatif quelconque.
Définition 9. Soit A un anneau commutatif. On dit qu’un polynôme P dans A[X]
est un multiple d’un polynôme S dans A[X], ou, de manière équivalente, que S est un
diviseur de P , lorsqu’il existe un polynôme T dans A[X] tel que P = ST .
Comme pour les entiers, tout repose sur la division euclidienne.
Théorème 1. Soit K un corps commutatif, A un polynôme de K[X] et B un polynôme
non nul de K[X]. Il existe un couple (Q, R) unique de polynômes vérifiant la double
condition :
A = QB + R et deg R < deg B.
Démonstration : On prouvera successivement l’existence et l’unicité de (Q, R).

Existence de (Q, R)
La preuve est significativement différente de celle utilisée pour les entiers. Elle est
toujours basée sur une maximisation/minimisation, mais les polynômes n’étant pas
totalement ordonnés, cette maximisation est un peu plus technique.
7
Dans le cas stupide où B divise A, prenons R = 0 et Q tel que A = BQ. Sinon,

considérons l’ensemble
R = {A − QB | Q ∈ K[X]},
qui est donc un ensemble non vide de polynômes non nuls ; puis l’ensemble
E = {deg R | R ∈ R},
qui est un ensemble d’entiers positifs non vide. Cet ensemble E possède donc un plus
petit élément d ; prenons un R dans R dont le degré soit d et enfin un Q tel que
A − QB = R.
Nous devons vérifier que ces choix conviennent ; l’identité entre A, B, Q et R est
claire, reste l’inégalité concernant les degrés. Vérifions-la par l’absurde, en supposant
que deg B 6 deg R ; notons e le degré de B et
B = be X e + be−1 X e−1 + · · · + b0 , R = rd X d + rd−1 X d−1 + · · · + r0 .
Posons
rd d−e
Q1 = Q + X .
be
Remarquons qu’en écrivant cette définition, on utilise l’hypothèse deg B 6 deg R, qui
justifie que X d−e ait un sens, et simultanément le fait qu’on travaille dans un corps,
qui justifie la possibilité de diviser par be .
Considérons alors
rd d−e

R1 = A − Q1 B = A − QB − X B,
be
donc r
e e−1 d d−e
R1 = R − be X + be−1 X + · · · + b0 X .
be
Dans cette dernière écriture, on voit se simplifier les termes en X d de R et du produit
qu’on lui a soustrait, et on constate donc avoir obtenu un polynôme R1 de degré
strictement plus petit que celui de R. Mais alors le degré de R1 est dans E et contredit
l’hypothèse de minimisation qui a fait choisir d. Contradiction !
Unicité de (Q, R)
Soient (Q1 , R1 ) et (Q2 , R2 ) deux couples vérifiant les deux conditions exigées dans
l’énoncé du théorème.
On déduit de A = Q1 B +R1 = Q2 B +R2 que (Q2 −Q1 )B = R1 −R2 . Ainsi, R1 −R2
est un multiple de B. Des conditions deg R1 < deg B et deg R2 < deg B, on déduit que
deg(R1 − R2 ) < deg B.
Ainsi R1 − R2 est un multiple de B de degré strictement plus petit. La seule possi-
bilité est que R1 − R2 soit nul. On en déduit R1 = R2 , puis, en allant reprendre l’égalité
(Q2 − Q1 )B = R1 − R2 , que Q1 = Q2 .
8
Remarque : On a choisi d’énoncer ce théorème sur un corps commutatif pour faciliter sa

mémorisation et parce que l’on n’aura presque jamais besoin d’un énoncé plus général.
On aura toutefois besoin une fois de l’utiliser pour des polynômes sur un anneau ;
remarquons donc que la démonstration montre que le résultat reste vrai sur un anneau
commutatif quelconque à condition de supposer non seulement que B est non nul, mais
même que son coefficient dominant est inversible : le seul endroit où on a utilisé qu’on
s’était placé dans un corps commutatif a en effet été une division par ce coefficient
dominant.
Exemple 2. Concrètement, on disposera les divisions euclidiennes de polynômes com-
me les divisions de nombres entiers. Par exemple, pour diviser P = X 2 + X + 1 par
Q = X − 1, on écrit :
X2 + X + 1 X −1
2
X −X X +2
2X + 1
2X − 2
−1
Ce qui fournit la division euclidienne :
P = (X + 2)Q − 1.
Nous définissons ensuite le pgcd. On ne donnera pas ici d’énoncés concernant le

ppcm, non qu’il n’y en ait pas (ce sont là aussi les mêmes qu’en arithmétique des
entiers) mais parce qu’ils ne semblent pas très importants. Les étudiants curieux les
reconstitueront eux-mêmes.
Théorème 2. Soit K un corps commutatif. Soient A et B deux polynômes de K[X]. Il
existe un unique polynôme unitaire D de K[X] tel que pour tout polynôme P de K[X],
P divise A et B si et seulement si P divise D.
De plus il existe deux polynômes S et T de K[X] tels que D = SA + T B (identité
de Bézout).
Et tant qu’on y est avant de passer aux démonstrations :
Définition 10. Le plus grand commun diviseur de deux polynômes A et B est le
polynôme unitaire D apparaissant dans l’énoncé du théorème précédent.
Notation 7. Le plus grand commun diviseur de A et B sera noté pgcd(A, B).
Comme pour les entiers, plusieurs démonstrations sont possibles ; on ne donne que
celle basée sur l’algorithme d’Euclide.
Démonstration : La démonstration est une récurrence sur le degré de B.
Merveilles du copier-coller, voici de nouveau un « résumé de la preuve » sous forme
de programme informatique récursif (le même que pour l’arithmétique des entiers) :
9
Début du programme
* Pour B = 0, pgcd(A, 0) = A/coefficient dominant de A.
* Soit R le reste de la division euclidienne de A par B.
Les diviseurs communs de A et B sont ceux de B et R.
D’où : pgcd(A, B) = pgcd(B, R).
Fin du programme
Et voici, toujours par les vertus du copier-coller, la preuve récurrente formelle. On
va démontrer par « récurrence forte » sur le degré d de B l’hypothèse (Hd ) suivante :
(Hd ) Pour tout polynôme A et tout polynôme B de degré d, il existe deux
polynômes S et T tels que, pour tout polynôme P , P divise A et B si et
seulement si P divise SA + T B.
Vérifions (H−∞ ).
Il s’agit donc de traiter le cas où B = 0. Soit A un polynôme ; tout polynôme P
qui divise A divise aussi B = 0 puisque 0P = 0. Pour tout P , P divise A et 0 si et
seulement si P divise A. Prenons alors S = 1 et T = 0 : on a donc bien pour tout P :
P divise A et 0 si et seulement si P divise SA + T × 0.
Soit d un entier fixé. Supposons la propriété (Hc ) vraie pour tout c strictement
inférieur à d et montrons (Hd ).
Soient A un polynôme et B un polynôme de degré d. Notons A = BQ+R la division
euclidienne de A par B (qu’on peut réaliser puisque B 6= 0).
Vérifions l’affirmation intermédiaire suivante : pour tout P , P est un diviseur com-
mun de A et B si et seulement si P est un diviseur commun de B et R. (Avec des mots
peut-être plus lisibles : « les diviseurs communs de A et B sont les mêmes que ceux de
B et R »).
Soit P un diviseur commun de A et B, alors P divise aussi R = A − BQ ; récipro-
quement soit P un diviseur commun de B et R, alors P divise aussi A = BQ + R.
L’affirmation intermédiaire est donc démontrée.
On peut alors appliquer l’hypothèse de récurrence (Hdeg R ) (puisque précisément
deg R < deg B) en l’appliquant au polynôme B.
On en déduit qu’il existe deux polynômes S1 et T1 tels que pour tout P , P divise
B et R si et seulement si P divise S1 B + T1 R.
Remarquons enfin que S1 B + T1 R = S1 B + T1 (A − BQ) = TA A + (S1 − Q)B, et
qu’ainsi, si on pose S = TA et T = S1 − Q on a bien prouvé que, pour tout P , P divise
Q et B si et seulement si P divise SA + T B.
(Hd ) est donc démontrée.
On a donc bien prouvé (Hd ) pour tout d ∈ N ∪ {−∞}.
Une fois qu’on en est arrivé là, il ne reste donc plus qu’à montrer que pour un
polynôme P (le polynôme SA + T B) il existe un unique D unitaire tel que Q divise P
si et seulement si Q divise D. L’existence est claire : comme le résumé le suggère, on
10
divise P par son coefficient dominant et on obtient un polynôme D unitaire ayant les
mêmes diviseurs que P . Pour ce qui est de l’unicité, elle est évidente pour P nul ; on
supposera P non nul. Soit maintenant D1 un polynôme unitaire ayant exactement les
mêmes diviseurs que P . Alors comme P divise P , P divise D1 , et comme D1 divise D1 ,
D1 divise P . Les polynômes P et D1 se divisent donc mutuellement ; soit Q1 et Q2 les
quotients respectifs de P par D1 et de D1 par P . En utilisant la formule calculant le
degré d’un produit, on voit que forcément, P a même degré que D1 et que les polynômes
Q1 et Q2 sont de degré nul, donc des constantes λ1 et λ2 . Soit ad le coefficient dominant
de P ; le coefficient dominant de Q1 D1 = P vaut λ1 · 1 donc λ1 = ad et D1 est égal à
P/(coefficient dominant de P ), donc à D, ce qui prouve l’unicité.
Nous allons ensuite définir le pgcd d’un nombre fini de polynômes. En arithmé-
tique des entiers, cette notion n’est pas primordiale ; en revanche dans les applications
des raisonnements arithmétiques à des polynômes, on est souvent dans des cas où on
s’intéresse à des pgcds de plus de deux polynômes à la fois.
L’énoncé donné ci-dessus pour deux polynômes se généralise à un nombre fini, par
récurrence sur ce nombre.
Proposition 9. Soit K un corps commutatif, n > 1 un entier et A1 , A2 , . . . , An des
polynômes de K[X]. Il existe un unique polynôme unitaire D de K[X] tel que pour tout
P dans K[X], P divise tous les Ai de i = 1 à i = n si et seulement si P divise D.
De plus il existe n polynômes S1 , . . . , Sn tels que
D = S1 A1 + S2 A2 + · · · + Sn An
(identité de Bézout).
Démonstration : C’est une récurrence facile sur n. Le cas n = 2 est l’objet du théorème
précédent (et le cas n = 1 a été traité dans sa démonstration, ou on peut le ramener
fictivement à n = 2 en disant que les diviseurs de A1 sont les diviseurs communs de A1
et de 0).
Soit n > 2 fixé, supposons la proposition vraie pour tout ensemble de n polynômes.
Prenons n + 1 polynômes A1 , A2 , . . . , An+1 . Notons B le pgcd des n premiers, qui existe
par l’hypothèse de récurrence. Alors les diviseurs communs de A1 , A2 , . . ., An+1 sont
les diviseurs communs de B et de An+1 ; donc prendre D = pgcd(B, An+1 ) répond à
la question. L’unicité est claire : si D1 répondait aussi à la question, les diviseurs de
D1 seraient exactement les mêmes que ceux de D avec D et D1 tous deux unitaires, et
comme dans la preuve du théorème précédent (ou en appliquant le théorème précédent
à D et 0), on conclut que D = D1 . La relation de Bézout est aussi le résultat d’une
récurrence immédiate : il existe S1 , S2 , . . . , Sn tels que B = S1 A1 + S2 A2 + · · · + Sn An
et T1 et T2 tels que D = T1 B + T2 An+1 donc
D = (T1 S1 )A1 + (T1 S2 )A2 + · · · + (T1 Sn )An + T2 An+1 .
11
Définition 11. Soit K un corps commutatif et n > 1 un entier. On dira que n po-
lynômes de K[X] sont premiers entre eux lorsque leurs seuls diviseurs communs sont
constants (en d’autres termes, quand leur pgcd est 1).
On prendra garde à ne pas confondre « premiers entre eux » (on dit parfois « pre-
miers entre eux dans leur ensemble ») et « deux à deux premiers entre eux » : dans
R[X], les polynômes
(X − 1)(X − 2) , (X − 1)(X − 3) , (X − 2)(X − 3)
sont premiers entre eux (dans leur ensemble) mais ils ne sont pas deux à deux premiers
entre eux.
Les polynômes irréductibles sont les analogues des nombres premiers. Toutefois les
usages étant ce qu’ils sont, il y a une petite nuance de vocabulaire un peu désagréable :
alors que le mot « nombre premier » est réservé à des entiers positifs, le mot « polynôme
irréductible » n’est pas réservé à des polynômes unitaires. On se méfiera de cette peu
perceptible nuance qui crée de légères discordances entre énoncés analogues portant les
uns sur les polynômes et les autres sur les entiers.
Définition 12. Soit K un corps commutatif. On dira qu’un polynôme P dans K[X]
est irréductible lorsqu’il possède exactement deux diviseurs unitaires.
On remarquera tout de suite que ces deux diviseurs unitaires sont alors forcément
les polynômes 1 et P/(coefficient dominant de P ).
La proposition suivante est évidente, mais donne un exemple fondamental de poly-
nômes irréductibles :
Proposition 10. Soit K un corps commutatif. Dans K[X], les polynômes du premier
degré sont irréductibles.
Démonstration : Soit P = aX +b avec a 6= 0 un polynôme du premier degré dans K[X].

Cherchons ses diviseurs unitaires. Un diviseur de P doit avoir un degré inférieur ou
égal à celui de P . Le seul diviseur unitaire constant de P est le seul polynôme constant
unitaire : la constante 1. Cherchons les diviseurs unitaires de la forme X + c de P .
Si X + c divise P , il existe un polynôme Q tel que P = (X + c)Q et en comparant
les degrés, Q est nécessairement constant. En comparant les coefficients dominants,
b
nécessairement Q = a donc c = . Ainsi P possède exactement un diviseur unitaire
a
b
du premier degré, le polynôme X + . Le polynôme P est donc irréductible.
a
Sur un corps quelconque, déterminer quels polynômes sont irréductibles et lesquels
ne le sont pas est un problème très sérieux ; dans quelques pages, nous verrons que ce
problème a une solution simple dans les cas particuliers des polynômes à coefficients
complexes ou réels.
12
Le résultat fondamental est, comme en arithmétique entière, l’existence et unicité

de la décomposition en facteurs irréductibles. Elle repose là encore sur le « lemme de
Gauss ». On ne réécrit pas les démonstrations pour deux raisons totalement contra-
dictoires : d’abord parce que ce sont exactement les mêmes, et ensuite parce que ce
ne sont pas exactement les mêmes –une petite difficulté se pose pour énoncer l’unicité
de la décomposition en facteurs irréductibles d’un polynôme. Pour des entiers, on a
convenu de classer les facteurs dans l’ordre croissant : ainsi 6 se décompose en 2 · 3
et non en 3 · 2. Une telle convention ne peut être appliquée pour décomposer des po-
lynômes, aucun ordre « raisonnable » n’étant à notre disposition sur l’ensemble des
polynômes irréductibles ; ainsi dans C[X] peut-on écrire selon la fantaisie du moment
X 2 + 1 = (X − i)(X + i) ou X 2 + 1 = (X + i)(X − i). Quand on énonce ci-dessous que la
décomposition est « unique » on sous-entend donc qu’on considère les deux exemples
qui précèdent comme la même décomposition, ce qui peut s’énoncer rigoureusement
mais lourdement. Voulant glisser sur ce détail, on se condamne à rester un peu vaseux.
Voici donc le lemme de Gauss.
Lemme 2. Soit K un corps commutatif. Soient A, B et C trois polynômes de K[X].

Si A divise BC et est premier avec C, alors A divise B.
Démonstration : La même que pour les entiers, avec des majuscules.

Et voici le théorème de décomposition en facteurs irréductibles.
Théorème 3 (Énoncé moyennement précis). Soit K un corps commutatif.

Tout polynôme P non nul de K[X] peut s’écrire de façon « unique » en produit :
P = λP1α1 P2α2 · · · Pkαk ,
dans lequel λ est le coefficient dominant de P , les Pi pour 1 6 i 6 k sont des poly-
nômes irréductibles unitaires deux à deux distincts, et les αi sont des entiers strictement
positifs.
Démonstration : À peu près la même que pour les entiers, avec un peu plus de soin
pour l’unicité.
1.3 Racines des polynômes

Définition 13. Soit A un anneau commutatif, P un polynôme de A[X] et a un élément
de A. On dit que a est une racine (ou un zéro) de P lorsque P (a) = 0.
Le résultat qui suit est fondamental, bien que très facile.
Proposition 11. Soit A un anneau commmutatif, P un polynôme de A[X] et a un

élément de A. L’élément a est une racine de P si et seulement si X − a divise P .
13
Démonstration : Supposons que X −a divise P , soit P = (X −a)Q. On obtient aussitôt

P (a) = (a − a)Q(a) = 0.
Réciproquement, supposons que P (a) = 0. La remarque qui suit l’énoncé du théo-
rème de division euclidienne montre que, même dans un anneau quelconque, on peut
faire la division euclidienne de P par X − a ; écrivons donc P = Q(X − a) + R, où le
degré de R est strictement inférieur à 1 = deg(X − a) donc R est une constante c.
En appliquant cette relation à a, on obtient 0 = P (a) = c. Ainsi, P = (X − a)Q et
donc X − a divise P .
Corollaire 1. Soit A un anneau commutatif intègre. Un polynôme non nul de degré n

possède au plus n racines.
Démonstration : Par récurrence sur n. Pour n = 0, un polynôme constant non nul

possède évidemment zéro racine.
Soit n fixé, supposons le résultat vrai pour les polynômes de degré n ; soit main-
tenant P un polynôme de degré n + 1. Si P n’a aucune racine, le résultat est vrai
pour P ; sinon soit a une racine de P ; par la proposition précédente on peut écrire
P = (X − a)Q pour un polynôme Q, qui est clairement de degré n. Maintenant, si b
est une racine de P , alors 0 = P (b) = (b − a)Q(b) donc b = a ou b est une racine de Q
(c’est ici qu’on utilise l’hypothèse d’intégrité) ; or Q a au plus n racines, donc P en a
au plus n + 1.
On va ensuite définir un concept de « racine multiple ».
Définition 14. Soit A un anneau commutatif, P un polynôme de A[X] et a un élément

de A. On dit que a est racine au moins k-ième de P lorsque (X − a)k divise P et que
a est racine k-ième lorsque a est racine au moins k-ième sans être racine au moins
k + 1-ième. Dans ce dernier cas, on dit que k est la multiplicité (ou l’ordre) de a
comme racine de P .
La dérivation des polynômes est un outil qui permet d’étudier les racines multiples.
Voilà tout d’abord un énoncé concernant les racines doubles (l’énoncé concernant les
racines d’ordre supérieur cache une petite subtilité et est reporté plus loin).
Proposition 12. Soit A un anneau commutatif, P un polynôme de A[X] et a un

élément de A. L’élément a est racine au moins double de P si et seulement s’il est
simultanément racine de P et de son dérivé P 0 .
Démonstration : Supposons a racine au moins double de P et posons P = (X − a)2 Q,

alors P 0 = 2(X − a)Q + (X − a)2 Q0 et il est clair que a est également racine de P 0 .
Réciproquement, supposons a racine de P et de P 0 . Comme a est racine de P , on
peut écrire P = (X − a)Q1 , donc P 0 = (X − a)Q01 + Q1 . En appliquant cette identité
à a, on obtient Q1 (a) = 0. Donc Q1 admet lui-même X − a en facteur et peut s’écrire
Q1 = (X − a)Q pour un polynôme Q. Donc P = (X − a)2 Q.
14
1.4 Polynômes versus fonctions polynomiales

Nous avons commencé en insistant sur la différence entre polynômes et fonctions
polynomiales ; il est temps de voir le rapport entre ces deux concepts.
Définition 15. Soit A un anneau commutatif. Une application f : A → A est polyno-

miale lorsqu’il existe un entier n > 0 et un (n + 1)-uplet (a0 , . . . , an ) d’éléments de A
tel que pour tout x ∈ A, f (x) = a0 + a1 x + · · · + an xn .
On peut associer à chaque polynôme une fonction polynomiale, mais il n’est pas du
tout évident d’associer un polynôme à une fonction polynomiale.
Définition 16. Soit A un anneau commutatif et P un polynôme de A[X]. La fonction

polynomiale associée à P est l’application f : A → A définie de la façon suivante :
si P s’écrit a0 + a1 X + · · · + an X n , f est l’application définie par :
f : A → A, x 7→ f (x) = a0 + a1 x + · · · + an xn .
Les morceaux « évidents » de la proposition suivante resteraient vrais sur des

anneaux, mais on l’énonce sur des corps pour pouvoir prononcer des termes d’algèbre
linéaire.
Proposition 13. Soit K un corps commutatif et soit U : K[X] → KK l’application

définie par : U (P ) est la fonction polynomiale associée à P .
Alors U est une application linéaire. De plus, U (P Q) = U (P )U (Q) pour tous P et
Q et U (1) = 1, où le deuxième 1 désigne la fonction constante prenant la valeur 1.
L’image de U est le sous-espace vectoriel de KK formé des fonctions polynomiales.
Si K est infini, l’application U est injective, donc induit une bijection entre l’espace
des polynômes et celui des fonctions polynomiales.
Démonstration : Les deux premiers paragraphes sont totalement évidents : il faut juste
déplier successivement la définition de U , celle de fonction polynomiale associée à un
polynôme et celle de valeur d’un polynôme en un point.
Le paragraphe intéressant est le dernier. Puisqu’il s’agit d’une application linéaire,
on peut attaquer l’injectivité par l’étude du noyau. Soit P un élément de ker(U ). Cela
signifie que l’application polynomiale associée à P est la fonction nulle, c’est-à-dire
que pour tout a de A, P (a) = 0. Ainsi tous les éléments de K sont des racines de P .
Comme on a supposé K infini, ceci entraîne que P a une infinité de racines. Mais on
sait qu’un polynôme non nul n’a qu’un nombre fini de racines (leur nombre vaut au
plus son degré). Donc P = 0 ce qui prouve que ker(U ) est réduit à {0} donc l’injectivité
de U .
Remarque : Ce que dit en gros cette proposition, pour ceux qui la trouveraient trop
abstraite, c’est que si on ne comprend pas la différence entre les polynômes et les
fonctions polynomiales et qu’on travaille sur un corps infini, on ne s’expose pas à des
15
déboires sérieux. Mais cette possibilité de relâchement ne doit pas être exploitée :
une telle confusion sur un corps fini serait irrémédiable. Pour voir un exemple simple,
contemplez le bête polynôme X + X 2 de Z/2Z[X] ; si on le code en machine comme
indiqué au début de ce chapitre, c’est la suite de bits 011, qui n’est manifestement pas
0. Pourtant si on regarde non le polynôme mais la fonction polynomiale x 7→ x + x2 ,
sa valeur en cl(0) est cl(0) + cl(0)2 = cl(0) et sa valeur en cl(1) est cl(1) + cl(1)2 = cl(0)
donc c’est bien la fonction polynomiale nulle. Ce n’est donc pas du tout de celle-ci que
l’on parle quand on évoque le polynôme X + X 2 .
Pour vérifier qu’on a compris cet exemple, on résoudra les exercices (très simples)
suivants.
Exercice 1. Énumérer toutes les applications de Z/2Z dans Z/2Z.
Exercice 2. Soit K un corps fini. Exhiber un polynôme P non nul de K[X] tel que
P (x) = 0 pour tout x dans K.
1.5 Formule de Taylor pour les polynômes

Alors que pour des fonctions d’une variable réelle en général, la formule de Taylor
ne peut tomber juste puisqu’elle consiste à approcher la fonction par une fonction po-
lynomiale et que la fonction quelconque n’est précisément en général pas polynomiale,
pour des polynômes, la formule analogue ne contient pas de reste.
Une petite subtilité apparaît dans les divisions par des factorielles qui enjolivent la
formule. En effet dans un anneau commutatif quelconque, mais même dans un corps
commutatif, on ne peut pas toujours diviser par une factorielle : dans le corps Z/3Z,
la factorielle 3! qui vaut 6 vaut tout simplement 0 puisque 6 est divisible par 3. C’est
pourquoi ce théorème nécessite une restriction technique : j’ai choisi de l’énoncer pour
des polynômes à coefficients complexes. Les lecteurs qui souhaiteraient utiliser ce cours
comme référence (soyons fous) et le relire dans quelques années (idem) noteront que
la « bonne » hypothèse est plutôt d’être en caractéristique nulle (quand ils sauront ce
que signifie cette hypothèse, ce qui n’est pas encore notre cas).
Théorème 4. Soit P un polynôme de C[X] de degré inférieur ou égal à n, et soit a

un élément de C. Alors :
P 00 (a) P (n) (a)

P = P (a) + P 0 (a)(X − a) + (X − a)2 + · · · + (X − a)n .
2! n!
Démonstration : On va travailler dans l’espace vectoriel Cn [X] et considérer dans cet

espace le système (1, X − a, (X − a)2 , . . . , (X − a)n ). Ces polynômes sont de degrés
successifs 0 < 1 < · · · < n donc on peut appliquer le lemme mis là tout exprès dans
les observations d’algèbre linéaire et conclure que c’est un système libre dans Cn [X].
16
Voilà une famille de n + 1 vecteurs dans un espace de dimension n + 1, c’en est donc
une base, et en particulier un système générateur.
Il existe donc des coefficients c0 , c1 , . . . , cn tels que
(∗) P = c0 + c1 (X − a) + c2 (X − a)2 + · · · + cn (X − a)n .
Il reste à identifier les coefficients ck . Pour cela, appliquons tout d’abord (∗) au point
a : on obtient P (a) = c0 .
Ensuite, dérivons (∗) ; on obtient :
(∗∗) P 0 = c1 + 2c2 (X − a) + 3c3 (X − a)2 · · · + ncn (X − a)n−1 .
Appliquons (∗∗) au point a : on obtient P 0 (a) = c1 .
Dérivons (∗∗) ; on obtient :
(∗ ∗ ∗) P 00 = c2 + 6c3 (X − a) + (4 × 3)c3 (X − a)2 · · · + n(n − 1)cn (X − a)n−2 .
Appliquons (∗ ∗ ∗) au point a : on obtient P 00 (a) = 2c2 .
En écrivant formellement une récurrence on montre ainsi que pour tout k avec
1 6 k 6 n, P (k) (a) = k! ck .
P (k) (a)
Comme on est dans C, on peut diviser par k! et obtenir les relations ck =
k!
donc la formule annoncée.
Remarque : On a énoncé ce théorème pour des polynômes à coefficients complexes.
Mais si on a par exemple affaire à un polynôme réel, c’est en particulier un polynôme
complexe et la formule est donc parfaitement vraie pour ce polynôme aussi.
De cette formule, on peut tirer un énoncé un peu technique sur les racines multiples.
Proposition 14. Soit P un polynôme de C[X], a un nombre complexe et k un entier
supérieur ou égal à 1. Alors a est une racine au moins k + 1-ième de P si et seulement
si P (a) = P 0 (a) = . . . = P (k) (a) = 0.
Démonstration : Si P est nul, c’est évident, sinon notons n le degré de P et λ son

coefficient dominant.
Considérons les indices i > 0 tels que P (i) (a) 6= 0, en convenant que P (0) = P . Il
existe de tels indices, car le polynôme P (n) est égal à la constante n!λ, donc n’est pas
nul en a. Cet ensemble non vide d’entiers positifs a donc un plus petit élément m, qui
vérifie 0 6 m 6 n. Écrivons la formule de Taylor en mettant en relief cet entier m :
P (m) (a) P (m+1) (a) P (n) (a)
P = (X − a)m + (X − a)m+1 + · · · + (X − a)n .
m! (m + 1)! n!
On constate qu’on peut mettre (X − a)m en facteur, mais que le facteur obtenu, qui
est le polynôme
P (m) (a) P (m+1) (a) P (n) (a)
Q= + (X − a) + · · · + (X − a)n−m ,
m! (m + 1)! n!
17
ne s’annule pas en a : la multiplicité de a comme racine de P est donc exactement m.

Dès lors, a est racine au moins k + 1-ième de P si et seulement si k < m, et par
définition de m ceci arrive bien si et seulement si P (a) = P 0 (a) = . . . = P (k) (a) = 0.
1.6 Polynômes sur C versus polynômes sur R

Toute cette section repose sur un théorème qu’il n’est pas possible de démontrer
dans un cours de notre niveau.
Théorème de d’Alembert-Gauss Tout polynôme de C[X] non constant admet au
moins une racine complexe.
Démonstration : Elle repose sur un peu d’analyse, mais d’analyse complexe, qui n’est
pas traitée avant l’année de L3.
Par contre, en admettant le théorème de d’Alembert-Gauss, on peut caractériser

les polynômes irréductibles de C[X].
Corollaire 2. Dans C[X], les polynômes irréductibles sont exactement les polynômes
du premier degré.
Démonstration : On sait déjà que dans n’importe quel corps commutatif les polynômes
du premier degré sont irréductibles ; il est très facile de voir que les constantes (non
nulles) ne possèdent que 1 comme diviseur unitaire et que 0 en possède une infinité :
les constantes ne sont donc irréductibles sur aucun corps.
Soit maintenant un P de degré supérieur ou égal à 2 dans C[X]. Par le théorème
précédent, P possède au moins une racine a. Mais on sait alors expliciter trois diviseurs
unitaires de P : la constante 1, le polynôme du premier degré X − a et le polynôme P/
(coefficient dominant de P ), qui est de degré supérieur ou égal à deux. Ainsi P n’est
pas irréductible.
Définition 17. On dit qu’un polynôme est scindé lorsqu’il peut s’écrire sous forme de
produit de facteurs du premier degré.
Corollaire 3. Dans C[X], tout polynôme non nul est scindé.
Démonstration : Sa décomposition en facteurs irréductibles est une décomposition en

produit de facteurs du premier degré.
Dans R[X], les choses sont légèrement plus compliquées, mais pas tant que ça.
Proposition 15. Dans R[X] les polynômes irréductibles sont exactement les polynômes
du premier degré et les polynômes du deuxième degré à discriminant strictement négatif.
18
Avant de donner la preuve, rappelons que le discriminant du polynôme P = aX 2 +bX+c

vaut
disc(P ) = b2 − 4ac.
Démonstration : On sait déjà que les polynômes du premier degré sont irréductibles.
Soit maintenant P du deuxième degré ; s’il a un diviseur unitaire autre que les deux
évidents, celui-ci est du premier degré, donc P a une racine et son discriminant est
positif ou nul. Les polynômes du deuxième degré à discriminant strictement négatif
sont donc irréductibles.
Réciproquement, il est clair que les polynômes du deuxième degré à discriminant
positif ou nul sont factorisables, donc pas irréductibles. Soit enfin un polynôme P de
degré supérieur ou égal à 3. Si P admet une racine réelle a, P n’est pas irréductible de
façon quasi évidente. Sinon, considérons pendant quelques lignes P comme un poly-
nôme à coefficients complexes. Par le théorème de d’Alembert-Gauss, il admet au moins
une racine complexe a, qui n’est pas réelle puisqu’on a supposé P sans racine réelle. En
profitant de ce que le conjugué de la somme est la somme des conjugués, que le conjugué
du produit est le produit des conjugués et que chaque coefficient de P est invariant par
conjugaison, on voit qu’on a aussi P (a) = 0. Les polynômes X − a et X − a étant deux
irréductibles distincts dans C[X], le fait qu’ils divisent tous deux P entraîne que leur
produit divise P dans C[X]. Mais ce produit vaut (X −a)(X −a) = X 2 −2Re(a)X +|a|2
et est donc un polynôme B du deuxième degré à coefficients réels.
Si on est distrait, on pourra croire qu’on a ainsi trouvé en B un diviseur unitaire
non évident de P dans R[X] et conclure que P n’est pas irréductible. En réalité, on
glisserait sur un détail en affirmant ceci : on sait en effet que B divise P dans C[X]
mais il nous faut encore vérifier qu’il le divise dans R[X]. Pour ce faire, effectuons la
division euclidienne de P par B dans R[X] : elle fournit des polynômes Q et R, avec
deg R < 2, tels que P = BQ + R. Ces polynômes de R[X] peuvent aussi être vus
comme des polynômes à coefficients complexes, donc P = BQ + R est aussi la division
euclidienne de P par B dans C[X]. Mais on sait que B divise P dans C[X] et que la
division euclidienne est unique ; donc R = 0, donc P = BQ pour un Q à coefficients
réels, et on a bien montré que B divise P dans R[X] aussi.
Une fois cet obstacle franchi, on conclut comme dit au début du paragraphe précé-
dent : on a trouvé un diviseur unitaire non évident de P et celui-ci ne peut donc pas
être irréductible.
1.7 Corps des fractions rationnelles

Le concept est très simple : les fractions rationnelles sont les expressions de la forme
P
où P et Q sont des polynômes. Une mise en forme totalement rigoureuse demande un
Q
effort un peu disproportionné par rapport au caractère intuitif de l’objet à construire.
La première idée qui peut venir à l’esprit est de tenter de modéliser la fraction
19
P
par le couple (P, Q) qui contient à première vue la même information : ainsi la
Q
X
fraction correspondra au couple (X, X + 1). Une telle idée nous met sur la
X +1
bonne piste, mais elle se heurte à un problème : le couple (X 2 , X 2 + X) représentera
X2 X
la fraction 2 = ; la même fraction correspond donc à plusieurs couples,
X +X X +1
et l’ensemble de tous les couples (P, Q) est donc trop gros.
On pourrait penser à n’utiliser que des couples (P, Q) avec P et Q premiers entre
eux ; c’est vraisemblablement faisable, mais la preuve risque d’être extrêmement lourde,
avec des pgcd à simplifier de partout.
Non, décidément, on ne fera rien de simple si on n’a pas compris ce qu’est un
ensemble-quotient, alors que si on maîtrise cette notion, la preuve est longue à écrire,
mais sans obstacles.
Dans tout le chapitre, K désigne un corps commutatif. Notons A = K[X]. La
construction utilise simplement le fait que A est un anneau intègre, et nullement en
réalité que A est l’anneau des polynômes.
Définition 18. Soit A un anneau intègre, 0 son neutre pour l’addition, et C l’ensemble
C = A × (A \ {0}).
Sur C on introduit deux opérations + et × définies comme suit : pour tous (P1 , Q1 ) et
(P2 , Q2 ) de C, on pose
(P1 , Q1 ) × (P2 , Q2 ) = (P1 P2 , Q1 Q2 ) (P1 , Q1 ) + (P2 , Q2 ) = (P1 Q2 + P2 Q1 , Q1 Q2 ).
On notera qu’on utilise très discrètement l’intégrité de A pour justifier que le produit
Q1 Q2 qui intervient dans les formules n’est pas nul, donc que la somme et le produit
d’éléments de C appartiennent effectivement à C.
Signalons une fois encore que les deux formules de la définition précédente se com-
prennent aisément si on a en tête qu’un couple (P, Q) a vocation à décrire la fraction
P
(qui n’aura un sens propre qu’une fois la construction terminée) : elles sont les
Q
reproductions des formules qu’on sait bien utiliser pour multiplier ou additionner des
fractions.
L’ensemble C a une bonne tête vu de loin, mais de près il est trop gros. Pour le
faire maigrir, introduisons une relation d’équivalence R sur C.
Définition 19. Pour tous (P1 , Q1 ) et (P2 , Q2 ) de C,
(P1 , Q1 )R(P2 , Q2 ) lorsque P1 Q2 = P2 Q1 .
Si nous savions déjà donner un sens aux barres de fractions, nous aurions écrit la
P1 P2
condition sous la forme = , la rendant ainsi compréhensible, mais comme ce
Q1 Q2
20
symbole ne nous sera disponible qu’une fois finie la construction, on a dû donner une
forme moins limpide.
Proposition 16. La relation R est une relation d’équivalence sur C.
Démonstration : En effet, P1 Q2 = P2 Q1 et P2 Q3 = P3 Q2 impliquent P1 Q3 = P3 Q1 ,

voyez-vous. (Indication : comme Q2 6= 0, on calcule P1 Q3 Q2 .)
Notation 8. On note B l’ensemble-quotient C/R et cl(P, Q) la classe d’un élément
(P, Q) de C.
On va alors définir des opérations + et × sur B ; le principe est le même que
celui qui nous a permis de définir addition et multiplication sur Z/nZ : on définit
simplement ces opérations sur des représentants des classes d’équivalence, et on vérifie
méthodiquement que le résultat obtenu ne dépend pas de la classe utilisée.
Définition 20. Pour cl(P1 , Q1 ) et cl(P2 , Q2 ) éléments de B, on note
cl(P1 , Q1 ) + cl(P2 , Q2 ) = cl ((P1 , Q1 ) + (P2 , Q2 )) .
et
cl(P1 , Q1 ) × cl(P2 , Q2 ) = cl ((P1 , Q1 ) × (P2 , Q2 )) ,
Cette « définition » n’en sera une qu’une fois vérifiée la proposition suivante.
Proposition 17. Le résultat des opérations + et × définies sur C ne dépend pas des
représentants choisis.
Démonstration : On fait la vérification soigneusement pour l’addition, avec « renvoi

au lecteur » pour la multiplication.
Soit (P3 , Q3 ) un représentant quelconque de la classe de (P1 , Q1 ) et (P4 , Q4 ) un
représentant quelconque de la classe de (P2 , Q2 ). Il faut vérifier que
(P1 , Q1 ) + (P2 , Q2 ) = (P1 Q2 + P2 Q1 , Q1 Q2 )
et
(P3 , Q3 ) + (P4 , Q4 ) = (P3 Q4 + P4 Q3 , Q3 Q4 ),
sont bien dans la même classe.
Cela revient à comparer les produits P5 et P6 définis par :
P5 = (P1 Q2 + P2 Q1 )Q3 Q4 , P6 = (P3 Q4 + P4 Q3 )Q1 Q2 .
On dispose pour ce faire des égalités P1 Q3 = P3 Q1 et P2 Q4 = P4 Q2 , issues respecti-
vement des relations (P1 , Q1 )R(P3 , Q3 ) et (P2 , Q2 )R(P4 , Q4 ). La vérification est alors
directe :
P5 = P1 Q3 Q2 Q4 + P2 Q4 Q1 Q3 = P3 Q1 Q2 Q4 + P4 Q2 Q1 Q3 = P6 .

21
Notation 9. Quand A = K[X], on note K(X) l’ensemble B = C/R ainsi construit.
On a donc bien construit un ensemble K(X) puis une addition et une multiplication
sur cet ensemble.
Théorème 5. L’ensemble K(X) muni des lois + et × est un corps commutatif.
Démonstration : La vérification de toutes les propriétés de la définition d’un corps

commutatif est simple, méthodique et lourde. On se bornera ici à justifier l’existence
de l’inverse.
Si une classe cl(P1 , Q1 ) n’est pas nulle, on remarque d’abord que P1 6= 0, puisque
cl(P1 , Q1 ) 6= cl(0, 1). La classe cl(Q1 , P1 ) existe donc ; ce sera l’inverse de cl(P1 , Q1 ) : en
effet le produit des deux est cl(Q1 P1 , P1 Q1 ) qui est égal à la classe de (1, 1) qui est le
neutre pour la multiplication.
Proposition 18. L’anneau K[X] est inclus dans K(X) ; plus précisément, il existe un
morphisme d’anneaux j : K[X] → K(X) qui est injectif. Tout élément de K(X) peut
s’écrire comme j(P )j(Q)−1 pour P et Q dans K[X] et Q 6= 0.
Démonstration : Soit j l’application définie par j(P ) = cl(P, 1). Il est très facile de
vérifier que j transforme addition en addition et multiplication en multiplication ; son
injectivité peut seule interpeller. Mais puisque cette transformation est un morphisme
de groupes additifs, l’injectivité se laisse montrer à coups de noyaux ; et effectivement
si un polynôme P est envoyé sur le neutre additif de K(X) qui est la classe de (0, 1),
c’est que (P, 1)R(0, 1) et donc que P = 0 : le noyau est bien réduit au seul polynôme
nul. Enfin,
cl(P, Q) = cl(P, 1)cl(1, Q) = cl(P, 1) [cl(Q, 1)]−1 = j(P )j(Q)−1 .

P
Notation 10. On note P/Q ou l’élément cl(P, Q) de K(X).
Q
1.8 Décomposition en éléments simples

L’objectif principal de cette section est le théorème de décomposition en éléments
simples, utilisé notamment pour le calcul des primitives de fractions rationnelles, et
qui est un peu indigeste.
Théorème 6. On se donne une fraction rationnelle P/Q élément de K(X) et on

considère la décomposition de Q en produits de polynômes unitaires irréductibles :
Q = λQα1 1 Qα2 2 · · · Qαk k .
22
Alors il existe une et une seule écriture :

P A1,1 A1,α A2,1 A2,α Ak,1 Ak,α
=R+ + · · · + α11 + + · · · + α22 + · · · + + · · · αkk ,
Q Q1 Q1 Q2 Q2 Qk Qk
dans laquelle R et les Ai,j sont tous des polynômes de K[X] qui vérifient en outre
la condition suivante, portant sur les degrés : pour tout couple d’indices (i, j) tel que
1 6 i 6 k et 1 6 j 6 αi ,
deg Ai,j < deg Qi .
Démonstration : Preuve de l’existence

Dans un premier temps, on va considérer les polynômes :
α
T1 = Qα2 2 Qα3 3 · · · Qαk k , T2 = Qα1 2 Qα3 3 · · · Qαk k , ... Tk = Qα1 1 Qα2 2 · · · Qk−1
k−1
.
Chaque Ti reprend les facteurs de la décomposition de Q à l’exception de λ et Qαi i .

Un éventuel diviseur irréductible unitaire commun à tous ces polynômes doit diviser
Tk ; ce doit donc être un des polynômes Qi avec i < k. Mais Q1 ne divise pas T1 , Q2 ne
divise pas T2 , et ce jusqu’à Qk−1 qui ne divise pas Tk−1 . Les polynômes T1 , . . . , Tk ne
possèdent donc aucun diviseur irréductible unitaire commun ; cela entraîne qu’ils sont
premiers entre eux.
On peut donc écrire une identité de Bézout : il existe des polynômes S1 , . . . , Sk de
K[X], tels que
1 = S1 T1 + S2 T2 + · · · + Sk Tk .
P P
Multiplions cette identité par = ; on obtient :
Q λQ1 Q2 · · · Qαk k
α1 α2
P T1 T2 Tk P S1 λT1 P S2 λT2 P Sk λTk

= P S1 + P S2 + · · · + P Sk = + + ··· + ,
Q Q Q Q λ Q λ Q λ Q
donc
P P S1 1 P S2 1 P Sk 1
= α1 + α2 + · · · + .
Q λ Q1 λ Q2 λ Qαk k
En notant B1 , . . . , Bk les divers numérateurs qui interviennent dans la dernière formule,
on a donc réussi à écrire :
P B1 B2 Bk
= α1 + α2 + · · · + αk .
Q Q1 Q2 Qk
On va alors manipuler successivement chacun des termes de cette addition. Fixons un
Bi
i avec 1 6 i 6 k et travaillons l’expression αi .
Qi
On commence par faire la division euclidienne de Bi par Qi , en notant judicieuse-
ment le quotient et le reste :
Bi = Bi,αi Qi + Ai,αi avec deg Ai,αi < deg Qi .
23
En reportant cette division euclidienne en lieu et place de Bi on a réécrit :

Bi Bi,αi Ai,αi
αi = αi −1 + .
Qi Qi Qαi i
On recommence une division euclidienne, cette fois-ci de Bi,αi par Qi , en notant toujours
opportunément quotient et reste :
Bi,αi = Bi,αi −1 Qi + Ai,αi −1 avec deg Ai,αi −1 < deg Qi

Bi
et on reporte de nouveau dans l’expression la plus fraîche de ; on obtient :
Qαi i
Bi Bi,αi −1 Ai,αi −1 Ai,αi
αi = + αi −1 + αi .
Qi Qαi i −2 Qi Qi
On recommence jusqu’à ne plus pouvoir recommencer, ce qui donne finalement une
expression :
Bi Ai,1 Ai,α −1 Ai,α
αi = Bi,1 + + · · · + αii−1 + αii .
Qi Qi Qi Qi
Il n’y a plus qu’à regrouper toutes ces expressions et à noter
R = B1,1 + B2,1 + · · · + Bk,1
pour avoir terminé la preuve d’existence.

Preuve de l’unicité
On l’écrira (peut-être) une prochaine fois, elle n’est pas spécialement amusante.
Contrairement à la preuve d’existence, il n’y a guère d’idées, seulement des décomptes
de degrés.
Pour comprendre cette décomposition, le mieux est d’examiner sa forme sur un cas
particulier, rassemblant les différentes situations. Voici deux polynômes P et Q dans
R[X] avec Q non nul, qui définissent donc une fraction rationnelle P/Q dans R(X), et
la décomposition de P/Q dans R(X). On choisit
P = X 13 , Q = (X − 1)3 (X − 2)2 (X − 3)(X 2 + 1)2 (X 2 + X + 1).
Alors,
P C D E F G
= A + BX + + + + + +
Q X − 1 (X − 1)2 (X − 1)3 X − 2 (X − 2)2
H IX + J KX + L MX + N
+ + 2 + + 2 ,
X −3 X +1 2
(X + 1) 2 X +X +1
où les lettres de A jusqu’à M désignent des réels à déterminer. La théorie assure que
ces réels existent et sont uniques. Il suffirait donc de réduire tous les éléments simples
24
au même dénominateur, et d’identifier les numérateurs pour obtenir autant d’équations

que d’inconnues (14 dans notre cas). Ce n’est pas ainsi qu’on procède en pratique. On
utilise plusieurs techniques de manière à déterminer le plus de coefficients possibles par
des équations simples. Voici ces techniques.
Pour la partie polynomiale
Celle-ci est non nulle seulement dans le cas où le degré du numérateur est supérieur ou
égal au degré du dénominateur. Dans ce cas le polynôme cherché, que l’on appelle la
partie entière, est le quotient D de la division euclidienne de P par Q :
P = DQ + R ,
où le reste R est de degré strictement inférieur au degré de Q. Dans notre exemple,
D = X + 9. Il faut s’assurer auparavant que la fraction est bien irréductible, et la
simplifier éventuellement si elle ne l’était pas.
Pour les termes en (X − a)α
Si on multiplie les deux membres de la décomposition par (X −a)α , la racine a disparaît.
On peut donc remplacer X par a, ce qui annule tous les termes de la décomposition
sauf un. Il reste à gauche une certaine valeur, que l’on calcule en général facilement.
Dans notre exemple, si on multiplie les deux membres par (X − 1)3 , et qu’on remplace
X par 1, on trouve :
113
=E,
(1 − 2)2 (1 − 3)(12 + 1)2 (12 + 1 + 1)
1
soit E = − 24 .
Pour les termes en (aX 2 + bX + c)β
On procède de même, en remplaçant X par une des racines complexes du trinôme.
Dans notre cas, on multiplie les deux membres par (X 2 + 1)2 , et on remplace X par i.
On trouve :
i13
= Ki + L .
(i − 1)3 (i − 2)2 (i − 3)(i2 + i + 1)
1 1
On identifie alors la partie réelle et la partie imaginaire : K = − 100 et L = − 50 .
Pour les autres termes
Il faut chercher les équations les plus simples possibles, en prenant des valeurs particu-
lières pour X, qui ne soient pas des racines du dénominateur (X = 0, X = ±1, etc. . . ).
On peut aussi penser à faire tendre X vers l’infini. On n’a recours à une réduction au
même dénominateur avec identification des coefficients qu’en dernier ressort.
Voici un exemple plus simple, sur lequel nous allons détailler tous les calculs. Il
s’agit de décomposer en éléments simples la fraction rationnelle
P X6 + 1
= .
Q (X − 1)(X 2 + X + 1)2
25
Le numérateur et le dénominateur sont premiers entre eux, la fraction est bien irréduc-
tible. Sa décomposition en éléments simples dans R(X) a la forme suivante.
P C DX + E FX + G
= A + BX + + + ,
Q (X − 1) (X + X + 1) (X + X + 1)2
2 2
où les lettres de A jusqu’à G désignent des réels à déterminer. La division euclidienne

du numérateur par le dénominateur donne :

6 2 2
X + 1 = (X − 1) (X − 1)(X + X + 1) + 2X 3 .
Donc A = 1, B = −1, et :
P 2X 3
=X −1+ .
Q (X − 1)(X 2 + X + 1)2
On peut désormais ne travailler que sur la partie restante, à savoir :
2X 3 C DX + E FX + G
= + + .
(X − 1)(X + X + 1)
2 2 (X − 1) (X + X + 1) (X + X + 1)2
2 2
On multiplie les deux membres par (X − 1), et on remplace X par 1. On trouve C = 92 .

2
On multiplie√ ensuite les deux membres par (X √
+ X + 1)2 , et on remplace X par
j = − 12 + i 23 . On trouve F j + G = −1 −√
i 33 . En√ identifiant les parties réelles et
imaginaires, on trouve − 12 F + G = −1 et 23 F = − 33 . La solution de ce système de
deux équations à deux inconnues est F = − 23 et G = − 43 .
On peut ensuite remplacer X par i, et identifier partie réelle et partie imaginaire. On
trouve D = − 29 et E = 149
.
Une fois tout cela fait, il est bon de vérifier les calculs, en utilisant une ou plusieurs
valeurs particulières. Ainsi,
– pour X = 0, 0 = −C + E + G,
– pour X = −1, −1 = −A + B + −2 C
+ −D+E1
+ −F1+G ,
– après avoir enlevé la partie entière, si on multiplie les deux membres par X et
qu’on fait tendre X vers +∞ : 0 = C + D.
Voici donc la décomposition dans R(X).
2
P 9
− 92 X + 14
9
− 32 X − 43
=X −1+ + +
Q (X − 1) (X 2 + X + 1) (X 2 + X + 1)2
√
La décomposition dans C(X) a une forme différente. Nous notons encore j = − 21 + i 2
3
,
de sorte que j et j sont les deux racines de X 2 + X + 1.
P C D E F G
= AX + B + + + + + ,
Q X − 1 X − j (X − j) 2 X − j (X − j)2
26
A priori, les lettres de A jusqu’à G désignent des nombres complexes, mais le fait que
la fraction initiale ait tous ses coefficients réels simplifie quelque peu le problème : la
décomposition ne doit pas changer si on prend le conjugué des deux membres. L’unicité
de cette décomposition entraîne :
A=A, B=B, C=C, D=F , E=G,
Les techniques de décomposition utilisées dans R(X) restent valables. On trouve donc
encore :
2
A = 1 , B = −1 , C = .
9
Nous laissons au lecteur le plaisir de calculer les autres coefficients. La décomposition
dans C(X) est la suivante :
√ √ √ √
2
P − 1 − i 33 1
+ i 93 − 19 + i 33 1
− i 93
=X −1+ 9 + 9 + 3 + + 3
.
Q X −1 X −j (X − j)2 X −j (X − j)2
27
2 Entraînement
2.1 Vrai ou Faux
Vrai-Faux 1. Soit P ∈ R[X] un polynôme non nul à coefficients réels, et d un en-
tier. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et
pourquoi ?
1. Si le degré de P est d, alors le degré de P 0 est d − 1.
2. Si le degré de P est d, alors celui de P (X 2 ) est 2d.
3. Si le degré de P est d, alors celui de X 2 P (X + 2) est d + 2.
4. Si le degré de P est 2, alors celui de X 2 + P est 2.
5. Si le degré de P est 4, alors celui de X 2 + P est 4.
Vrai-Faux 2. Soient P, Q ∈ R[X] deux polynômes non nuls à coefficients réels. Parmi
les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et pourquoi ?
1. Le degré de P + Q est toujorus la somme des degrés de P et de Q
2. Le degré de P + Q est toujours égal soit au degré de P soit au degré de Q
3. Le degré de P Q est la somme des degrés de P et de Q.
4. Le degré de P Q0 est toujours égal au degré de QP 0
5. Le degré de P (X 2 )Q(X 2 ) est le double de la somme des degrés de P et de Q.
Vrai-Faux 3. Soit P ∈ R[X] un polynôme à coefficients réels. Parmi les affirmations
suivantes, lesquelles sont vraies, lesquelles sont fausses, et pourquoi ?
1. Si P est divisible par X 2 − X alors P (1) = 0.
2. Si P est divisible par X 2 − X alors P 0 (0) = 0.
3. Si P est divisible par (X − 1)2 alors P 0 (1) = 0.
4. Si P (1) = P 0 (1) = 0 alors P est divisible par (X − 1)2 .
5. Si P 0 (1) = 0 alors P est divisible par (X − 1).
6. Si P est irréductible alors P ne s’annule pas sur R.
7. Si P est irréductible alors P 0 est de degré 0 ou 1.
8. Si P ne s’annule pas sur R, alors P est irréductible.
Vrai-Faux 4. Soient P et Q deux polynômes non nuls à coefficients réels. Parmi les
affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et pourquoi ?
1. Si P est premier avec Q, alors P est premier avec P + Q.
2. Si P ne divise pas Q, alors P ne divise pas Q2 .
3. Si P ne divise pas Q2 , alors P est premier avec Q.
4. Si P est premier avec Q, alors P 2 est premier avec Q2 .
28
5. Si P 2 − Q2 = 1, alors P est premier avec Q.

1. Le reste de la division euclidienne de P par X − 1 est P (1).
2. Le reste de la division euclidienne de P par (X − 1)2 est P 0 (1).
3. Le reste de la division euclidienne de P par (X − 1)2 est P 0 (1)(X − 1) + P (1).
4. Si les restes des divisions euclidiennes de P par X et X − 1 sont nuls, alors P
est divisible par X 2 − X.
5. Si les restes des divisions euclidiennes de P par X 2 et (X − 1)2 sont égaux,
alors P est divisible par X 2 − X.
6. Si les restes des divisions euclidiennes de P par X 2 et (X − 1)2 sont égaux à
R, alors P − R est divisible par (X 2 − X)2 .

1. Si le degré de P est impair, alors P possède au moins une racine réelle.
2. Si le degré de P est pair, alors P ne possède aucune racine réelle.
3. Si P est de degré d, alors P a d racines complexes distinctes.
4. Si P n’est pas constant et divise X 24 − 1 alors toutes les racines de P sont
distinctes.
5. Si P n’est pas premier avec X 24 −1 alors toutes les racines de P sont distinctes.
6. Si P n’est pas premier avec X 24 − 1 alors au moins une racine de P est de
module 1.
7. Si P et P 0 sont premiers entre eux, alors les racines de P sont distinctes.
1. X 2 + 4 est irréductible dans R[X]
2. X 2 + 4 est irréductible dans C[X]
3. X 2 − 4 est irréductible dans Q[X]
4. X 2 − 2 est irréductible dans Q[X]
5. X 2 − 2 est irréductible dans R[X]
6. X 2 + 1 est irréductible dans R[X]
7. X 2 + 1 est irréductible dans Z/2Z[X]
29
Vrai-Faux 8. On considère la fraction rationnelle suivante.

P X4
= 4 .
Q X −1
Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et pour-
quoi ?
1. Les décompositions en éléments simples de P/Q dans R(X) et C(X) sont
identiques.
2. La partie entière de la décomposition en éléments simples de P/Q dans C(X)
est 1.
3. Une décomposition en éléments simples de P/Q dans R(X) est
P 1 X2 1 X2
= + .
Q 2 X2 − 1 2 X2 − 1
4. Dans la décomposition en éléments simples de P/Q dans R(x), on trouve un

élément simple du type a/(X 2 + 1), où a est un réel.
5. Les décompositions en éléments simples de P/Q dans C(x) et dans R(X)
contiennent l’élément (1/4)/(X − 1).
6. Dans la décomposition en éléments simples de P/Q dans C(x), on trouve un
élément simple du type a/(X − i), où a est un réel.
7. Dans la décomposition en éléments simples de P/Q dans C(x), on trouve deux
éléments simples du type a/(X − i) et b/(X + i), où a et b sont deux complexes
conjugués.
2.2 Exercices
Exercice 3. On considère les couples de polynômes (P, Q) suivants dans R[X].
• P = X, Q = X − 1
• P = X, Q = X 2 − 1
• P = X 2, Q = X 2 − 1
• P = X 2 − 1, Q = X 2 + X + 1
• P = X 2 − 2X + 1, Q = X 2 + X + 1
• P = X 2 − 1, Q = X 3 − 1
• P = X 3 − X 2 + 2X − 2, Q = X 3 − 1
1. Écrire les polynômes P 0 et Q0 .
2. Calculer le polynôme P Q.
3. Calculer les polynômes P 0 Q et P Q0 .
4. Vérifier la formule (P Q)0 = P 0 Q + P Q0
30
5. Calculer les polynômes P ◦ Q et Q ◦ P .

6. Vérifier les formules
(P ◦ Q)0 = Q0 (P 0 ◦ Q) et (Q ◦ P )0 = P 0 (Q0 ◦ P )
Exercice 4.
1. Déterminer l’ensemble des polynômes P de R[X], de degrés au plus 2, tels que
P (X + 1)P (X) = −P (X 2 )
2. Déterminer l’ensemble des polynômes P de R[X] tels que
P (2X) = P 0 P 00
P (X 2 ) = (X 2 + 1)P (X)
X(X + 1)P 00 + (X + 2)P 0 − P = 0
5. Déterminer l’ensemble des polynômes P de C[X] tels que
18P = P 0 P 00
6. Montrer que pour tout n ∈ N, il existe un polynôme unique Pn de R[X] tel que
Pn − Pn0 = X n
et calculer Pn .
Exercice 5. On pose C0 = 1, C1 = X et pour n > 2, on définit le n-ième polynôme de
Chebyshev Cn par la relation de récurrence :
Cn = 2XCn−1 − Cn−2 .
1. Calculer C2 , C3 et C4 .
2. Montrer que pour tout n ∈ N, le polynôme Cn est de degré n et calculer son
coefficient dominant.
3. Montrer que pour tout n ∈ N, et pour tout θ ∈ R, cos(nθ) = Cn (cos(θ)).
4. En déduire les racines de Cn .
5. Montrer que pour tout n ∈ N,
(1 − X 2 )Cn00 − XCn0 + n2 Cn = 0 .
31
Exercice 6. Soit n un entier strictement positif.

1. Montrer que pour tout polynôme P de Rn [X], il existe un unique polynôme Q
de Rn [X] tel que
P (X)P (−X) = Q(X 2 )
Dans toute la suite, on note φ l’application de Rn [X] dans lui-même qui à un
polynôme P associe le polynôme Q tel que P (X)P (−X) = Q(X 2 ).
2. Calculer φ(1), φ(X), φ(X + 1), φ(X − 1), φ(X 2 − 1), φ(X 2 + 2X + 1).
3. Démontrer que
∀P1 , P2 ∈ Rn [X] , φ(P1 P2 ) = φ(P1 )φ(P2 )
4. Trouver deux polynômes P1 et P2 tels que φ(P1 + P2 ) 6= φ(P1 ) + φ(P2 ).

Exercice 7. Soit n un entier strictement positif. On se place dans l’anneau des poly-
nômes à coefficients réels R[X].
1. Montrer que X − 1 divise X n − 1.
2. Montrer X 2 + 2X divise (X + 1)2n − 1.
3. Montrer que X 2 divise (X + 1)n − nX − 1.
4. Montrer que (X − 1)2 divise X n − nX + n − 1.
5. Montrer que (X − 1)2 divise nX n+1 − (n + 1)X n + 1.
6. Montrer que (X − 1)2 divise
n−1
!2
k
− n2 X n−1
X
X
k=0
7. Montrer que (X − 1)3 divise nX n+2 − (n + 2)X n+1 (n + 2)X − n

8. Soit P un polynôme quelconque. Montrer que si X − 1 divise P (X n ) alors
2n−1
X k divise P (X 2n )
X
k=0
Exercice 8. On se place dans l’anneau de polynômes Z/2Z[X].

1. Ecrire tous les polynômes de degrés inférieurs ou égaux à 2.
2. Parmi tous les polynômes de degrés inférieurs ou égaux à 2, lesquels sont irré-
ductibles ?
3. Pour chacun des polynômes de degrés inférieurs ou égaux à 2, écrire sa valeur en
cl(0) et cl(1).
4. Soit P un polynôme de Z/2Z[X]. Montrer que l’application associée à P est
l’application nulle, si et seulement si P est divisible par X 2 + X.
32
5. Montrer que l’application associée à P est l’application identique, si et seulement

si la division euclidienne de P par X 2 + X a pour reste X.
6. Si P est de degré au moins 2 et irréductible, montrer que l’application associée à
P est l’application constante égale à cl(1).
Exercice 9. Dans R[X], effectuer la division euclidienne de P par Q pour les couples
(P, Q) suivants.
1. P = X 2 − 1, Q = X − 1
2. P = X 3 − 1, Q = X 2 + 1
3. P = X 4 − 1, Q = X 2 + 1
4. P = X 4 − 2X 2 + 1, Q = X 2 − 2X + 1
5. P = X 4 − X 3 + X − 2, Q = X 2 − 2X + 4
6. P = X 4 + 2X 3 − X + 6, Q = X 3 − 6X 2 + X + 4
7. P = 3X 5 + 4X 2 + 1, Q = X 2 + 2X + 3
8. P = 3X 5 + 2X 4 − X 2 + 1, Q = X 3 + X + 2
9. P = X 5 − X 4 + 2X 3 + X 2 + 4, Q = X 2 − 1
10. P = X 6 − 3X 4 + 3X 2 − 1, Q = X 2 − X
11. P = X 6 − X 5 + X 2 − 1, Q = X 3 − X
12. P = X 6 − 2X 4 + X 3 + 1, Q = X 3 + X 2 + 1
• P = X − 1, Q = X
• P = X − 1, Q = X − 2
• P = X 3 − 2, Q = X 2 − 1
• P = X 3 − 1, Q = X 2 + 1
• P = X 3 + 1, Q = X 2 + X + 1
• P = X 4 − 1, Q = X 2 − 4
1. Effectuer la division euclidienne de P par Q.
2. Vérifier, en utilisant l’algorithme d’Euclide, que P et Q sont premiers entre eux.
3. Déterminer l’ensemble des couples de polynômes (S, T ) tels que SP + T Q = 1.
Exercice 11. Soient A et B deux polynômes de R[X], Q et R le quotient et le reste de
la division euclidienne de A par B. Soit P un polynôme de degré au moins égal à 1.
Démontrer que le quotient de la division euclidienne de A ◦ P par B ◦ P est Q ◦ P et
que le reste est R ◦ P .
Exercice 12. Soit (Pn )n∈N la suite de polynômes définie par P0 = 1, P1 = X et pour
tout n ∈ N :
Pn+2 = XPn+1 − Pn .
33
1. Calculer P2 et P3 .
2. Montrer que pour tout n ∈ N, Pn est de degré n.
3. Montrer que Pn est un polynôme pair si n est pair, impair si n est impair.
4. Montrer que pour tout n ∈ N :
2
Pn+1 − Pn Pn+2 = 1.
5. En déduire que pour tout n ∈ N, les polynômes Pn et Pn+1 sont premiers entre
eux.
• P = X 4 − 1, Q = X 2 − 1
• P = X 6 − 1, Q = X 4 − 1
• P = X 3 + 1, Q = X 2 − 1
• P = X 3 − 2X 2 − X + 2, Q = X 3 − 6X 2 + 11X − 6
• P = X 3 − X 2 − X − 2, Q = X 3 − 1
• P = X 4 + X 3 − 2X + 1, Q = X 3 + X + 1
• P = X 4 + X 3 − 3X 2 − 4X − 1, Q = X 3 + X 2 − X − 1
• P = X 4 + X 3 + 2X 2 + X + 1, Q = X 4 − 1
• P = X 3 − X 2 − X − 2, Q = X 5 − 2X 4 + X 2 − X − 2
• P = X 5 + 5X 4 + 9X 3 + 7X 2 + 5X + 3, Q = X 4 − 2X 3 + 2X 2 + X + 1
1. Utiliser l’algorithme d’Euclide pour calculer pgcd(P, Q).
2. Decomposer P et Q en facteurs irréductibles.
3. En déduire la décomposition en facteurs irréductibles de pgcd(P, Q) et retrouver
le résultat de la première question.
Exercice 14. On considère les triplets de polynômes de R[X] suivants.

• A = X 2 − X, B = X 2 − X, C = X 2 − 1
• A = (X + 3)2 (X + 1)(X 2 + 1)3 , B = (X + 3)2 (X + 2)2 (X 2 + 1), C = (X + 3)(X +
2)(X 2 + 1)2
• A = X 2 + 3X + 2, B = X 3 + 2X 2 + X + 2, C = X 5 + 4X 4 + 6X 3 + 6X 2 + 5X + 2
Pour chacun de ces triplets :
1. Calculer pgcd(A, B), pgcd(A, C) et pgcd(B, C).
2. Calculer pgcd(A, B, C).
Exercice 15. Soient a et b deux nombres complexes distincts. Soit P ∈ C[X] un poly-
nôme.
1. Montrer que si P est divisible par X − a et par X − b, alors P est divisible par
(X − a)(X − b).
34
2. On suppose que les restes des divisions euclidiennes de P par X − a et par X − b

sont tous les deux égaux à 1. Montrer que le reste de la division euclidienne de
P par (X − a)(X − b) est 1.
3. On suppose que les restes des divisions euclidiennes de P par X − 1 et X + 5
sont respectivement 7 et 3. Quel est le reste de la division euclidienne de P par
X 2 + 4X − 5 ?
Exercice 16. Ecrire la décomposition en facteurs irréductibles des polynômes suivants,
dans R[X] et dans C[X].
1. X 4 − 1
2. X 6 + 1
3. X 8 + X 4 + 1
4. (X 2 + X + 1)2 − 1
5. X 3 − 5X 2 + 3X + 9
6. (X 2 − X + 2)2 + (X − 2)2
7. 6X 5 + 15X 4 + 20X 3 + 15X 2 + 6X + 1
8. X 5 − 7X 3 − 2X 2 + 12X + 8
Exercice 17. Soit P ∈ C[X] un polynôme à coefficients complexes et a un complexe. En
utilisant la formule de Taylor, calculer le quotient et le reste de la division euclidienne
de P par X − a, puis par (X − a)2 .
Exercice 18. Ecrire la formule de Taylor pour les polynômes suivants, en a = 1, puis
a = −1.
1. X 4 − 1
2. X 6 + 1
3. X 8 + X 4 + 1
4. (X 2 + X + 1)2 + 1
5. X 3 − 5X 2 + 3X + 9
6. (X 2 − X + 2)2 + (X − 2)2
7. 6X 5 + 15X 4 + 20X 3 + 15X 2 + 6X + 1
8. X 5 − 7X 3 − 2X 2 + 12X + 8
Exercice 19. Décomposer les fractions rationnelles suivantes, dans R(X) :
1 X X 3 − 2X + 1
; ; ;
X(X − 1) X −1
2 X2 − 1
X(X 2 + 1)2 X3 + 1 X5 + 1
; ; ;
(X 2 − 1)2 (X − 2)4 (X 2 + 1)3
35
X2 + 1 X3 − 2 X 3 − 2X + 1
; ; ;
(X − 2)(X − 1) X2 − 4 X3 − X
X X X4
; ; ;
(X − 1)(X − 2)
2 (X − 1)2 (X − 2) (X − 1)2 (X − 2)
2X 2 + 5 X5 + 1 X8 − X4 + 2
; ; ;
(X 2 − 1)3 X 3 (X − 2) (X 2 + X + 1)3
X3 + X X 6 − X 5 + 2X 4 + X 2 + 1
; ;
(X − 1)(X 6 + 1) X 3 (X 2 + 1)2
X 5 + 6X 4 + 17X 3 + 25X 2 + 19X + 7
.
(X + 1)2 (X 2 + X + 1)2
Exercice 20. Décomposer les fractions rationnelles suivantes, dans C(X) puis dans
R(X) :
1 X4 + 1 X
3
; 3
; ;
X +X X +X (X + 1)(X 2 + 4)
2
X3 + 1 X5 − 1 X2 + 1
; ; ;
X2 + 1 X4 − 1 X4 + 1
X −1 X −1 X2 − 1
; ; ;
X3 − 1 X3 + X (X 2 + 1)2
X X2 + 1 X2 + X + 1
; ; ;
X4 + 1 X4 + 1 X4 − 1
X3 X X2 − 1
; ; .
X4 + 1 (X − 1) (X 2 + 1)2
2 X6 − 1
2.3 QCM
rapporte 2 points.
Question 1. Soit P ∈ R[X] un polynôme à coefficients réels, et d un entier naturel non

nul.
A Si le degré de P est d, alors le degré de P − X d est strictement inférieur à d.
B Si le degré de P est d, alors le degré de P 0 est d − 1.
C Si le degré de P est d, alors le degré de P (X − 1) est d − 1.
D Si le degré de P est d, alors le degré de P 0 (X − 1) est d − 1.
E Si le degré de P est d, alors le degré de (X + 2)P (X + 2) est d + 2.
36
Question 2. Soient P un polynôme non nul à coefficients réels.

A Le degré de P ((X + 2)2 ) est le double du degré de P .
B Le degré de (X + 2)P ((X + 2)2 ) est toujours supérieur ou égal à 2.
C Le degré de P 0 ((X + 2)2 ) est soit un entier pair, soit −∞.
D Le degré de (X + 2)2 P 0 ((X + 2)2 ) est toujours supérieur ou égal à 2.
E Le degré de (X + 2)2 P 0 ((X + 2)2 ) est toujours le double du degré de P .
Question 3. Soient P et Q deux polynômes non nuls, à coefficients réels.

A Les polynômes P (Q) et Q(P ) ont toujours le même degré.
B Les polynômes P Q et P (Q) ont toujours le même degré.
C Si le polynôme Q est constant, alors les polynômes P Q et P (Q) ont le même
degré.
D Si les polynômes P + Q et P Q ont le même degré, alors au moins un des deux
polynômes P et Q est constant.
E Si les polynômes P Q et P (Q) ont le même degré, alors les deux polynômes P
et Q sont constants.
Question 4. Soit P ∈ R[X] un polynôme non nul à coefficients réels.

A Si 2 est racine de P , alors 0 est racine de P (X) − 2.
B Si 2 est racine double de P , alors P 0 est divisible par (X − 2).
C Si P 0 est divisible par (X − 2) alors 2 est racine double de P .
D Si 2 est racine double de P 0 , alors P est divisible par (X − 2)3 .
E Si 2 est racine double de P et de P 0 , alors P est divisible par (X − 2)3 .
Question 5. Soient P et Q deux polynômes non nuls à coefficients réels.

A Si P divise Q alors P + Q divise Q2 .
B Si P divise Q, alors P 0 divise Q0 .
C Si P divise Q, alors P 2 divise Q2 .
D Si P divise Q, alors P (X 2 ) divise Q(X 2 ).
E Si P divise Q, alors P divise Q(P ).
Question 6. Soit P un polynôme non nul à coefficients réels.

A Le reste de la division euclidienne de P par (X − 2) est P (2).
B Si P (2) = P 0 (2), alors les restes des divisions euclidiennes de P et P 0 par (X −2)
sont égaux.
C Le reste de la division euclidienne de P par (X − 2)2 est P 0 (2)(X − 2).
D Si le reste de la division euclidienne de P 0 par (X − 2) est nul, alors 2 est racine
double de P .
E Si le reste de la division euclidienne de P par (X − 2)2 est (X − 2), alors 2 est
racine double de P 0 .
Question 7. Soient P et Q deux polynômes non nuls à coefficients réels.
37
A Si P est premier avec Q, alors le reste de la division euclidienne de P par Q est

1.
B Si P est premier avec Q, alors P est premier avec (X + 2)P + 2Q.
C Si P est premier avec Q, alors P 0 est premier avec Q0 .
D Si P est premier avec Q, alors P + Q est premier avec P 2 − Q2 .
E Si P est premier avec Q, alors P est premier avec P 2 + 2Q2 .
Question 8. Soit P ∈ R[X] un polynôme à coefficients réels.
A Si le degré de P est pair, alors P 0 possède au moins une racine réelle.
B Si P est de degré 3, alors P 0 est irréductible dans R[X].
C Si P divise (X 5 − 1), alors P 0 admet au moins une racine réelle.
D Si un nombre complexe z de partie imaginaire non nulle est racine de P , alors
P est divisible par le polynôme (X 2 − 2Re(z)X + |z|2 ).
E Si P divise (X 5 − 1)2 , alors P 0 est premier avec P .
Question 9.
A Le polynôme (X 4 + 4) est réductible dans Q[X]
B Le polynôme (X 4 + 4) est irréductible dans R[X]
C Le polynôme (X 4 + 4) est irréductible dans Z/5Z[X].
D Le polynôme (X 4 + 4) est scindé dans R[X].
E Le polynôme (X 4 + 4) est scindé dans C[X]
Question 10. On considère la fraction rationnelle :
P 2X 2
= 4
Q X −1
A La décomposition de P/Q dans R(X) a un seul élément simple.
B La décomposition de P/Q dans C(X) admet 2 pour partie entière.
C La décomposition de P/Q dans R(X) admet un élément simple proportionnel
à 1/(X + 1)
D La décomposition de P/Q dans R(X) contient les deux éléments simples
1/(X 2 − 1) et 1/(X 2 + 1).
E La décomposition de P/Q dans C(X) contient quatre éléments simples.
Réponses : 1–BD 2–AC 3–AD 4–BE 5–CD 6–AB 7–BE 8–AD 9–AE 10–CE
2.4 Devoir
répondu.
38
1. Étant donné un polynôme P ∈ R[X], rappeler la définition du polynôme dérivé

P 0 . Démontrer que l’application de R[X] dans lui-même, qui à un polynôme P
associe son polynôme dérivé P 0 est linéaire, c’est-à-dire :
∀P, Q ∈ R[X] , ∀λ, µ ∈ R , (λP + µQ)0 = λP 0 + µQ0 .
2. Soit P ∈ R[X] un polynôme à coefficients réels, et n ∈ N∗ un entier strictement

positif. Montrer que :
(X n P )0 = nX n−1 P + X n P 0 .
3. En déduire que pour tout couple de polynômes (P, Q) à coefficients réels,
(P Q)0 = P 0 Q + P Q0 .
4. Soit P ∈ R[X] un polynôme à coefficients réels, et n ∈ N∗ un entier strictement

positif. Montrer que :
(P n )0 = nP 0 P n−1 .
5. Montrer que pour tout couple de polynômes (P, Q) à coefficients réels,
(Q(P ))0 = P 0 Q0 (P ) .
Exercice 1 : Soit n un entier. On considère le polynôme Wn = (X 2 − 1)n . Le n-ième

polynôme de Legendre Ln est proportionnel à la dérivée n-ième de Wn :
1
Ln = W (n) .
2n n! n
NB : On admettra la formule de Leibniz, qui généralise la formule donnant la dérivée
d’un produit. Soient P et Q deux polynômes et n un entier, alors :
n
!
(n)
X n (k) (n−k)
(P Q) = P Q .
k=0 k
1. Calculer L1 , L2 et L3 .
2. Quel est le degré de Wn ? Quel est son coefficient dominant ? Quel est le degré de
Ln ? Quel est son coefficient dominant ?
3. Pour tout n ∈ N, démontrer que (X 2 − 1)Wn0 = 2nXWn . En prenant la dérivée
(n + 1)-ième des deux membres, en déduire que :
(X 2 − 1)L00n + 2XL0n − n(n + 1)Ln = 0 .
4. En prenant la dérivée (n + 1)-ième du produit (X 2 − 1)(X 2 − 1)n−1 , montrer que

pour tout n > 1,
(n+1) (n) (n−1)
Wn(n+1) = (X 2 − 1)Wn−1 + 2X(n + 1)Wn−1 + n(n + 1)Wn−1 .
39
5. En utilisant les deux questions précédentes, montrer que pour tout n > 1 :
L0n = XL0n−1 + nLn−1 .
Exercice 2 :
1. En utilisant l’identité (X 3 − 1) = (X − 1)(X 2 + X + 1), démontrer que les
polynômes X 3 + 1 et X 2 + X + 1 sont premiers entre eux.
2. Effectuer la division euclidienne de X 3 + 1 par X 2 + X + 1.
3. Déterminer l’ensemble des couples de polynômes (U, V ) tels que :
(X 3 + 1)U + (X 2 + X + 1)V = 1 .
4. Déterminer une décomposition en facteurs irréductibles dans R[X] des polynômes

X 5 − X 3 + X 2 − 1 et X 3 − 1. En déduire leur pgcd et leur ppcm.
5. Retrouver le pgcd de X 5 − X 3 + X 2 − 1 et X 3 − 1 en utilisant l’algorithme
d’Euclide.
Exercice 3 : Le but de l’exercice est de calculer la décomposition en éléments simples
dans R(X) de la fraction rationnelle : (4X 4 )/(X 4 − 1)2 .
1. Décomposer en éléments simples dans R(X), la fraction rationnelle (2X)/(X 2 −
1). En déduire que :
4X 4 1 1 2
= + + 4 .
(X − 1)
4 2 2
(X + 1) 2 (X − 1)
2 2 X −1
2. Décomposer en éléments simples la fraction rationnelle 1/(X 2 − 1). En déduire

la décomposition en éléments simples de la fraction rationnelle 1/(X 2 − 1)2 .
3. Utiliser la décomposition en éléments simples de la fraction rationnelle 1/(X 2 −1)
pour donner la décomposition en éléments simples dans R(X) de la fraction
rationnelle 1/(X 4 − 1).
4. Déduire des questions précédentes la décomposition en éléments simples de la
fraction rationnelle (4X 4 )/(X 4 − 1)2 .
5. Retrouver le résultat de la question précédente en utilisant la méthode présentée
dans le cours.

1. Pour un polynôme P = ad X d + ad−1 X d−1 + · · · + a1 X + a0 non nul dans R[X],
le polynôme dérivé de P est le polynôme noté P 0 :
P 0 = dad X d−1 + (d − 1)ad−1 X d−2 + · · · + a1 .
40
Si P = 0, le polynôme dérivé de P est le polynôme nul.

Soient
P = ad X d +ad−1 X d−1 +· · ·+a1 X +a0 et Q = bh X h +bh−1 X h−1 +· · ·+b1 X +b0
deux polynômes à coefficients réels. Soient λ et µ deux réels. Sans perte de gé-
néralité, supposons h 6 d. Quitte à poser bh+1 = · · · = bd = 0, nous pouvons
écrire :
λP + µQ = (λad + µbd )X d + · · · + (λa0 + µb0 ) .
Le polynôme dérivé est :
(λP + µQ)0 = (λad + µbd )dX d−1 + · · · + (λa1 + µb1 ) .
Il est bien égal à :
λP 0 + µQ0 = λ(ad dX d−1 + · · · + a1 ) + µ(bd dX d−1 + · · · + b1 ) .
2. Posons P = ad X d + · · · + a0 : alors X n P = ad X n+d + · · · + a0 X n . Par définition,

le polynôme dérivé de X n P est :
d
(X n P )0 = ad (n + d)X n+d−1 + · · · + a0 nX n−1 = ak (n + k)X n+k−1 .
X
k=0
Or :
d d
! !
n−1 n 0 n−1 k n h−1
X X
nX P +X P = nX ak X +X hah X
k=0 h=1
d
(n + k)ak X n+k−1 .
X
=
k=0
3. Nous allons démontrer la formule par récurrence sur le degré de Q. Elle est vraie
si Q est nul ou de degré 0, puisque dans ce cas Q0 = 0 et la dérivation est linéaire
d’après la question 2. Supposons que la formule est vraie pour tout polynôme de
degré inférieur ou égal à n − 1 et soit Q un polynôme de degré n. Nous pouvons
écrire Q = bn X n + Q1 , où Q1 est un polynôme de degré inférieur ou égal à n − 1.
Écrivons :
0
(P Q)0 = (bn X n + Q1 )P
= (bn X n P + P Q1 )0
= bn (X n P )0 + (P Q1 )0 (question 1)
= bn (nX n−1 P + Xn P 0 ) + (P Q1 )0 (question 2)
n−1 0 0 0
= bn (nX P + Xn P ) + P Q1 + P Q1 (hypothèse de récurrence)
= P Q0 + QP 0 .
41
4. C’est une autre démonstration par récurrence. La formule est vraie pour n = 0,
puisque P 0 est le polynôme constant égal à 1, dont la dérivée est nulle. Supposons-
la vraie pour n > 1.
(P n+1 )0 = (P P n )0
= P (P n )0 + P 0 P n (question 3)
0 n−1 0 n
= P (nP P ) + P P (hypothèse de récurrence)
= (n + 1)P 0 P n .
La formule est vraie pour n + 1, donc pour tout n.
5. Posons Q = bn X n + · · · + b0 . Le polynôme composé Q(P ) est :
n
bk P k .
X
Q(P ) =
k=0
D’après la linéarité de la dérivation (question 1) :

n
(Q(P ))0 = bk (P k )0 .
X
k=0
En utilisant le résultat de la question précédente :

n n
(Q(P ))0 = bk kP 0 (P k−1 ) = P 0 kbk P k−1 = P 0 Q0 (P ) .
X X
k=0 k=0
Exercice 1 :
1. On trouve :
3 1 5 3
L1 = X ; L2 = X 2 − ; L3 = X 3 − X .
2 2 2 2
2. Le degré de Wn est 2n, son coefficient dominant est 1. Le degré de Ln est n, son
coefficient dominant est :
!
(2n)(2n − 1) . . . (n + 1) 1 2n
n
= n .
2 n! 2 n
3. En utilisant la formule donnant la dérivée d’un polynôme composé, on obtient

Wn0 = 2nX(X 2 − 1)n−1 , donc (X 2 − 1)Wn0 = 2nXWn .
Prenons la dérivée (n + 1)-ième des deux membres, en utilisant la formule de
Leibniz. Pour le membre de gauche, on obtient :
(X 2 − 1)Wn(n+2) + 2X(n + 1)Wn(n+1) + n(n + 1)Wn(n) .
Pour le membre de droite, la formule de Leibniz donne :
2nXWn(n+1) + 2n(n + 1)Wn(n) .
42
En égalant les deux, et en regroupant les termes, on obtient :
(X 2 − 1)Wn(n+2) + 2XWn(n+1) − n(n + 1)Wn(n) = 0 .
En divisant par 2n n! :
(X 2 − 1)L00n + 2XL0n − n(n + 1)Ln = 0 .
4. En prenant la dérivée (n + 1)-ième du produit (X 2 − 1)(X 2 − 1)n−1 , on obtient

comme dans la question précédente :
(n+1) (n) (n−1)
Wn(n+1) = (X 2 − 1)Wn−1 + 2X(n + 1)Wn−1 + n(n + 1)Wn−1 .
5. En divisant les deux membres par 2n n! :

1 00 (n + 1) 0 n(n + 1)
L0n = (X 2 − 1) Ln−1 + 2X Ln−1 + Ln−1 .
2n 2n 2n
Or d’après la question 3,
(X 2 − 1)L00n−1 + 2XL0n−1 = n(n − 1)Ln−1 .
En reportant ceci dans l’expression précédente :

n(n − 1) n(n + 1)
L0n = Ln−1 + XL0n−1 + Ln−1
2n 2n
= XL0n−1 + nLn−1 .
Exercice 2 :
1. Puisque (X 3 − 1) = (X − 1)(X 2 + X + 1), on peut aussi écrire : (X 3 + 1) − (X −
1)(X 2 + X + 1) = 2. Ceci est une identité de Bézout pour les polynômes X 3 + 1
et X 2 + X + 1 : ils sont donc premiers entre eux.
2.
X3 +1 X2 + X + 1
3 2
X +X +X X −1
−X 2 − X + 1
−X 2 − X − 1
2
On retrouve l’identité de la question précédente : (X 3 + 1) = (X − 1)(X 2 + X +
1) + 2.
3. Soient U et V deux polynômes tels que (X 3 + 1)U + (X 2 + X + 1)V = 1. Puisque
(X 3 + 1)/2 − (X − 1)(X 2 + X + 1)/2 = 1, on a nécessairement :
(X 3 + 1)(U − 1/2) + (X 2 + X + 1)(V + X/2 − 1/2) = 0 .
43
Or (X 3 + 1) et (X 2 + X + 1) sont premiers entre eux. En utilisant le lemme

de Gauss, on déduit que (X 2 + X + 1) divise (U − 1/2) et que (X 2 + 1) divise
(V + X/2 − 1/2) : il existe un polynôme K tel que :
1 1
U= + K(X 2 + X + 1) et V = (−X + 1) − K(X 3 + 1) .
2 2
Réciproquement, si U et V s’écrivent comme ci-dessus, alors :
(X 3 + 1)(U − 1/2) = (X 2 + X + 1)(V + X/2 − 1/2) = K(X 3 + 1)(X 2 + X + 1) .
Donc :
1 1
(X 2 + 1)U + (X 2 + X + 1)V = (X 3 + 1) − (X − 1)(X 2 + X + 1) = 1 .
2 2
L’ensemble des couples (U, V ) tels que (X 3 + 1)U + (X 2 + X + 1)V = 1 est :
1 1

+ K(X 2 + X + 1) , (−X + 1) − K(X 3 + 1) , K ∈ R[X] .
2 2
4. On trouve :
X 5 − X 3 + X 2 − 1 = (X 2 − 1)(X 3 + 1) = (X + 1)2 (X − 1)(X 2 − X + 1) ,
et
X 3 − 1 = (X − 1)(X 2 + X + 1) .
Le pgcd des deux polynômes est (X − 1), leur ppcm est (X + 1)2 (X − 1)(X 2 −
X + 1)(X 2 + X + 1).
5. La division euclidienne des deux polynômes donne :
X 5 − X 3 + X 2 − 1 = (X 2 − 1)(X 3 − 1) + 2X 2 − 2 .
La division euclidienne de X 3 − 1 par X 2 − 1 donne :
X 3 − 1 = X(X 2 − 1) + (X − 1) .
L’algorithme d’Euclide se termine sur : X 2 − 1 = (X + 1)(X − 1) + 0. On retrouve

donc bien le fait que (X − 1) est le pgcd des deux polynômes (toujours défini à
une constante près).
Exercice 3 :
1. On trouve :
2X 1 1
= + .
X −1
2 X +1 X −1
44
En remplaçant X par X 2 , on obtient :
2X 2 1 1
= + .
X4 − 1 X2 + 1 X2 − 1
Il reste à élever les deux membres au carré :
4X 4 1 1 2
= + + .
(X 4 − 1)2 (X 2 + 1)2 (X 2 − 1)2 X 4 − 1
Observons que les deux dernières identités ne sont pas des décompositions en
éléments simples.
2.
1 1
1 2 2
= − .
X2 − 1 X −1 X +1
En élevant au carré, on obtient :
1 1 1
1 4 4 2
= + − .
(X 2 − 1)2 (X − 1)2 (X + 1)2 X 2 − 1
Il reste à réinjecter la décomposition de 1/(X 2 − 1) :

1 1 1 1
1 4 4 4 4
= + + − .
(X 2 − 1)2 (X − 1)2 (X + 1)2 X + 1 X − 1
3. En remplaçant X par X 2 dans la décomposition de 1/(X 2 − 1), on obtient :

1 1
1 2
= 2 − 22 .
X −1
4 X −1 X +1
En utilisant à nouveau la décomposition de 1/(X 2 − 1), on trouve :
1 1 1
1 4 4 2
= − − .
X4 − 1 X − 1 X + 1 X2 + 1
4. Dans l’expression de la question 1, le terme 1/(X 2 + 1)2 est un élément simple.

La décomposition en éléments simples de 1/(X 2 − 1)2 est donnée à la question 2,
celle de 1/(X 4 − 1) à la question 3. En rassemblant le tout on obtient :
1 1 1 1
4X 4 1 1 4 4 4 4
= − + + + − .
(X 4 − 1)2 (X 2 + 1)2 X 2 + 1 (X − 1)2 X − 1 (X + 1)2 X + 1
5. Par la méthode du cours, on écrit la décomposition cherchée sous la forme :
4X 4 AX + B CX + D E F G H
= + + + + + .
(X − 1)
4 2 2
(X + 1) 2 2
X +1 (X − 1)2 X − 1 (X + 1) 2 X +1
45
On simplifie notablement le calcul en observant que la fraction est invariante par

le changement X 7→ −X, et donc sa décomposition vérifie la même propriété.
Ceci entraîne :
A = 0 , C = 0 , G = E , H = −F .
Multiplier par (X − 1)2 et remplacer X par 1 donne E = 1/4. Multiplier par
(X 2 +1)2 et remplacer X par i donne B = 1. Il reste deux coefficients à déterminer,
par exemple en prenant deux valeurs particulières. Pour X = 0 :
1 1
0=1+D+ −F + −F .
4 4
Pour X = 2,
64 1 D 1 1 F
2
= + + +F + − .
15 25 5 4 36 3
La résolution du système de deux équations en D et F donne D = −1, F = 1/4.
46
3 Compléments
3.1 Algorithme de Horner
Au temps jadis, les physiciens et les astronomes devaient faire tous leurs calculs
à la main, et ces calculs pouvaient être très compliqués. Il fallait souvent évaluer des
quantités polynomiales, par exemple 5x4 −4x3 +3x2 −2x+1 pour x = 8. La façon naïve
d’arriver au résultat est de calculer x, x2 , x3 et x4 pour la valeur choisie x = 8, ce qui
représente 3 multiplications, puis 5x4 , 4x3 , 3x2 et 2x, ce qui représente 4 multiplications
supplémentaires. En ajoutant les sommes à la liste des opérations nécessaires, on obtient
en tout 7 multiplications et 4 additions. La tradition attribue au mathématicien anglais
William George Horner (1786-1837) la description en 1819 d’une méthode efficace pour
économiser des opérations, méthode encore utilisée de nos jours par les ordinateurs.
Remplaçons en effet 5x4 − 4x3 + 3x2 − 2x + 1 par l’expression équivalente
x(x(x(x × 5 − 4) + 3) − 2) + 1,
puis calculons successivement a = 5, b = xa − 4, c = xb + 3, d = xc − 2, et enfin

e = xd+1. Alors e est le résultat cherché, obtenu après 4 multiplications et 4 additions.
On économise donc des multiplications, qui sont des opérations longues à réaliser. De
plus, on n’a été obligé de stocker en mémoire (ou dans son cerveau, si on n’est pas en
silicium) que deux valeurs : x et a, puis x et b, puis x et c, etc.
La tradition a retenu cette méthode sous le nom d’algorithme de Horner à cause
de l’article de 1819 cité plus haut. Il se trouve que cet article ne contient pas ladite
méthode ! Horner la décrit bien, mais dans un autre article, publié en 1830 seulement.
Et entre temps, en 1820, un fabricant de montres londonien nommé Theophilus Holdred
avait, lui, effectivement publié la méthode.
Alors, Horner plagiaire ? Quoi qu’il en soit, on sait maintenant que la méthode de
Horner était en fait déjà connue d’Isaac Newton en 1669, et avant lui, du mathématicien
chinois Ch’in Chiu-Shao (ou Chu Shih-Chieh, ou Zhu Shijie, on s’y perd !) au xiiie
siècle. Elle peut être vue comme un cas particulier d’une règle due au mathématicien
italien Paolo Ruffini (1765-1822), règle qui permet de calculer le quotient et le reste de
la division euclidienne d’un polynôme P par un monôme X − a. Signalons enfin que
des versions de cet algorithme permettent aussi d’évaluer des polynômes de matrices,
situation où le gain de temps de calcul réalisé est encore plus important.
3.2 Règle des signes de Descartes

Il s’agit d’une méthode pour estimer le nombre de racines réelles positives d’un
polynôme : on compte le nombre c de changements de signe dans la suite des coeffi-
cients, en ne tenant pas compte des coefficients nuls (voir les exemples plus bas). René
Descartes (1596-1650) énonce dans La Géométrie, traité publié en 1637, que le nombre
de racines positives vaut au plus c. Carl Friedrich Gauss (1777-1855) montrera plus
47
tard, en 1828, que si l’on compte les racines avec leur multiplicité, alors le nombre de
racines positives a la même parité que c, donc que ce nombre vaut c ou c − 2 ou c − 4,
etc.
Donnons un premier exemple : pour P = X 7 + 2X 6 − 3X 5 − X 2 + 7X − 8, on obtient
c = 3 (remarquer les coefficients nuls), donc P possède 1 ou 3 racines positives.
Donnons un autre exemple, qui montre qu’on peut même souvent déterminer le
nombre exact de racines positives et de racines négatives en utilisant la règle des signes
et quelques remarques de bon sens. Soit Q le polynôme Q = X 3 +3X 2 −X −2. Puisque
c = 1, on sait que Q possède exactement 1 racine positive. Les racines négatives de Q
sont les racines positives du polynôme R obtenu en remplaçant X par −X dans Q, soit
R = −X 3 + 3X 2 + X − 2. Pour R, on trouve c = 2 donc Q possède 2 racines négatives
ou bien aucune. On remarque ensuite que Q(−1) = 1 (le calcul de tête est facile en
utilisant l’algorithme de Horner), donc Q(−1) est positif, et que le monôme de plus
haut degré de Q est X 3 donc Q(x) < 0 pour tout x négatif tel que |x| est suffisamment
grand. Ainsi Q possède au moins une racine inférieure à −1, ce qui montre que Q
possède 2 racines négatives. Enfin Q(0) = −2 et Q(−1) = 1 sont de signes contraires
donc Q possède une racine entre −1 et 0. On a localisé les 1 + 2 = 3 racines de Q,
en montrant que chacun des intervalles ] − ∞, −1[, ] − 1, 0[ et ]0, +∞[ en contient
exactement une.
On peut encore préciser les choses en remarquant que Q(1) = −2, donc Q(1) est
négatif, et, grâce à deux derniers petits coups de Horner, que Q(−2) = −2 et Q(2) = 42.
Donc les racines de Q sont en fait dans les intervalles ] − 2, −1[, ] − 1, 0[ et ]1, 2[ et
chacun de ces intervalles en contient exactement une.
3.3 Suites de Sturm

Soit P un polynôme à coefficients réels n’ayant que des racines simples. La suite de
Sturm de ce polynôme est une suite de polynômes qui permet de déterminer le nombre
de racines de P dans un intervalle donné. Elle est définie de la façon suivante : on pose
P0 = P et P1 = P 0 , où P 0 désigne le polynôme dérivé de P . Ensuite, pour calculer P2 ,
on effectue la division euclidienne de P0 par P1 . Le résultat peut s’écrire comme
P0 = P1 Q 1 − P2 ,
où le degré de P2 est strictement inférieur à celui de P1 . En d’autres termes, P2 est
l’opposé du reste dans la division euclidienne de P0 par P1 . Puis on recommence pour
calculer P3 , donc
P1 = P2 Q 2 − P3 ,
et le degré de P3 est strictement inférieur à celui de P2 , etc. On s’arrête lorsqu’on obtient
un polynôme constant Pn , ce qui arrive forcément puisque le degré des polynômes
obtenus diminue à chaque division. La suite de Sturm du polynôme P est alors
S = (P0 , P1 , . . . , Pn ).
48
Ensuite, pour chaque nombre réel x, on note V (x) le nombre de changements de signes
dans la suite S(x) = (P0 (x), P1 (x), . . . , Pn (x)).
Le théorème de Sturm, démontré par Charles Sturm (1803-1855) en 1829, affirme
que le nombre de racines de P dans l’intervalle [a, b] est égal à la différence V (a)−V (b).
Un exemple, un exemple ! Soit P = X 3 + 6X 2 − 16. Sa suite de Sturm est
S = (X 3 + 6X 2 − 16, 3X 2 + 12X, 8X + 16, 12).
En particulier, S(−7) = (−65, 63, −40, 12) et il y a 3 changements de signe dans cette
suite, donc V (−7) = 3. De même, S(2) = (16, 36, 32, 12) et cette fois, il n’y a pas de
changement de signe, donc V (2) = 0. Par conséquent, V (−7) − V (2) = 3 donc les 3
racines de P sont dans l’intervalle [−7, 2]. Étonnant, non ?
3.4 Division suivant les puissances croissantes

Beaucoup moins fondamentale que la division euclidienne, c’est une technique utile
pour produire des algorithmes dans des cadres assez variés.
Proposition 19. Soit K un corps commutatif, A et B deux polynômes de K[X] et

n ≥ 0 un entier fixé. On suppose que B(0) 6= 0.
Alors il existe un couple (Qn , Sn ) unique (de polynômes) vérifiant la double condi-
tion :
A = BQn + X n+1 Sn et deg Qn ≤ n.
Démonstration : La démonstration d’existence n’est pas passionnante (simple descrip-

tion abstraite de l’algorithme de calcul) ; la démonstration d’unicité est plus agréable.
Preuve de l’existence
C’est une récurrence sur l’entier n ≥ 0.
• Pour n = 0, on note a0 = A(0) et b0 = B(0), puis on pose Q0 = a0 /b0 (qui existe
puisque B(0) 6= 0). On constate alors que A − BQ0 est par construction un polynôme
sans terme constant, donc dans lequel X se factorise ; on peut donc mettre A − BQ0
sous la forme XS0 .
• Soit n fixé et supposons le théorème vrai pour tous polynômes et tout i ≤ n ;
montrons le pour les polynômes A et B de l’énoncé et pour l’entier n + 1. Commençons
par effectuer la division suivant les puissances croissantes de A par B à l’ordre n, et
écrivons donc A = BQn +X n+1 Sn (avec deg Qn ≤ n), puis effectuons la division suivant
les puissances croissantes de Sn par B à l’ordre 0 : on obtient une constante k et un
polynôme T tels que Sn = kB + XT . On conclut que A = BQn + kBX n+1 + X n+2 T et
donc qu’on peut prendre Qn+1 = Qn + kX n+1 et Sn+1 = T pour répondre à la question.
Preuve de l’unicité
49
n+1 (1) n+1 (2)

Supposons qu’on ait deux écritures A = BQ(1)n +X Sn et A = BQ(2) n +X Sn
(1) (2)
remplissant les conditions deg Qn ≤ n et deg Qn ≤ n.
n+1
Posons alors Qn = Q(1) (2) (1) (2)
n −Qn et Sn = Sn −Sn de telle sorte que 0 = BQn +X Sn
(obtenue en soustrayant les deux écritures de A) avec en outre la condition deg Qn ≤ n.
Comme on a supposé B(0) 6= 0, X ne figure pas parmi les facteurs irréductibles de B,
donc X n+1 est premier avec B. Mais d’après l’identité BQn = −X n+1 Sn , X n+1 divise
BQn : on en déduit donc que X n+1 divise Qn (lemme de Gauss) ; vu la condition sur
le degré de Qn , ceci entraîne que Qn = 0. Dès lors 0 = X n+1 Sn donc Sn = 0. Les deux
écritures fournies de A étaient donc la même.
La division selon les puissances croissantes s’effectue comme la division euclidienne,
mais à l’envers : on fait disparaître un par un les termes de plus bas degré du dividende,
en multipliant le diviseur par la quantité appropriée. Contrairement à la division eu-
clidienne, on peut la continuer indéfiniment : on ne s’arrête que quand l’ordre désiré
est atteint. Par exemple, pour diviser A = X + 1 par B = X 2 + 1, on écrit :
1 +X 1 + X2
1 +X 2 1 + X − X2
X −X 2
X +X 3
−X 2 −X 3
−X 2 −X 4
−X 3 +X 4
Ce qui fournit la division suivant les puissances croissantes jusqu’à l’ordre n = 2 :
(1 + X) = (1 + X 2 )(1 + X − X 2 ) + X 3 (X − 1)
À quoi cela peut-il bien servir ? Eh bien entre autres, à décomposer en éléments
simples. . .
1+X (1 + X 2 )(1 + X − X 2 ) + X 3 (X − 1) 1 1 1 X −1
3 2
= 3 2
= 3+ 2− + 2
X (1 + X ) X (1 + X ) X X X X +1
3.5 Formule de Cardan

Il s’agit d’une formule qui permet de résoudre l’équation générale du troisième degré
ax + bx2 + cx + d = 0. Par une réduction facile (saurez-vous effectuer cette réduction ?
3
Indication : poser x = y + e pour une constante e bien choisie et considérer l’équation

en y), on peut se ramener au cas de l’équation x3 + 3px + 2q = 0 avec p et q réels. Le
discriminant du polynôme X 3 + 3pX + 2q vaut par définition
D = q 2 + p3 .
La formule de Cardan affirme qu’une racine réelle de l’équation vaut
q√ q√
3 3
x= D−q− D + q.
50
Considérons par exemple l’équation x3 = 51x + 104. Alors p = −17, q = −52 et

D = 522 − 173 = −2209. En étudiant les variations de la fonction x 7→ x3 − 51x − 104,
notamment ses limites en plus ou moins l’infini, il est clair que cette équation admet
au moins une racine réelle, c’est d’ailleurs le cas de tous les polynômes de degré 3.
Pourtant, la formule de Cardan donne :
q
3 √ q
3 √
x= 52 + −2209 + 52 − −2209,
qui semble être un nombre complexe pas spécialement réel. En fait, (47i)2 = −2209
donc la formule de Cardan devient
√ √
x = 3 52 + 47i + 3 52 − 47i.
De plus, (4 + i)3 = 52 + 47i et (4 − i)3 = 52 − 47i, donc en reportant cela dans la formule
de Cardan, on obtient x = 8, qui est effectivement une solution réelle, assez simple de
surcroît !
Terminons-en avec les racines de x3 − 51x − 104 ; maintenant qu’on dispose de la
racine x = 8, on sait que x − 8 est un diviseur donc on va pouvoir calculer le quotient
par une division euclidienne puis factoriser le quotient puisqu’il est de degré 2. Dans
le détail,
x3 − 51x − 104 = (x − 8)(x2 + bx + c).
Il faut annuler le coefficient en x2 donc b = 8, et le coefficient constant vaut −104 = −8c
donc c = 13. Pour terminer dans l’esprit des contemporains de Cardan, on complète le
carré dans x2 + 8x + 13, donc on utilise la relation x2 + 8x + 13 = (x + 4)2 − 3 pour
obtenir finalement la factorisation
√ √
x3 − 51x − 104 = (x − 8)(x + 4 + 3)(x + 4 − 3),
√ √
et les racines x = 8, x = −4 − 3 et x = −4 + 3.
Le schéma général que nous avons utilisé ci-dessus pour trouver une (première)
racine de l’équation x3 = 51x + 104 a été inventé par une succession de mathématiciens
italiens au cours du xvie siècle. L’histoire de cette découverte est animée et sordide,
pleine de ressentiment, de bruit, de fureur, de mesquineries et de traits de génie. Avant
de la raconter, mentionnons que c’est bien à travers l’étude des équations du troisième
degré que ces algébristes italiens sont conduits à introduire les nombres complexes. Ils
les appelleront au début nombres « impossibles » et les utiliseront comme de simples
artifices de calcul, non rigoureux et même un peu mystérieux, mais ayant le bon goût de
toujours fournir la solution. Cette résolution des équations cubiques et quartiques peut
être considérée comme une des plus grandes contributions à l’algèbre depuis les apports
des Babyloniens qui, 4000 ans plus tôt, avaient appris à compléter le carré comme nous
l’avons fait pour x2 + 8x + 13 ci-dessus, pour résoudre les équations quadratiques.
Rappelons pour finir que seules les équations de degré au plus 4 sont résolubles par
51
radicaux, c’est-à-dire que seules ces équations peuvent être résolues par des méthodes
générales donnant les solutions en fonction des coefficients du polynôme.
L’histoire qui nous intéresse, même si elle comprend de nombreux personnages, est
principalement celle de l’affrontement entre Niccolò Fontana, dit Tartaglia, et Giro-
lamo Cardano, que les Français appellent Jérôme Cardan. On peut choisir de la faire
commencer un peu plus tôt, à la toute fin du xve siècle, avec un moine franciscain
nommé Luca Paccioli (1445-1517).
En 1494, Paccioli rédige un traité d’algèbre, qu’il intitule la Summa. Il y reprend
tous les travaux des mathématiciens Arabes connus de lui, notablement ceux du mathé-
maticien, astronome et géographe Al Khwarizmi (780-850), considéré par de nombreux
historiens comme l’un des plus grands mathématiciens de tous les temps. On trouve en
particulier dans la Summa de Paccioli la résolution complète des équations du premier
et deuxième degré et l’affirmation (fausse) selon laquelle les équations du troisième
degré sont insolubles par des méthodes algébriques.
En 1501 et 1502, Paccioli enseigne les mathématiques à l’université de Bologne. Il y
rencontre Scipione del Ferro (1465-1526), lui aussi professeur de mathématiques, et lui
fait part de sa conviction sur l’insolubilité des équations du troisième degré. Del Ferro
commence à s’intéresser au problème.
En 1515, del Ferro découvre une méthode algébrique de résolution des équations
cubiques x3 = px + q et x3 + q = px (à l’époque, les deux formes sont vraiment
différentes car on ne sait travailler qu’avec des nombres positifs). Plutôt que la publier,
il la note sur un carnet et la tient secrète.
En 1526, à la mort de del Ferro, son gendre Hannibal Nave, lui aussi professeur
de mathématiques (encore un), hérite du carnet. Toujours sur son lit de mort, del
Ferro confie également ses méthodes de résolution à son élève Antonio Maria Fior, peu
talentueux semble-t-il. Fior commence à se vanter d’être capable de résoudre toutes les
équations du troisième degré et, comme c’est l’usage à l’époque, il lance des défis (en
italien, disfide) sur ce thème.
Entre alors en scène Niccolò Fontana, dit Tartaglia (1505-1557), un des principaux
personnages de notre histoire. Tartaglia est né à Brescia. Son surnom provient de
tartagliare qui signifie bégayer en italien. Tartaglia avait en effet un défaut de parole,
séquelle d’une très grave blessure. Lorsque les Français saccagent la ville de Brescia en
1512, le petit Niccolò et son père se réfugient dans une cathédrale. Les soldats de Louis
XII les y découvent, ils tuent le père de Niccolò, fracturent le crâne de celui-ci et lui
ouvrent la mâchoire d’un coup de sabre. Toutefois, sa mère réussit à le sauver de la
mort.
De famille modeste, Niccolò ne peut aller à l’école mais sa mère (encore elle) éco-
nomise et elle parvient à lui payer l’école pendant deux semaines. Niccolò profite de
ce court laps de temps pour voler des livres et il continue à apprendre en autodidacte.
Adulte, il gagnera sa vie en enseignant les mathématiques dans toute l’Italie et en
participant, on y revient, à des disfide mathématiques.
52
Tartaglia se consacre donc, lui aussi, à la recherche d’une méthode de résolution des
équations cubiques, et il arrive bientôt à résoudre certaines classes. En 1535, il relève
le défi de Fior et le duel s’engage entre les deux hommes. Chacun dépose une liste
de problèmes chez un notaire ainsi qu’une somme d’argent. Celui qui, sous quarante
jours, aura résolu le plus de problèmes proposés par l’autre sera désigné vainqueur et
remportera la somme. Juste avant la date limite, Tartaglia découvre une méthode qui
lui permet de résoudre tous les problèmes posés par Fior. Fior, lui, ne sait résoudre
que x3 + px = q mais les équations proposées par Tartaglia sont du type x3 + px2 = q.
Fior n’en résoud aucune ou, selon les sources, il n’en résoud qu’une seule, en tous les
cas il a perdu la disfida.
Tartaglia garde secrète sa méthode de résolution et ne la publie pas. Entre en
scène le deuxième protagoniste de notre histoire, Girolamo Cardano (1501-1576), dit
aussi Jérôme Cardan, à l’époque conférencier de mathématique à la fondation Piatti
de Milan. Cardano connaît le problème des équations cubiques et, avant le défi entre
Fior et Tartaglia, il est d’accord avec le verdict de Paccioli selon lequel leur résolution
algébrique est impossible. Cette victoire éclatante de Tartaglia intrigue tout de même
Cardano, qui tente de découvrir seul une méthode, mais en vain. Cardano contacte
alors Tartaglia et lui demande de lui confier sa méthode, en promettant de garder le
secret. Tartaglia refuse.
Cardano, qui sait que Tartaglia est pauvre, lui écrit de nouveau pour lui proposer
de le présenter au marquis del Vasto, un des plus puissants mécènes du temps — si du
moins Tartaglia accepte de lui révéler son secret. Tartaglia réalise qu’un tel appui peut
être une aide non négligeable à son ascension sociale. Il propose à Cardano d’organiser
une entrevue avec le marquis lors de sa prochaine visite à Milan.
En 1539, Tartaglia quitte donc Venise pour Milan. Mais à son grand désespoir,
l’empereur ainsi que le marquis sont absents de Milan. Tartaglia donne alors son ac-
cord pour révéler son secret à Cardano à condition que Cardano jure de ne jamais le
divulguer. Cardano jure et Tartaglia lui révèle enfin sa méthode, sous la forme d’un
poème. En contre-partie et comme promis, Tartaglia obtient de Cardano une lettre
de recommandation auprès du marquis. Mais n’osant pas se présenter seul devant le
marquis et Cardano refusant de l’accompagner, Tartaglia retourne frustré à Venise sans
même avoir vu le fameux marquis et se demandant s’il n’a pas eu tort de dévoiler son
secret.
En 1540, Cardano est amené à chercher à résoudre l’équation du quatrième degré
x4 + 6x3 + 36 = 60x. Cardano n’y arrive pas et demande de l’aide à son secrétaire
Ludovico Ferrari (1522-1565), auquel on pense devoir en fait un grand nombre des
résultats publiés par Cardano. Ferrari parvient à ramener l’équation à une équation du
troisième degré que Cardano et lui savent résoudre. Ferrari généralise alors la méthode
consistant à ramener une équation du quatrième degré à une équation du troisième
degré, procédure qui paraîtra dans un futur livre de Cardano.
En 1543, Cardano et Ferrari se rendent à Bologne et apprennent de Nave que
del Ferro avait résolu bien avant Tartaglia certaines équations cubiques. Pour le leur
53
prouver, Nave leur confie le bloc-notes de feu del Ferro. Cardano décide que, bien qu’il
ait juré de ne jamais révéler la méthode de Tartaglia, rien ne l’empêche maintenant de
publier celle de del Ferro !
En 1545, Cardano publie enfin son livre Ars Magna, instantanément célèbre et
bien connu pour contenir la démonstration d’une méthode algébrique permettant de
résoudre les équations des troisième et quatrième degrés. Aujourd’hui, on appelle sou-
vent ces formules les formules de Tartaglia-Cardan.
Tartaglia est furieux car il considère que Cardano a transgressé sa promesse. S’en-
suivent des échanges de lettres d’insultes entre Tartaglia d’une part et Ferrari agissant
pour le compte de Cardano d’autre part, à l’issue desquels Ferrari défie Tartaglia.
Tartaglia, dont la vraie cible est Cardano, refuse. En 1546, il publie son propre livre,
Nouveaux problèmes et inventions, dans lequel il révèle sa version de l’histoire et le
parjure de Cardano. Mais grâce à Ars Magna, Cardano est devenu intouchable.
En 1548, Tartaglia, toujours pauvre, reçoît une importante proposition d’un poste
de conférencier à Brescia, sa ville natale. Mais pour l’obtenir, il doit répondre au défi de
Ferrari. Tartaglia se résoud donc enfin au face-à-face avec Ferrari, son concurrent et la
créature de Cardano. Le 10 août, le défi a lieu à Milan dans l’église des frères Zoccolanti
sous les yeux de toutes les célébrités milanaises de l’époque, dont Don Ferrante di
Gonzaga, gouverneur de la ville et arbitre du duel. Ferrari fait une meilleure prestation
que Tartaglia, qui va jusqu’à déclarer forfait à l’issue du premier jour, laissant Ferrari
vainqueur. Tartaglia, déconsidéré, perdra même son poste à Venise un an plus tard.
Le dernier personnage de notre histoire est Rafaele Bombelli (1526-1573) et avec
lui les choses s’apaisent. En 1572, il couronne l’œuvre des savants italiens en réalisant
dans son traité Algebra la première étude véritable des √ nombres imaginaires.
√ Dans Ars
Magna, Cardano manipulait les deux nombres 5 + −15 et 5 − −15 et constatait
que leur produit et leur somme sont tous deux des nombres positifs ordinaires : 40 et
10. Mais Cardano qualifiait lui-même ces considérations de « subtiles et inutiles ».
En 1560, donc du vivant de Cardano, et en s’inspirant parfois lourdement d’un
manuscrit de Diophante tout juste retrouvé, l’Arithmetica, Bombelli reprend l’étude
du problème. Il remarque que lorsque la formule de Cardan aboutit à un discriminant
négatif, la méthode géométrique donne une solution réelle positive. Il retrouve ainsi la
racine réelle (connue avant lui) x = 4 de l’équation x3 = 15x + 4. Bombelli arrive à la
conclusion que toute équation du troisième degré posséde au moins une solution réelle.
Mais surtout, il est le premier à utiliser dans ses calculs des racines carrées imaginaires
de nombres négatifs pour obtenir finalement la solution réelle tant recherchée, et à
poser de manière systématique des règles de calcul pour ces nombres.
Voici, pour terminer cette très libre évocation historique, le texte du poème de
Tartaglia qui décrit sa méthode de résolution.
Quando chel cubo con le cose appresso
Se agguaglia à qualche numero discreto
Trouan dui altri differenti in esso.
54
Dapoi terrai questo per consueto

Che’llor produtto sempre sia eguale
Alterzo cubo delle cose neto,
El residuo poi suo generale
Delli lor lati cubi ben sottratti
Varra la tua cosa principale.
In el secondo de cotestiatti
Quando che’l cubo restasse lui solo
Tu osseruarai quest’altri contratti,
Del numer farai due tal part’à uolo
Che l’una in l’altra si produca schietto
El terzo cubo delle cose in stolo
Delle qual poi, per communprecetto
Torrai li lati cubi insieme gionti
Et cotal somma sara il tuo concetto.
El terzo poi de questi nostri conti
Se solue col secondo se ben guardi
Che per natura son quasi congionti.
Questi trouai, e non con passi tardi
Nel mille cinquecentè, quatro e trenta
Con fondamenti ben sald’è gagliardi
Nella Citta dal mar’intorno centa.
Et pour ceux qui ne lisent pas l’italien, voici une traduction de la première partie avec,
entre crochets, les étapes de la méthode de résolution décrite par le texte.
Quand le cube avec les choses
Est égalé à un certain nombre [Cas x3 + px = q]
Trouves-en deux autres qui diffèrent de ce dernier [Trouver u et v]
Ensuite tu tiendras ceci pour habituel [tels que u − v = q]
Que leur produit soit égal
Au tiers du cube, des choses exactement [et tels que uv = (p/3)3 ]
Ensuite son reste général,
De leurs racines cubiques bien soustraites, √ √
Vaudra ta chose principale. [Alors x = 3 u − 3 v.]
55
Calcul Algébrique
Eric Dumas, Emmanuel Peyre, Bernard Ycart
Ce chapitre est consacré à la manipulation de formules algébriques, constituées de

variables formelles, de réels ou de complexes. L’objectif est essentiellement pratique :
« savoir calculer ». La seule nouveauté réside dans la manipulation de formules avec
P Q
indices, utilisant les symboles (somme) et (produit). Pour le reste, vous aurez
simplement à réviser votre cours de terminale sur les nombres complexes.
Table des matières

1 Cours 1
1.1 Sommes et produits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Trois formules à connaître . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Nombres complexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Formes trigonométrique et exponentielle . . . . . . . . . . . . . . . . . 11
1.5 Géométrie du plan complexe . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Entraînement 16
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3 Compléments 37
3.1 Qu’on m’aille quérir M. Viète . . . . . . . . . . . . . . . . . . . . . . . 37
3.2 L’homme qui savait tout. . . ou pas . . . . . . . . . . . . . . . . . . . . 38
3.3 Triangle de Pascal, binôme de Newton et poésie védique . . . . . . . . 39
3.4 Les formules de Ramanujan . . . . . . . . . . . . . . . . . . . . . . . . 41
3.5 Le Rapido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.6 Si non è vero, è bene trovato . . . . . . . . . . . . . . . . . . . . . . . . 43
3.7 La marquise de Tencin . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.8 Equations résolubles par radicaux . . . . . . . . . . . . . . . . . . . . . 45
27 septembre 2014
Maths en Ligne Calcul Algébrique UJF Grenoble
1 Cours
1.1 Sommes et produits
Nous commençons par les sommes.
L’écriture
5
2k
X
k=0
se lit « somme pour k allant de zéro à cinq de deux puissance k ». C’est une notation
abrégée pour :
20 + 21 + 22 + 23 + 24 + 25 .
La lettre k est l’indice de sommation. On la remplace successivement par toutes les
valeurs entières comprises entre les deux bornes, qui sont 0 et 5 dans notre exemple. La
première borne, celle qui est écrite au-dessous du signe somme, sera toujours inférieure
ou égale à celle qui est au-dessus. Les bornes peuvent elles-mêmes être des variables,
mais elles sont nécessairement différentes de l’indice de sommation. Par exemple, pour
tout entier naturel n : n
2k
X
k=0
désigne la somme
20 + 21 + 22 + 23 + · · · + 2n−1 + 2n .
Rappelons que, par convention, a0 = 1 pour tout nombre réel a. Prenez l’habitude
d’écrire les sommes sous forme développée quitte à introduire des points de suspension
entre les premiers termes et les derniers. Voici quelques exemples d’égalités illustrant
la manipulation des indices et des bornes. Nous donnons sous chaque exemple une
écriture sous forme développée.
n n−1
2k = 2h+1
X X
k=1 h=0
n
1
2 + ··· + 2 = 2 0+1
+ · · · + 2n−1+1 .
L’indice de sommation peut être remplacé par n’importe quel autre : on dit que c’est
une variable muette.
n n 2n
2k + 2n+h = 2k
X X X
k=0 h=1 k=0
(20 + · · · + 2n ) + (2n+1 + · · · + 22n ) = 20 + · · · + 22n .

Observez que la borne peut être une des variables de la quantité à sommer.
n
2n = (n + 1)2n
X
k=0
2n + · · · + 2n = (n + 1)2n .
1
Dans cet exemple la quantité à sommer ne dépend pas de l’indice de sommation : celle-
ci a pour seul effet de compter les termes. Attention, pour m 6 n, il y a n − m + 1
termes dans la somme de m à n.
n X
1 n
1 X
k+h
2k+h
X X
2 =
k=0 h=0 h=0 k=0
(20 + 21 ) + · · · + (2n + 2n+1 ) = (20 + · · · + 2n ) + (21 + · · · + 2n+1 ) .
Une double somme est une somme de sommes, et on peut toujours intervertir les deux.
Voici un enchaînement d’égalités, montrant que la somme des puissances de 2 de 20
jusqu’à 2n vaut (2n+1 − 1) (c’est un cas particulier d’une formule à connaître que nous
verrons plus loin). Pour chaque ligne de calcul, nous donnons à droite l’écriture sous
forme développée. On rappelle que 20 = 1.
n n n
! !
k k k
X X X
2 = 2 2 − 2 = 2(20 + · · · + 2n ) − (20 + · · · + 2n )
k=0 k=0 k=0
n n
! !
k+1 k
X X
= 2 − 2 = (21 + · · · + 2n+1 ) − (20 + · · · + 2n )
k=0 k=0
n+1 n
! !
h k
X X
= 2 − 2 = (21 + · · · + 2n+1 ) − (20 + · · · + 2n )
h=1 k=0
= 2n+1 − 20 = 2n+1 − 1 .
Ce que nous venons de voir pour les sommes s’applique aussi aux produits. Le
produit des entiers de 1 à n intervient dans de nombreuses formules. C’est la factorielle
de n. Elle se note « n! ».
n
Y
n! = k = 1 2 3 · · · (n − 2) (n − 1) n .
k=1
Il est souvent utile d’étendre la définition de la factorielle en convenant que 0! = 1.

Voici les premières valeurs.
n 0 1 2 3 4 5 6 7 8 9 10
n! 1 1 2 6 24 120 720 5040 40320 362880 3628800
Si n est un entier positif, un n-uplet désigne une liste ordonnée de n objets. On

appelle permutation des nombres de 1 à n un n-uplet d’entiers (u1 , . . . , un ) dans lequel
chaque entier entre 1 et n apparaît une et une seule fois. Par exemple (5, 3, 2, 4, 1) est
une permutation des nombres de 1 à 5.
Théorème 1. Le nombre de permutations des nombres de 1 à n est n!.
Démonstration : On montre le théorème par récurrence sur n.
2
Si n = 1, la seule permutation des entiers de 1 à 1 est (1).

On suppose donc que le résultat est vrai pour l’entier n. Montrons-le pour l’entier
n + 1. Soit k un entier tel que 1 6 k 6 n + 1 et comptons le nombre Ak de permutations
(u1 , . . . , un+1 )
telles que uk = n + 1. À une telle permutation, associons le n-uplet :
(u1 , . . . , uk−1 , uk+1 , . . . , un+1 ) .
C’est une permutation des nombres de 1 à n. Inversement étant donnée une permutation
(v1 , . . . , vn ) des entiers de 1 à n, alors
(v1 , . . . , vk−1 , n + 1, vk+1 , . . . , vn )
est une permutation des entiers de 1 à n + 1 dont le k-ième terme est n + 1. En
appliquant l’hypothèse de récurrence, on obtient que Ak = n!. Donc le nombre total de
permutations des nombres de 1 à n + 1 est :
n+1
X n+1
X
Ak = n! = (n + 1) n! = (n + 1)! ,
k=1 k=1
ce qui montre le résultat pour n + 1.

Pour ordonner n objets, il faut associer à chacun un nombre entre 1 et n de sorte
que chaque nombre renvoie à un objet et un seul. Il y a autant de manières de le faire
que de permutations des n premiers entiers : n!. Au tiercé, il y a 5! = 120 manières
d’ordonner les 5 premiers chevaux. Une seule donne l’ordre d’arrivée, soit le quinté
dans l’ordre, et il y a 119 quintés dans le désordre.
Le nombre de combinaisons de k objets parmi n est le nombre de manières de choisir
k objets parmi n, sans distinguer leur ordre.
!
n n!
= . (1)
k k!(n − k)!

La notation nk que nous utilisons ici, de préférence à l’ancienne notation Cnk , est
conforme aux programmes en vigueur et à l’usage international. Nous conseillons de la
lire « de n choisir k ».
La formule (1) correspond au raisonnement suivant. Pour choisir k objets, on peut
se donner une permutation des n objets, et décider d’en retenir les k premiers. Parmi les
permutations, toutes celles qui auront en commun leurs k premiers nombres conduiront
au même choix. Il faut donc diviser par le nombre de permutations des k objets choisis,
et par le nombre de permutations des n − k objets qui ne l’ont pas été.
Observez que (1) ne change pas si on remplace k par n − k.
! !
n n
= .
k n−k
3
Choisir k objets parmi n (ceux que l’on garde) revient à en choisir n − k (ceux que l’on
laisse).
Voici une autre expression de nk .
1 k−1
!
n Y n (n − 1) · · · (n − k + 1)
= (n − h) = . (2)
k k! h=0 1 2 ··· k
Notez qu’il y a k facteurs au numérateur, comme au dénominateur. On obtient cette

formule en simplifiant le quotient n!/(n − k)! dans (1).
On peut aussi raisonner comme suit. Il y a n façons de choisir le premier objet,
puis n − 1 de choisir le second (puisqu’un objet a déjà été choisi), etc. Pour choisir le
k-ième objet, il reste n−(k−1) possibilités. Ceci correspond au numérateur de (2). Cette
manière de procéder retourne une liste ordonnée. Il faut donc diviser par le nombre
d’ordres possibles des k objets choisis, qui est k!.
Observez les relations suivantes, faciles à déduire de (1) ou (2) et de la définition
de la factorielle. ! ! !
n n n−1 n−k+1 n
= = .
k k k−1 k k−1

Pour calculer nk en pratique, on n’utilise ni (1) ni (2). Le calcul récursif par la formule
du triangle de Pascal (connue des indiens, des chinois et des arabes bien avant Pascal)
est beaucoup plus rapide.
! ! !
n n−1 n−1
= + . (3)
k k k−1
Nous conseillons au lecteur de démontrer cette formule à partir des expressions (1)
et (2). Voici la justification combinatoire. Supposons que parmi les n objets dont k
doivent être choisis, l’un d’entre eux soit distingué (disons qu’il est rouge). Parmi
les choix possibles de k objets, certains ne contiennent
pas l’objet rouge, d’autres le
contiennent. Les premiers sont au nombre de n−1 k
, car les k objets sont choisis parmi
les n − 1 différents de l’objet rouge. Les choix contenant l’objet rouge sont au nombre
de n−1k−1
car l’objet rouge ayant été retenu, il reste k − 1 objets à choisir parmi les n − 1

n
autres. Voici, disposées en triangle, les valeurs de k
pour n allant de 0 à 6.
n\k 0 1 2 3 4 5 6
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
4
Chaque valeur est la somme de celle qui est au-dessus, et de celle qui est à gauche de
celle qui est au-dessus. S’il n’est pas indispensable de connaître ce tableau par cœur, il
est souvent utile de savoir le réécrire rapidement.
1.2 Trois formules à connaître

Les formules données par les trois théorèmes qui suivent vous seront souvent utiles.
Théorème 2. Pour tout entier n > 1, la somme des n premiers entiers vaut
n(n + 1)/2.
n
X n(n + 1)
k = 1 + 2 + ··· + n = . (4)
k=1 2
Démonstration : Nous donnons d’abord la démonstration par récurrence. Nous verrons

ensuite une justification géométrique et une justification combinatoire. L’hypothèse de
récurrence est : n
X n(n + 1)
H(n) k= .
k=1 2
Pour n = 1 :
1
X 1(1 + 1)
k=1= .
k=1 2
Supposons maintenant que H(n) est vraie. Ecrivons :
n+1 n
!
X X
k= k + (n + 1) .
k=1 k=1
En appliquant H(n), on obtient :

n
!
X n(n + 1)
k + (n + 1) = + (n + 1) .
k=1 2
Le membre de droite s’écrit :

n(n + 1) (n + 1)(n + 2)
+ (n + 1) = .
2 2
Nous avons donc démontré que :
n+1
X (n + 1)(n + 2)
k= ,
k=1 2
c’est-à-dire que H(n + 1) est vraie.

Voici maintenant une justification géométrique. Considérons un rectangle dont la
largeur et la hauteur valent respectivement n + 1 et n unités (figure 1). Ce rectangle
5
11111111111111111111
00000000000000000000
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
00000000000000000000
11111111111111111111
Figure 1 – La somme des n premiers entiers vaut n(n + 1)/2.
peut être découpé en deux moitiés superposables. Chacune est formée de 1 + 2 + · · · + n

carrés de côté unité, et couvre une surface égale à la surface du rectangle divisée par
2, soit n(n + 1)/2.
Voici maintenant une explication combinatoire. Autour d’une table n + 1 personnes
sont assises et s’apprêtent à trinquer. Combien de bruits de verre entendra-t-on ? Il
y a deux manières de compter. La première consiste à prendre les personnes dans
l’ordre : la première doit trinquer avec les n autres. La seconde, qui a déjà trinqué avec
la première, doit encore trinquer avec n − 1 autres. Ainsi de suite jusqu’à la n-ième
personne, qui ayant déjà trinqué avec les n − 1 autres n’aura plus que la n-ième avec
qui trinquer. On entendra donc n + (n − 1) + · · · + 1 bruits de verre. La seconde manière
de compter consiste à remarquer que le nombre de bruits de verre est égal au nombre
de combinaisons de 2 personnes parmi n + 1 :
!
n+1 n(n + 1)
= .
2 2
Les deux formules suivantes portent sur deux variables a et b que vous pouvez voir dans
un premier temps comme deux réels. Ces formules sont aussi valables pour des nombres
complexes, et plus généralement pour des objets quelconques que l’on peut ajouter et
multiplier de façon commutative (par exemple des polynômes ou des fonctions de R
dans R).
La première généralise l’identité remarquable a2 − b2 = (a + b)(a − b).
Théorème 3. Pour tout entier n,

n
!
n+1 n+1 n−k k
= (a − b)(an + an−1 b + · · · + abn−1 + bn ).
X
a −b = (a − b) a b (5)
k=0
6
(Rappelons la convention a0 = b0 = 1.)

Démonstration : La démonstration se fait par récurrence. L’affirmation est vraie pour
n = 0 puisque :
0
a0 b0 = 1.
X
k=0
Supposons le résultat vrai pour n.

n+1 n
! ! !
n+1−k k n+1−k k n+1
X X
(a − b) a b = (a − b) a b +b
k=0 k=0
n
! !
an−k bk + bn+1
X
= (a − b) a
k=0
n
!
n−k k
+ (a − b)bn+1
X
= a(a − b) a b
k=0
= a(an+1 − bn+1 ) + (a − b)bn+1
= an+2 − bn+2
L’hypothèse de récurrence a été utilisée pour obtenir l’avant-dernière égalité. Le résultat

est vrai pour n + 1, donc pour tout n.
Des cas particuliers du théorème 3 reviennent souvent dans les calculs. Nous avons
déjà rencontré le cas a = 2, b = 1. Vous pouvez retenir le suivant :
n
!
k
= (1 − x)(1 + x + x2 + · · · + xn ) = 1 − xn+1 .
X
(1 − x) x
k=0
Plus généralement, on a la relation :

Proposition 1 (Somme d’une série géométrique). Soit x un nombre réel différent de
0 et de 1 et soient p et q des entiers relatifs tels que p 6 q. Alors :
q
xp − xq+1
xk =
X
·
k=p 1−x
Démonstration : Il suffit de remarquer que :

 
q q q+1
xk  = xk − xk = xp − xq+1 .
X X X
(1 − x) 
k=p k=p k=p+1

Une autre formule à connaître est celle du binôme de Newton, qui généralise (a + b)2 =
a2 + 2ab + b2 .
7
Théorème 4. Pour tout entier n > 1,

n
!
n n k n−k
= bn + nbn−1 a + · · · + nban−1 + an .
X
(a + b) = a b (6)
k=0 k

n
À cause de (6), les nombres k
s’appellent les coefficients binomiaux.
Démonstration : Ici encore la démonstration se fait par récurrence, nous donnerons
ensuite une justification combinatoire. Pour n = 1 :
! !
1 0 11 1 1 0
(a + b) = ab + ab .
0 1
Supposons que la formule est vraie pour n et démontrons-la pour n + 1.
(a + b)n+1 = (a + b)(a + b)n
n
! !
X n k n−k
= (a + b) a b
k=0 k
n n
! ! ! !
X n k+1 n−k X n k n+1−k
= a b + a b
k=0 k k=0 k
n+1 n
! ! ! !
n n k n+1−k
ah bn+1−h +
X X
= a b
h=1 h−1 k=0 k
n n
! ! ! !
n+1 n n k n+1−k
ah bn+1−h + + bn+1
X X
= a + a b
h=1 h−1 k=1 k
n
! !! !
n n
= an+1 + ak bn+1−k + bn+1
X
+
k=1 k−1 k
n+1
!
X n + 1 k n+1−k
= a b .
k=0 k
Pour la dernière égalité, nous avons appliqué la formule du triangle de Pascal (3). Le
résultat est démontré.
Voici maintenant la justification combinatoire. La quantité (a + b)n est le produit
de n facteurs, chacun contenant deux termes a et b. Quand on développe le produit,
on prend dans le premier facteur un des deux termes, on le multiplie par un terme
du second facteur, ainsi de suite jusqu’au n-ième facteur. Le produit obtenu est égal à
ak bn−k si on a choisi le terme a dans k facteurs et le terme b dans les n − k autres. Le
nombrede produits égaux à ak bn−k est le nombre de combinaisons de k facteurs parmi
n, soit nk .
1.3 Nombres complexes

Le reste de ce chapitre est une révision du programme de terminale sur les com-
plexes.
8
Les nombres complexes sont nés de la nécessité de donner un sens à la racine

carrée de nombres négatifs, pour résoudre les équations algébriques. Dans l’ensemble
des réels, l’équation x2 = 1 a deux solutions, +1 et −1, mais l’équation x2 = −1 n’en
a pas, puisque le carré de tout nombre réel est positif ou nul. On décide d’appeler i un
nombre (imaginaire) tel que i2 = −1, puis d’appeler nombre complexe tout nombre de
la forme a + ib, où a et b sont deux réels quelconques. Leur ensemble est noté C.
Ainsi tout nombre complexe z a une partie réelle, notée Re(z) et une partie imagi-
naire, notée Im(z).
z = Re(z) + Im(z) i .
On représente ces nombres par les points d’un plan muni de deux axes orthogonaux.
L’axe horizontal porte les réels (qui sont les nombres complexes dont la partie imagi-
naire est nulle). L’axe vertical porte les nombres dits imaginaires purs, ceux dont la
partie réelle est nulle. Le point correspondant au nombre a + ib est placé à la verticale
du réel a et à l’horizontale de l’imaginaire pur ib (figure 2). On dit que le nombre a + ib
est l’affixe du point qui le représente. Le point d’affixe 0 est l’origine, et on le note O.
imaginaires
2i
−2+i i 2+i
réels
−3 −2 −1 0 1 2 3
−1−i −i 1−i
−2i
Figure 2 – Le plan complexe.
L’addition et la multiplication des réels s’étendent aux nombres complexes sans

difficulté particulière.
• addition : (a + ib) + (c + id) = (a + c) + i(b + d),
• multiplication : (a + ib)(c + id) = (ac − bd) + i(bc + ad).
Soient a, b, c trois réels. L’équation du second degré ax2 + bx + c = 0 admet toujours
des solutions, éventuellement complexes.
1. si b2 − 4ac > 0 l’équation admet deux racines réelles,
√ √
−b + b2 − 4ac −b − b2 − 4ac
r1 = et r2 = ;
2a 2a
2. si b2 − 4ac = 0 l’équation admet une racine réelle « double »,
−b
r= ;
2a
9
3. si b2 − 4ac < 0 l’équation admet deux racines complexes,

√ √
−b + i −b2 + 4ac −b − i −b2 + 4ac
r1 = et r2 = .
2a 2a
Ce résultat n’est pas étonnant, et vous le connaissez déjà. Le miracle est que les com-
plexes permettent de résoudre non seulement les équations du second degré, mais toutes
les équations algébriques quel que soit leur degré. Le théorème suivant porte en France
le nom de d’Alembert, bien qu’il ait été démontré par Gauss. Il est partout connu
comme le théorème fondamental de l’algèbre.
Théorème 5. Soit P un polynôme de degré n > 1 à coefficients complexes. Le poly-

nôme P est un produit de n facteurs de degré 1, à coefficients dans C.
En d’autres termes, l’équation P (x) = 0 a toujours n solutions ; certaines solutions

peuvent être multiples, et elles sont comptées avec leur ordre de multiplicité. On traduit
cette propriété en disant que C est algébriquement clos.
Définition 1. Soit z = a + ib un nombre complexe. On appelle

√
1. module de z le nombre réel positif ou nul a2 + b2 . On le note |z|.
2. argument de z l’angle θ ∈ [0, 2π[ tel que Re(z) = |z| cos(θ) et Im(z) = |z| sin(θ)
(défini seulement si z est non nul). On le note arg(z).
3. conjugué de z le nombre complexe de même partie réelle et de partie imaginaire
opposée. On le note z.
z = a − ib .
Voici quelques exemples.
nombre module argument conjugué

i √1 π/2 −i
1+i √2 π/4 1−i
−1 + √i 2 3π/4 −1 −√i
1√+ i 3 2 π/3 1√− i 3
√ 3 − i
√ 2
√ 11π/6 √ 3 + i√
− 2+i 6 2 2 2π/3 − 2−i 6
Dans le plan complexe, le module est la longueur du segment joignant l’origine au point
représentant z. L’argument est l’angle entre l’axe des réels et ce segment, orienté dans
le sens inverse des aiguilles d’une montre (le sens trigonométrique). Le conjugué est le
symétrique par rapport à l’axe horizontal des réels (figure 3).
Observez qu’un nombre et son conjugué ont le même module et que leur produit
est le carré de ce module.
z z = |z|2 = |z|2 .
10
z=a+ ib
z
θ
0
z=a− ib
Figure 3 – Module, argument et conjugué d’un nombre complexe.
Il est fréquent dans les calculs d’utiliser un conjugué pour simplifier le résultat et le
mettre sous la forme a + ib. Si z1 et z2 sont deux complexes, leur quotient s’écrit :
z1 z1 z2 z1 z2
= = .
z2 z2 z2 |z2 |2
Voici un exemple.
1 + 2i (1 + 2i)(1 − i) 3+i 3 i
= = = + .
1+i (1 + i)(1 − i) 2 2 2
1.4 Formes trigonométrique et exponentielle

Par définition si ρ et θ désignent respectivement le module et l’argument du nombre
complexe a + ib, alors a = ρ cos(θ) et b = ρ sin(θ). Ainsi le nombre s’écrit :
z = a + ib = ρ(cos(θ) + i sin(θ)) .
On dit que le nombre est mis sous forme trigonométrique, ou forme polaire. Cette
écriture prend toute sa force grâce à l’exponentielle complexe.
Définition 2. Soit z = a + ib un nombre complexe. On appelle exponentielle complexe

de z et on note ez (ou exp(z)) le nombre complexe :

ez = ea cos(b) + i sin(b) ,
où ea est l’exponentielle réelle de a.
Observez que l’exponentielle complexe coïncide avec l’exponentielle réelle si la partie

imaginaire est nulle. Si la partie réelle est nulle, le nombre cos(b)+i sin(b) est un nombre
complexe de module 1 (car cos2 (b) + sin2 (b) = 1). Dans le cas général, le module de
ea+ib est ea et son argument est l’unique élément θ de [0, 2π[ tel que b − θ soit multiple
de 2π.
11
La périodicité modulo 2π des fonctions sinus et cosinus induit la périodicité modulo

2iπ de l’exponentielle complexe : pour tout réel b et pour tout entier k,
eib = ei(b+2kπ)
Ainsi,
e2kπi = 1 , e(2k+1)πi = −1 , e(π/2+2kπ)i = i , e(−π/2+2kπ)i = −i .
L’exponentielle complexe conserve la propriété fondamentale de l’exponentielle réelle
qui est de transformer les sommes en produits.
Théorème 6. Soient z et z 0 deux nombres complexes,
0 0
ez+z = ez ez .
Démonstration : Posons z = a + ib et z 0 = c + id. Par définition de l’exponentielle,

0

ez+z = e(a+c)+i(b+d) = ea+c cos(b + d) + i sin(b + d) .
D’autre part,

z z0

a c
ee = e cos(b) + i sin(b) e cos(d) + i sin(d)

= ea+c cos(b) + i sin(b) cos(d) + i sin(d) ,
car ea ec = ea+c (propriété de l’exponentielle réelle). Les formules trigonométriques

suivantes sont supposées connues :
cos(b + d) = cos(b) cos(d) − sin(b) sin(d) et sin(b + d) = sin(b) cos(d) + cos(b) sin(d) .
On en déduit immédiatement que :

cos(b) + i sin(b) cos(d) + i sin(d) = cos(b + d) + i sin(b + d) .

Si z est un nombre complexe de module ρ et d’argument θ, il est souvent commode
de l’écrire sous sa forme exponentielle :
z = ρeiθ .
Observez que le conjugué est :

z = ρe−iθ ,
et son argument est −θ+2π. L’utilisation de l’exponentielle facilite le calcul des produits
et des puissances. Par exemple si n est un entier,
z n = (ρeiθ )n = ρn einθ .
12
Il est facile également de retrouver les racines n-ièmes d’un nombre complexe sous
forme trigonométrique, c’est-à-dire de résoudre l’équation z n = ρeiθ . Il y a n solutions
qui s’écrivent :
ρ1/n ei(θ/n+2kπ/n) , k = 0, . . . , n − 1 .
Les nombres de la forme
ei(2kπ/n) , k = 0, . . . , n − 1 ,
sont les solutions de z n = 1. On les appelle les racines n-ièmes de l’unité (figure 4).
i
e2 iπ/3 e iπ/3
5 iπ/6 iπ/6
e e
−1 1
e7 iπ/6
e11 iπ/6
4 iπ/3
e 5 iπ/3
e
−i
Figure 4 – Racines douzièmes de l’unité.
Les fonctions sinus et cosinus s’expriment à l’aide de l’exponentielle complexe par

les formules d’Euler.
eiθ + e−iθ eiθ − e−iθ

cos(θ) = , sin(θ) = . (7)
2 2i
On les utilise pour linéariser des puissances de sinus et cosinus, afin de calculer leurs
13
primitives. Voici un exemple.

1 ix
sin4 (x) cos6 (x) = (e − e−ix )4 (eix + e−ix )6
210
1
= (e2ix − e−2ix )4 (eix + e−ix )2
1024
1
= (e8ix − 4e4ix + 6 − 4e−4ix + e−8ix )(e2ix + 2 + e−2ix )
1024
1
= (e10ix − 4e6ix + 6e2ix − 4e−2ix + e−6ix
1024
+2e8ix − 8e4ix + 12 − 8e−4ix + 2e−8ix
+e6ix − 4e2ix + 6e−2ix − 4e−6ix + e−10ix )
1
= 6 + 2 cos(2x) − 8 cos(4x) − 3 cos(6x) + 2 cos(8x) + cos(10x)
512
D’où une primitive de sin4 (x) cos6 (x) :
3x sin(2x) sin(4x) sin(6x) sin(8x) sin(10x)

+ − − + + .
256 512 256 1024 2048 5120
L’observation de la parité permet de prévoir a priori que la linéarisation ne contiendra
que des cos(kx). En effet, sin(x) est une fonction impaire et cos(x) une fonction paire.
Donc si on remplace x par −x, sinn (x) cosm (x) sera inchangé si n est pair, changé en
son opposé si n est impair. Dans le premier cas, la linéarisation ne contiendra que des
cosinus, dans le second cas, elle ne contiendra que des sinus.
1.5 Géométrie du plan complexe

Nous rappelons ici les liens entre les calculs sur les nombres complexes et la géomé-
trie du plan. Le premier résultat concerne les mesures de distances et d’angles.
Théorème 7. Soient A, B et C trois points distincts deux à deux, d’affixes respectives
zA , zB et zC .
1. La distance entre A et B est le module de zB − zA .
−→ −−→
2. L’angle orienté (CA, CB) est égal à l’argument du rapport (zB − zC )/(zA − zC ).
Si C est un point du plan d’affixe zC , et ρ et un réel positif, l’ensemble des points
dont l’affixe z est telle que |z − zC | = ρ est le cercle de centre C et de rayon ρ. On
peut aussi écrire ce cercle comme l’ensemble des points d’affixe zC + ρeiθ , où θ décrit
[0, 2π[. Comme conséquence immédiate du point 2, les points A, B, C sont alignés si et
seulement si l’argument de (zB − zC )/(zA − zC ) est égal à 0 ou π ; le triangle ABC est
rectangle en C si l’argument de (zB − zC )/(zA − zC ) est égal à π/2 ou 3π/2.
Voici maintenant la traduction sous forme de tranformations dans C des transla-
tions, homothéties et rotations (figure 5).
14
Théorème 8. Soit f une application de C dans C. On note F l’application du plan

dans lui-même qui au point d’affixe z associe le point d’affixe f (z). Soit A un point du
plan, d’affixe zA .
−→
1. Translation : L’application F est la translation de vecteur OA, si et seulement si
f est l’application qui à z associe z + zA .
2. Homothétie : Soit r un réel. L’application F est l’homothétie de centre A et de
rapport r si et seulement si f est l’application qui à z associe le complexe f (z)
tel que f (z) − zA = r(z − zA ).
3. Rotation : Soit θ un réel. L’application F est la rotation de centre A et d’angle
θ si et seulement si f est l’application qui à z associe le complexe f (z) tel que
f (z) − zA = eiθ (z − zA ).
translation homothétie rotation

zA + r ( z − zA )
z+z
A
z zA zA zA
θ
z z zA + e iθ ( z − zA )
Figure 5 – Translation, homothétie et rotation dans le plan complexe.
Notons M (z) le point du plan d’affixe z. Si z et z 0 sont des nombres complexes,

le produit zz 0 peut être décrit comme l’unique nombre complexe tel que le triangle
(M (0), M (z 0 ), M (zz 0 )) soit semblable au triangle (M (0), M (1), M (z)) (figure 6).
M(zz’) M(z’)
M(z)
M(0) M(1)
Figure 6 – Interprétation géométrique du produit de deux complexes.
15
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit n un entier > 2. Parmi les expressions suivantes lesquelles sont égales
à n, lesquelles sont différentes et pourquoi ?
n
X
1. 1.
k=0
n−1
X
2. 1.
k=0
Xn
3. 2k/n.
k=1
n−1
X
4. 2k/(n − 1).
k=0
Xn n−1
X
5. k− h.
k=1 h=0
Xn n−1
X
6. k− h.
k=1 h=2
n−1
X n−2
X
7. k− h.
k=1 h=2
Xn
8. 1.
k=n
Xn
9. k.
k=n
Vrai-Faux 2. Soient n et k deux entiers tels que 1 6 k 6 n. Nous conviendrons que les
entiers compris entre k et n sont k, k + 1, . . . , n − 1, n. Parmi les affirmations suivantes,
1. Le nombre n!/(n − k)! est entier.
2. Le nombre k!/(n!) est entier.
3. Il y a n − k entiers compris entre k et n.
4. Il y a (n − k + 1)2 couples d’entiers compris entre k et n.

n−k+1
5. Il y a 3
triplets d’entiers, différents deux à deux, et tous compris entre
k et n.

6. Il y a n−k+13
triplets d’entiers (a, b, c) tels que a < b < c, et a, b, c compris
entre k et n.
7. La somme des entiers compris entre k et n est (n − k)(n − k + 1)/2.
16
8. La somme des entiers compris entre k et n est n(n + 1)/2 − k(k + 1)/2.
9. La somme des entiers compris entre k et n est n(n + 1)/2 − k(k − 1)/2.
10. La somme des nombres 2h pour h compris entre k et n vaut 2n+1 − 2k+1 .
11. La somme des nombres 2h pour h compris entre k et n vaut 2n+1 − 2k .
Vrai-Faux 3. Dans une course de chevaux, 10 chevaux sont au départ. Vous en choisissez
3 que vous classez pour jouer au tiercé. Parmi les affirmations suivantes, lesquelles sont
1. Il y a 3 tiercés dans le désordre.
2. Il y a 3! tiercés, dont 1 dans l’ordre.

10
3. Il y a 3
tiercés possibles.
4. Il y a 720 ordres d’arrivée possibles.
5. Il y a plus de 3 millions d’ordres d’arrivée possibles.
6. Vous avez 720 choix différents.
7. Vous avez une chance sur 120 de gagner le tiercé dans l’ordre.
8. Vous avez une chance sur 120 de gagner, soit dans l’ordre, soit dans le désordre.
Vrai-Faux 4. Parmi les égalités suivantes, lesquelles sont vraies, lesquelles sont fausses
et pourquoi ?
n
X
k 3n+1 − 1
1. 3 = .
k=0 2
n−1
3n − 1
3k =
X
2. .
k=1 2
n−1
3n − 3
3k =
X
3. .
k=1 2
n
!
n k
3 = 4n .
X
4.
k=0 k
n
!
n k
3 = 4n − 3.
X
5.
k=1 k
n−1
!
n k
3 = 4n − 3n .
X
6.
k=0 k
n
!
n k
3 = 4n − 1 − 3n.
X
7.
k=2 k
1. Tout nombre réel a pour argument 0.
17
2. Tout nombre réel strictement négatif a pour argument π.

3. Tout nombre imaginaire pur non nul a pour argument π/2 ou 3π/2.
4. Le conjugué d’un nombre imaginaire pur est égal à son opposé.
5. Si deux nombres complexes ont le même argument alors leur produit est réel.
6. Le produit de deux nombres imaginaires purs est réel.
7. Si deux nombres complexes non nuls ont le même argument alors leur quotient
est réel.
8. Si deux nombres complexes non nuls ont le même module alors leur quotient
a pour module 1.
Vrai-Faux 6. Soit z un nombre complexe non nul. Parmi les affirmations suivantes,
1. Le module de z égal au module de son conjugué.
2. L’argument de z est l’opposé de l’argument de son conjugué.
3. Le produit de z par une racine n-ième de l’unité a le même module que z.
4. L’argument de −z est l’opposé de l’argument de z.
5. Si la partie imaginaire de z est positive, alors son argument est compris entre
0 et π.
6. L’argument de z 2 est le double de l’argument de z.
7. L’argument de z/z est égal à l’argument de z 2 .
q √ q √
Vrai-Faux 7. On pose z = − 2 + 2 + i 2 − 2. Parmi les affirmations suivantes,
1. la partie réelle de z est l’opposé de sa partie imaginaire.
2. la partie réelle de z 2 est l’opposé de sa partie imaginaire.
3. l’argument de z 2 est −π/4.
4. l’argument de z 2 est 7π/4.
5. le module de z 2 est 16.
6. le module de z est 2.
7. z 2 = 4e−iπ/4 .
8. z = 2e−iπ/8 .
9. z = 2ei(7π/8) . q
√
10. cos(7π/8) = ( 2 + 2)/2.
q √
11. cos(π/8) = ( 2 + 2)/2.
q √
12. sin(7π/8) = ( 2 − 2)/2.
18
Vrai-Faux 8. A tout nombre complexe z 6= −2, on associe z 0 = (z − 4i)/(z + 2). Parmi

les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. L’ensemble des points d’affixe z tels que z 0 est réel est un cercle.
2. L’ensemble des points d’affixe z tels que z 0 est réel est une droite privée d’un
point.
3. L’ensemble des points d’affixe z tels que z 0 est imaginaire pur est un cercle
privé d’un point.
4. L’ensemble des points d’affixe z tels que |z 0 | = 1 est un cercle.
5. L’ensemble des points d’affixe z tels que |z 0 | = 1 est une droite privée d’un
point.
6. L’ensemble des points d’affixe z tels que |z 0 | = 1 est une droite.
Vrai-Faux 9. L’application qui à un point d’affixe z associe le point d’affixe iz − 1 est
(vrai ou faux et pourquoi) ?
1. une translation.
2. une homothétie de rapport i.
3. une rotation.
4. une rotation dont le centre est le point d’affixe 1.
5. une rotation dont le centre est le point d’affixe −(1 + i)/2.
6. une rotation d’angle −π/2.
Vrai-Faux 10. L’application qui à un point d’affixe z associe le point d’affixe i z est
(vrai ou faux et pourquoi) ?
1. une homothétie de rapport i.
2. une rotation.
3. une symétrie.
4. la symétrie par rapport à l’axe des ordonnées.
5. la symétrie par rapport à la première bissectrice.
2.2 Exercices
Exercice 1. Calculer les nombres suivants.
X k
3 X k
3 X
X k
3 X
X
1, h, k,
k=1 h=1 k=1 h=1 k=1 h=1
X k
3 Y k
3 Y
X k
3 X
Y
h, k, h,
k=1 h=1 k=1 h=1 k=1 h=1
Y k
3 X k
3 Y
Y k
3 Y
Y
k, h, k.
k=1 h=1 k=1 h=1 k=1 h=1
19
P Q
Exercice 2. Soient a1 , a2 , a3 , a4 quatre variables. Ecrire à l’aide des symboles et
les quantités suivantes.
1. a1 + a2 + a3 + a4 .
2. a1 + a1 a2 + a1 a2 a3 + a1 a2 a3 a4 .
3. a1 a2 + a2 a3 + a3 a4 .
4. a1 a2 a3 + a2 a3 a4 .
5. a1 a2 + a1 a3 + a1 a4 + a2 a3 + a2 a4 + a3 a4 .
6. a1 (a1 + a2 )(a1 + a2 + a3 )(a1 + a2 + a3 + a4 ).
Exercice 3. Démontrer les égalités suivantes.

n
(2k) = 2n n!.
Y
1.
k=1
n−1
Y (2n)!
2. (2k + 1) = .
k=1 2n n!
n
Y 2k + 1
3. = 2n + 1.
k=1 2k − 1
n
Y k2 − 1 (n + 1)!
4. = .
k=2 k 2n
Exercice 4. Une entreprise veut se donner un nouveau sigle, qui soit formé d’exacte-
ment 3 lettres. De combien de façons peut-elle le faire ? Combien reste-t-il de possibilités
si on impose au sigle d’être formé de lettres distinctes ?
Exercice 5. On met dans une boîte 26 jetons de Scrabble, portant chacune des lettres
de l’alphabet. On en tire 3 à la fois. Combien de tirages différents peut-on obtenir ?
Exercice 6. Dix personnes doivent s’asseoir autour d’une table circulaire. On considère
comme identiques deux dispositions dont l’une se déduit de l’autre par une rotation.
Combien y a-t-il de dispositions possibles ? Combien en reste-t-il si deux personnes
données refusent d’être assises à côté ?
Exercice 7. Une association comprenant 20 membres dont 12 femmes et 8 hommes

désire former un comité de 5 personnes, dans lequel doivent se trouver au moins deux
hommes et deux femmes. Calculer de combien de façons on peut former ce comité dans
chacun des cas suivants.
1. Chaque membre de l’association accepte d’en faire partie.
2. Deux des femmes refusent d’en faire partie.
3. Monsieur X et Madame Y refusent de siéger ensemble.
20
n
X n(n + 1)
1. (n − k) = .
k=0 2
n
X (n + 1)(n + 2)
2. (k + 1) = .
k=0 2
n
(2k + 1) = (n + 1)2 .
X
3.
k=0

n
2k = 2n+1 − 1.
X
1.
k=0
n−1
2k = 2n − 2.
X
2.
k=1
2n−1
X
k/2 2n − 1
3. 2 = √ .
k=0 2−1
2n
42n+1 − 1
22k−1 =
X
4. .
k=0 6
n
2k 3n−k = 3n+1 − 2n+1 .
X
5.
k=0
n
2n+1 − (−1)n+1
(−1)k 2n−k =
X
6. .
k=0 3

n
!
n
= 2n .
X
1.
k=0 k
n
!
X
k n
2. (−1) = 0.
k=0 k
n
!
2n
= 22n−1 (ajoutez les deux égalités précédentes).
X
3.
k=0 2k
n
!
k n
= 3n .
X
4. 2
k=0 k
n
!
n
3k−1
= 9n /2.
X
5. 2
k=0 k
n
!
3k n−2k n
= (17/3)n .
X
6. 2 3
k=0 k
n
!
k n
= 2n/2 eniπ/4 .
X
7. i
k=0 k
21
n
!
n
3k/2 ik = 2n eniπ/3 .
X
8.
k=0 k
n
X n(n − 1)(n + 2)
9. (nk − 1) = .
k=1 2
Exercice 11. Calculer les sommes suivantes.
n+4
X
1. (k − 2).
k=3
n
!
X n 2k+1 n−3k
2. 3 2 .
k=0 k
Exercice 12. Soit n ∈ N et f (x) = (1 + x)n .
1. En utilisant une formule du cours, écrivez f (x) comme une somme où inter-
viennent les puissances de x.
2. La dérivée de f est f 0 (x) = n(1 + x)n−1 . L’intégrale de f sur [0, 1] vaut
#1
(1 + x)n+1 2n+1 − 1
Z 1 "
f (x)dx = = .
0 n+1 0
n+1
En utilisant la question 1. donner une autre expression de f 0 (x) et de cette inté-
grale.
3. En déduire les valeurs des expressions suivantes :
n n n
! ! !
X n X n X 1 n
, k , .
k=0
k k=0
k k=0 k + 1
k
Exercice 13. Soient n et p deux entiers naturels. Cet exercice présente une méthode
générale pour calculer nk=0 k p , sur le cas particulier p = 2.
P
1. Soit x → P (x) une fonction, donner une expression plus simple de nk=0 (P (k +
P
1) − P (k)).
2. Soit a, b, c des réels et P (x) = ax3 + bx2 + cx. Calculer P (x + 1) − P (x).
3. Déterminer a, b, c de sorte que P (x + 1) − P (x) = x2 .
4. Déduire des questions précédentes que
n
n(n + 1)(2n + 1)
k2 =
X
.
k=0 6
Exercice 14. Le but de l’exercice est de démontrer que pour tout nombre entier naturel
n non nul, et pour tout n-uplets de réels (a1 , . . . , an ) ∈ Rn , (b1 , . . . , bn ) ∈ Rn on a
l’inégalité de Cauchy-Schwarz :
n
!2 n
! n
!
a2i b2i
X X X
ai b i 6 ×
i=1 i=1 i=1
22
n n n
a2i , b2i ,
X X X
On pose A = B= C= ai b i .
i=1 i=1 i=1
n
(ai x + bi )2 . Exprimez P (x) en fonction de A, B, C et x.
X
1. Soit P (x) =
i=1
2. Si A 6= 0, quel est le signe du trinôme du second degré P ?
3. Déduisez que C 2 6 AB.
4. Soit (a1 , . . . , an ) un n-uplet de réels strictement positifs. Montrez que
n n
! !
1
> n2
X X
ai ×
i=1 i=1 ai
Exercice 15. Mettre sous la forme a + ib les nombres complexes suivants.

3 + 6i 5 + 2i −2 1 + 2i
, , √ , ,
3 − 4i 1 − 2i 1−i 3 1 − 2i
2 √ !2
1+i 3 + 6i 2 + 5i 2 − 5i 1 + i − 3(1 − i)

+ , + , .
2−i 3 − 4i 1−i 1+i 1+i
Exercice 16. Calculer le module et l’argument des nombres complexes suivants.
√ √
1 + i , 3 + 3i , 1 + i 3 , −1 + i 3 ,
√ 4 √ √
3 + i , − i , 1 + i(1 + 2) , (1 + 2) − i .
3
Exercice 17. Mettre sous la forme a + ib les nombres complexes suivants.
2e2iπ/3 , 3eiπ/8 , 2e−7iπ/3 , 3e−7iπ/8 ,
2eiπ/4
(2eiπ/4 )(e−3iπ/4 ) ,
e−3iπ/4
2eiπ/3
(2eiπ/3 )(3e−5iπ/6 ) ,
3e−5iπ/6
Exercice 18. Effectuer les calculs suivants en utilisant la forme exponentielle.
1+i

1+i
3 √
, , (1 + i 3)4
1−i 1−i
√ √ √
√ √ 1+i 3 6−i 2
(1 + i 3) + (1 − i 3)5 ,
5
√ ,
3−i 2 − 2i
Exercice 19. Calculer les racines carrées des nombres suivants.
√
−1 , i , 1 + i , −1 − i , 1 + i 3
3 + 4i , 8 − 6i , 7 + 24i , 3 − 4i , 24 − 10i
23
Exercice 20.
√
1. Calculer les racines carrées de (1 + i)/ 2. En déduire les valeurs de cos(π/8) et
sin(π/8).
√
2. Calculer les racines carrées de ( 3 + i)/2. En déduire les valeurs de cos(π/12) et
sin(π/12).
Exercice 21. Résoudre dans C les équations suivantes.
z2 + z + 1 = 0 , z2 − z + 1 = 0 , z 2 + 2z + 4 = 0 ,
4z 2 − 2z + 1 = 0 , z 2 + (1 + 2i)z + i − 1 = 0 , z 2 − (3 + 4i)z − 1 + 5i = 0 ,
z 2 + 4z + 5 = 0 , z 2 − (1 − i)z − i = 0 , z 2 − (11 − 5i)z + 24 − 27i = 0 ,
−1 + i
z3 = i , z3 = , z 3 = 2 − 2i ,
4
√
2z + 1 4

z4 = 1 , z 4 = (−1 + i 3)/2 , =1.
z−1
Exercice 22. Soit θ un réel.
n n n
eikθ . En déduire les valeurs de
X X X
1. Calculer la somme cos(kθ) et sin(kθ).
k=0 k=0 k=0
n n
! !
X n ikθ X n
2. Calculer la somme e . En déduire les valeurs de cos(kθ) et
k=0 k k=0 k
n
!
X n
sin(kθ).
k=0 k
Exercice 23. Linéariser :
cos3 (x) , sin3 (x) , cos4 (x) , sin4 (x) ,
cos2 (x) sin2 (x) , cos(x) sin3 (x) , cos3 (x) sin(x) ,
cos3 (x) sin2 (x) , cos2 (x) sin3 (x) , cos(x) sin4 (x) .
Exercice 24.
1. Déterminer l’ensemble des complexes z tels que (1 − z)/(1 − iz) soit réel.
2. Déterminer l’ensemble des complexes z tels que (1 − z)/(1 − iz) soit imaginaire
pur.
3. Déterminer l’ensemble des complexes z tels que les points d’affixe 1, z, 1 + z 2
soient alignés.
4. Déterminer l’ensemble des complexes z tels que les points d’affixe z, iz, i forment
un triangle équilatéral.
24
5. Déterminer l’ensemble des complexes z tels que les points d’affixe z, z 2 , z 3 forment
un triangle rectangle au point d’affixe z.
6. Déterminer l’ensemble des complexes z tels que les points d’affixe z, 1/z, 1 − z
soient sur un même cercle, de centre l’origine.
Exercice 25.
1. Montrer que (1 + i)6 = −8i.
2. En déduire une solution de l’équation (E) z 2 = −8i.
3. Ecrire les deux solutions de (E) sous forme algébrique, et sous forme exponen-
tielle.
4. Déduire de la première question une solution de l’équation (E 0 ) z 3 = −8i.
5. Soit A le point d’affixe 2i. Soit B l’image de A par la rotation de centre O et
d’angle 2π/3. Soit C l’image de B par la même rotation. Ecrire les affixes des
points B et C, sous forme exponentielle, puis sous forme algébrique.
6. Vérifier que les affixes calculées à la question précédente sont solution de (E 0 ).
7. Montrer que le triangle ABC est équilatéral et que O est son centre de gravité.
Exercice 26. On note j le nombre complexe e2iπ/3 . On pose a = 8, b = 6j et c = 8j 2 .
On note A, B et C les points d’affixes respectives a, b et c. On note
• A0 l’image de B par la rotation de centre C, et d’angle π/3
• B 0 l’image de C par la rotation de centre A, et d’angle π/3
• C 0 l’image de A par la rotation de centre B. et d’angle π/3
On note a0 , b0 et c0 les affixes respectives de A0 , B 0 et C 0 .
1. Calculer a0 , b0 et c0 .
2. Montrer que les droites AA0 , BB 0 et CC 0 sont concourantes en 0.
3. Montrer que j 3 = 1 et 1 + j + j 2 = 0
4. Soit z un nombre complexe quelconque. Montrer que
|(a − z) + (b − z)j 2 + (c − z)j| = 22
5. On admet que quels que soient les nombres complexes z et z 0 , |z + z 0 | 6 |z| + |z 0 |.

Montrer que la somme de distances M A + M B + M C est minimale lorsque
M = O.
2.3 QCM
rapporte 2 points.
25
Question 1.
1
X
A 1 = 1.
k=0
X1
B k = 1.
k=0
Y1
C k = 1.
k=0
Y1
D 1 = 1.
k=0
X10
E 1 = 10.
k=0
Question 2. Soit n un entier naturel.

2n
X
A 2 = 2n.
k=n
X2n
B 2 = 4n + 2.
k=0
2n
2 = 22n .
Y
C
k=0
X2n
D 2k = 2n(2n + 1).
k=0
2n
Y
E 2(k + 1) = (2n)!.
k=0
Question 3. Soient
! n et k deux entiers.
n+k n!
A = .
n ! k!(n + k)! ! !
n+k n+k−1 n+k−1
B = + .
n ! n !
k−1 !
n+k n+k−1 n+k−1
C = + .
n ! n !
k
n+k n+k n+k−1
D = .
n ! n n !
n+k n+k n+k−1
E = .
n k n
Question 4. Un jeu de tarot comprend 78 cartes, dont 21 atouts. À cinq joueurs, chacun
reçoit 15 cartes, et! 3 cartes constituent le « chien ».
78
A Il y a chiens différents possibles.
3
26
!
57
B Il y a chiens différents ne contenant aucun atout.
3!
78
C Il y a chiens différents contenant le « petit » (atout numéro 1).
2! !
21 57
D Il y a chiens différents contenant au moins un atout.
1! 2!
21 76
E Il y a chiens différents contenant au moins deux atouts.
2 1
Question 5. Soit n un entier naturel.
2n
2k = 4n − 2n .
X
A
k=n
n
3n+1 − 9
3k =
X
B .
k=2 2
2n
2k = 4n+1 − 8.
X
C
k=2
2n
4
4k = (16n − 1).
X
D
k=1 3
2n
3k = 3(9n ) − 3n .
X
E
k=n
Question 6. Soit
! n un entier naturel.
n
n k
2 = 3n .
X
A
k=0 k
n
!
n k
3 = 2n .
X
B
k=0 k
2n
!
2n
(−3)k = 22n .
X
C
k=0 k
2n+1
!
X 2n + 1
D (−2)k = 1.
k=0 k
n
!
n
(−2)k 3−k = 1.
X
E
k=0 k
Question 7.
A |1 + i| = 2.
π
B arg(1 − i) = − .
2
5π
C arg(−1 − i) = .
4
D |3 + 4i| = 5.
π
E arg(1 + 3i) = .
3
27
Question 8.
A i23 = −i.
B (1 + i)9 = (1 + i).
√
C (1 + 3i)9 = 512i.
D (1 − i)10 = −32i.
√
E ( 3 + i)6 = 64.
Question 9.
A L’ensemble des points du plan complexe tels que |z − i| = |z + 1| est un cercle.
B L’ensemble des points du plan complexe tels que |z − i| = |z + i| est l’axe des
réels.
C L’ensemble des points du plan complexe tels que |z − i| = |1 + i| est une droite.
D L’ensemble des points du plan complexe tels que |z + 1| = |1 + i| est un cercle.
E L’ensemble des points du plan complexe tels que |z − i| = |2z + i| est une droite.
Question 10.
A L’application qui au point M d’affixe z associe le point M 0 d’affixe z 0 = 1 − iz
est une homothétie.
B L’application qui au point M d’affixe z associe le point M 0 d’affixe z 0 = 1 − iz
est une rotation dont le centre a pour affixe 1.
C L’application qui au point M d’affixe z associe le point M 0 d’affixe z 0 = (1 − i)z
est une rotation d’angle −π/2.
D L’application qui au point M d’affixe z associe le point M 0 d’affixe z 0 = 1 − iz
est une rotation d’angle −π/2. √
E L’application qui au point M d’affixe z associe le point M 0 d’affixe z 0 = 22 (1 −
i)z est une rotation dont le centre est l’origine du plan complexe.
Réponses : 1–BD 2–BD 3–CE 4–AB 5–BD 6–AC 7–CD 8–AD 9–BD 10–DE
2.4 Devoir
répondu.
Questions de cours : Soit f une fonction de N dans C∗ . Pour tout n ∈ N, on note :
n
X n
Y
Sn = f (k) et Pn = f (k) .
k=0 k=0
1. Soient n et m deux entiers tels que n < m. Exprimer à l’aide de Sn et Sm la

m
X m
Y
somme f (n). Exprimer à l’aide de Pn et Pm le produit f (k).
k=n+1 k=n+1
28
2. Soient n et m deux entiers tels que n 6 m. Montrer que pour tout complexe z
différent de 1 : m
z n − z m+1
zk =
X
.
k=n 1−z
3. Soit n un entier naturel. Montrer que :
2n
X 3
k = n(n + 1) .
k=n 2
4. En déduire que, pour tout réel positif ou nul x :

2n √ n(n+1)
xk =
Y
x3 .
k=n
5. Soient n et m deux entiers tels que 1 6 n 6 m. Montrer que :

m
!
Y m
k= (m − n + 1)! .
k=n n−1
Exercice 1 : Soit n un entier strictement positif.

1. Montrer que :
n−1 n
k 2 (k + 1) = h(h − 1)2 .
X X
k=0 h=1
n
k 2 (k + 1) − k(k − 1)2 = n2 (n + 1) .
X
k=0
n
n(n + 1)(2n + 1)
k2 =
X
.
k=0 6
4. Redémontrer le résultat de la question précédente, par récurrence sur n.
Exercice 2 : Soit n un entier naturel et k un entier strictement positif. On appelle
partition de n en k entiers un k-uplet d’entiers (n1 , . . . , nk ) tels que n1 + · · · + nk = n.
Par exemple, (2, 3, 0, 5) est une partition de 10 en 4 entiers et (3, 5, 2, 0) en est une
autre, différente de la précédente. On note Pn,k le nombre de partitions de n en k
entiers.
1. En énumérant tous les cas possibles, montrer que pour tout n ∈ N et pour tout
k ∈ N∗ :
k(k + 1)
Pn,1 = 1 , Pn,2 = n + 1 , P0,k = 1 , P1,k = k , P2,k = .
2
29
2. Montrer qu’il y a Pn,k−1 partitions de n en k entiers (n1 , . . . , nk ), qui sont telles

que n1 = 0. Montrer qu’il y en a Pn−1,k qui sont telles que n1 > 0. En déduire
que :
Pn,k = Pn,k−1 + Pn−1,k .
3. En déduire que pour tout n ∈ N et pour tout k ∈ N∗ :
! !
n+k−1 n+k−1
Pn,k = = .
k−1 n
4. On considère n + k − 1 étiquettes alignées sur une table. On en choisit k − 1 sur

lesquelles on écrit le mot « barrière ». Sur les n autres, on écrit le mot « unité ».
Une fois ce choix effectué, on note :
• n1 le nombre d’unités à gauche de la première barrière,
• ni le nombre d’unités entre la (i−1)-ième et la i-ième barrière, pour i = 2, . . . , k,
• nk le nombre d’unités à droite de la k-ième barrière.
Vérifier que (n1 , . . . , nk ) est une partition de n en k entiers. Réciproquement,
vérifier qu’à chaque partition de n en k entiers, on peut associer un choix de k − 1
objets parmi n + k − 1, et un seul. Retrouver le résultat de la question précédente.
Exercice 3 :
1. Déterminer les racines carrées de −i dans C, sous forme exponentielle (ρeiθ ) et
sous forme algébrique (a + ib). (On rappelle que les racines carrées de −i sont les
nombres complexes z tels que z 2 = −i).
2. Soit ∆ le nombre complexe ∆ = −50i. Déterminer les racines carrées de ∆ dans
C, sous forme algébrique.
3. Déterminer, sous forme algébrique, les deux solutions complexes de l’équation :
z 2 + 3(1 − i)z + 8i = 0 .
4. Soit A le point du plan complexe d’affixe 2 + 2i. Soient B et C les points du

plan complexe ayant pour affixes les solutions calculées à la question précédente.
Représenter les trois points A, B, C dans le plan complexe. Démontrer que le
triangle ABC est rectangle en A
√
5. Soit M le milieu du segment [B, C], et C le cercle de centre M et de rayon 5 2/2.
Montrer que les trois points A, B, C appartiennent au cercle C.
6. Soit O l’origine du plan complexe. Calculer les affixes des images de A, B, C par
la rotation de centre O et d’angle −π/4.
7. Calculer les affixes des images de A, B, C par l’homothétie de centre M et de
rapport −1.
30

1.
m m n
! !
X X X
f (k) = f (k) − f (k) = Sm − Sn .
k=n+1 k=0 k=0
m m n
! !
Y Y Y Pm
f (k) = f (k) / f (k) = .
k=n+1 k=0 k=0 Pn
2. Pour tout complexe z différent de 1, la somme de 0 à m des z k s’écrit :
m
1 − z m+1
zk =
X
.
k=0 1−z
D’où le résultat pour n = 0. Pour n > 0 :
m m n−1
1 − z m+1 1 − z n z n − z m+1
! !
k k k
X X X
z = z − z = − = .
k=n k=0 k=0 1−z 1−z 1−z
3. On connaît la somme des n premiers entiers :
n
X n(n + 1)
k= .
k=1 2
On en déduit :
2n 2n n−1
! !
X X X 2n(2n + 1) (n − 1)n 3
k= k − k = − = n(n + 1) .
k=n k=1 k=1 2 2 2
4.
2n P2n 3
3
n(n+1) √ n(n+1)
xk = x k
= x 2 n(n+1) = x 2
Y
k=n = x3 .
k=n
5. La formule est vraie pour n = 1, puisque dans ce cas :
m
!
Y m
k = m! et =1.
k=1 0
Pour n > 1 :
m m n−1
! !
Y Y Y
k = = k / k
k=n k=1 k=1
m!
=
(n − 1)!
m!
= (m − n + 1)!
(n − 1)!(m − n + 1)!
!
m
= (m − n + 1)! .
n−1
31
Exercice 1 : Soit n un entier strictement positif.

1. Si on pose h = k + 1, alors k 2 (k + 1) = h(h − 1)2 , et :
n−1 n
2
h(h − 1)2 .
X X
k (k + 1) =
k=0 h=1
2.
n n−1 n
k 2 (k + 1) − k(k − 1)2 = n2 (n + 1) + k 2 (k + 1) − k(k − 1)2 .
X X X
k=0 k=0 k=1
D’après la question précédente, les deux sommes du membre de droite sont égales.
D’où le résultat.
3. n n n n
2 2 2 2
k = n2 (n + 1) .
X X X X
k (k + 1) − k(k − 1) = 3k − k = 3 k −
k=0 k=0 k=0 k=0
Donc :
n
!
2 1 n(n + 1) n(n + 1)(2n + 1)
n2 (n + 1) +
X
k = = .
k=0 3 2 6
4. Pour tout entier n, notons H(n) l’hypothèse de récurrence :
n
n(n + 1)(2n + 1)
k2 =
X
H(n) : .
k=0 6
Elle est vraie pour n = 0, puisque dans ce cas la somme est nulle. Supposons que
H(n) est vraie.
n+1 n
2 2
k2
X X
k = (n + 1) +
k=0 k=0
n(n + 1)(2n + 1)
= (n + 1)2 +
6
n+1

= 6n + 6 + 2n2 + n
6
(n + 1)(n + 2)(2n + 3)
= .
6
Donc H(n + 1) est vraie, donc par récurrence, H(n) est vraie pour tout n ∈ N.
Exercice 2 :
1. Le seul 1-uplet dont la somme vaut n est (n), donc Pn,1 = 1. Les couples d’entiers
dont la somme vaut n sont :
(0, n) , (1, n − 1) , . . . , (n − 1, 1) , (n, 0) .
32
Il y en a autant que d’entiers entre 0 et n, soit Pn,2 = n + 1. Il n’y a qu’un k-uplet

d’entiers dont la somme vaut 0 : (0, 0, . . . , 0), donc P0,k = 1. Les k-uplets d’entiers
dont la somme vaut 1 sont :
(1, 0, . . . , 0) , (0, 1, 0, . . . , 0) , . . . (0, . . . , 0, 1, 0) , (0, . . . , 0, 1) .
Donc P1,k = k. Les k-uplets d’entiers dont la somme vaut 2 sont ceux dont une
des coordonnées vaut deux, et
tous ceux qui ont deux coordonnées égales à 1. Il
y en a k du premier type et k2 du second. :
k(k − 1) k(k + 1)
P2,k = k + = .
2 2
2. Si (0, n2 , . . . , nk ) est une partition de n en k entiers, alors (n2 , . . . , nk ) est une

partition de n en k −1 entiers. Réciproquement, si (n1 , . . . , nk−1 ) est une partition
de n en k entiers, alors (0, n1 , . . . , nk−1 ) est une partition de n en k entiers. Il y a
donc exactement Pn,k−1 partitions de n en k entiers, dont la première coordonnée
est nulle.
Si (n1 , . . . , nk ) est une partition de n en k entiers, et si n1 > 0, alors (n1 −1, . . . , nk )
est une partition de n − 1 en k entiers. Réciproquement si (n1 , . . . , nk ) est une
partition de n − 1 en k entiers, alors (n1 + 1, . . . , nk ) est une partition de n
en k entiers, dont la première coordonnée est strictement positive. Il y a donc
exactement Pn−1,k partitions de n en k entiers, dont la première coordonnée est
strictement positive.
Toutes les partitions de n ont leur première coordonnée soit nulle, soit strictement
positive. Donc :
Pn,k = Pn,k−1 + Pn−1,k .
3. Nous allons le démontrer par récurrence sur n, à partir de la formule précédente.
Posons comme hypothèse de récurrence :
!
∗ n+k−1
H(n) : ∀k ∈ N , Pn,k = .
k−1
D’après la première question, H(0) est vraie. Supposons que H(n − 1) est vraie.
Nous allons montrer, par récurrence sur k, que H(n) est vraie. Pour n fixé, notons
H 0 (k) l’hypothèse de récurrence sur k :
!
0 n+k−1
H (k) : Pn,k = .
k−1
D’après la première question, H 0 (1) est vraie, puique Pn,1 = 1. Supposons que
33
H 0 (k − 1) soit vraie. Alors :

Pn,k = Pn,k−1 + Pn−1,k
! !
n+k−2 n+k−2
= +
k−2 k−1
!
n+k−1
= ,
k−1
en utilisant la formule du triangle de Pascal. L’hypothèse H 0 (k) est donc vraie
pour tout entier k > 1, donc H(n) est vraie pour tout n ∈ N.
4. Sur les n + k − 1 étiquettes, on a choisi en tout k − 1 barrières, et n unités.
Le n-uplet d’entiers (n1 , . . . , nk ) est donc bien une partition de l’entier n en k
entiers. Réciproquement, soit (n1 , . . . , nk ) une partition de n en k entiers. Plaçons
n1 étiquettes marquées « unité » sur la table, puis une marquée « barrière », puis
n2 marquées « unité », puis une marquée barrière, etc. À la fin, on place la k − 1-
ième étiquette marquée « barrière », puis nk marquées « unité ». Au total, on a
placé n + k − 1 étiquettes, parmi lesquelles n sont marquées « unité » et k − 1
« barrière ». On a donc défini un choix de k − 1 objets parmi n + k − 1.
Nous avons montré qu’il y a exactement autant de partitions de n en k entiers,
qu’il y a de choix de k − 1 objets parmi n + k − 1.
!
n+k−1
Pn,k = .
k−1
Exercice 3 :
1. Sous forme exponentielle, −i s’écrit e3iπ/2+2ikπ , pour tout k ∈ Z. Les deux nombres
dont le carré vaut −i sont e3iπ/4 et e7iπ/4 . Sous forme algébrique :
√ √ √ √
3iπ/4 2 2 7iπ/4 2 2
e =− +i et e = −i .
2 2 2 2
√ 2
2. Le nombre ∆ s’écrit ∆ = 5 2 (−i). Ses racines carrées sont celles de −i,
√
multipliées par 5 2, soit :
−5 + 5i et 5 − 5i .
3. Le discriminant de cette équation est :
2
3(1 − i) − 4(8i) = −18i − 32i = −50i = ∆ .
Les deux solutions sont :
1 1

− 3 + 3i + (−5 + 5i) et − 3 + 3i + (5 − 5i) ,
2 2
soit :
−4 + 4i et 1 − i
34
A
M
O
B
Figure 7 – Triangle rectengle et cercle circonscrit.
4. Figure 7.
Soient zA , zB , zC les affixes respectives des points A, B, C.
zA = 2 + 2i , zB = 1 − i , zC = −4 + 4i .
Pour démontrer que le triangle ABC est rectangle en A, il suffit de démontrer

que le nombre complexe (zB − zA )/(zC − zA ) a pour argument π/2 modulo π,
c’est-à-dire que c’est un imaginaire pur.
zB − zA −1 − 3i i
= = .
zC − zA −6 + 2i 2
5. Le point M a pour affixe :
zB + zC 3 3
zM = =− + i.
2 2 2
Le cercle C est l’ensemble des points dont l’affixe z vérifie :
√
5 2
|z − zM | = .
2
Pour montrer que A, B, C appartiennent au cercle C, il suffit de √ vérifier que les
trois modules |zA − zM |, |zB − zM | et |zC − zM | sont égaux à 5 2/2. Or :
s √
7 1 49 1 5 2
zA − zM = + i =⇒ |zA − zM | = + = ,
2 2 4 4 2
s √
5 5 25 25 5 2
zB − zM = − i =⇒ |zB − zM | = + = ,
2 2 4 4 2
s √
5 5 25 25 5 2
zC − zM = − + i =⇒ |zC − zM | = + = .
2 2 4 4 2
35
6. L’image du point d’affixe z par la rotation de centre O et d’angle −π/4 est le

point d’affixe z 0 tel que z 0 = e−iπ/4 z. Les images respectives de A, B et C sont
les points d’affixes :
√ √ √
zA0 = 2 2 , zB0 = −i 2 , zC0 = 4i 2 .
7. L’image du point d’affixe z par l’homothétie de centre M et de rapport −1 est le

point d’affixe z 0 tel que z 0 = zM − (z − zM ). Comme M est le milieu du segment
[B, C], l’image de B est C et l’image de C est B. L’image de A est le point
d’affixe :
3 3 7 1

zA0 = − + i − + i = −5 + i .
2 2 2 2
36
3 Compléments
3.1 Qu’on m’aille quérir M. Viète
Au service successivement de Charles IX, Henri III, puis Henri IV, François Viète
(1540–1603) était plus connu de son vivant comme avocat, membre du conseil du Roi,
maître des requêtes, que comme mathématicien. Pourtant il est l’un des premiers à
avoir systématisé l’usage des lettres pour symboliser des variables, ouvrant ainsi la
voie au calcul algébrique moderne. À partir de 1591, Viète commence à publier, à ses
frais et à l’usage de ses amis, l’exposé systématique de sa théorie mathématique, qu’il
nomme « logistique spécieuse » (de specis : symbole) ou art du calcul sur des symboles.
Il développe d’abord les fondements de cette nouvelle algèbre dans son « Isagoge »,
puis en donne la même année des applications essentielles dans ses « Zététiques ».
D’autres livres viendront compléter l’exposé de cette théorie, qui permet de résoudre
des familles d’équations algébriques de degré 2 à 4 en donnant un sens géométrique à ces
résolutions. Dans un premier temps, Viète recommande de noter toutes les grandeurs
en présence, ainsi que leurs relations, en utilisant son symbolisme, puis de résumer le
problème sous forme d’une équation. La notation de Viète est loin de celle que nous
utilisons : il n’avait pas de signe pour l’égalité, ni pour la multiplication, ni pour les
opérateurs de comparaison, et surtout il avait fait le choix de noter les paramètres par
des consonnes et les inconnues par des voyelles, ce qui rendait le texte peu lisible. Le
choix des premières lettres a, b, c pour les paramètres et des dernières x, y, z pour les
inconnues est celui de Descartes, un demi-siècle après Viète.
À partir de 1588, la fonction principale de Viète est de décrypter les codes secrets
ennemis, et ses succès donnent un avantage réel à la diplomatie française. Dans deux
de ses lettres à Henri IV, le mathématicien s’y déclare explicitement « interprète et
déchiffreur du Roy ». En 1590, pour des raisons diplomatiques, et sans doute avec
l’aval d’Henri IV, il publie une lettre du commandeur Moreo au Roi d’Espagne, qu’il
a déchiffrée. Furieux de voir son code découvert, Philippe II porte plainte auprès du
Pape, accusant le roi de France d’user de magie et Viète d’être un nécromant. Le Pape,
dont les services décodaient les lettres espagnoles depuis plusieurs années, s’empressa
de ne pas donner suite, et l’on rit beaucoup à la cour de France. . . Du moins est-
ce ainsi que l’on raconte l’histoire habituellement, aux dépens des espagnols. Peut-être
est-ce un peu rapide : l’homologue de Viète auprès de Philippe II, Luis Valle del Cerdo,
ne se privait pas pendant ce temps de déchiffrer les lettres d’Henri IV ! Toujours est-il
que le mémoire de Viète, adressé à Sully quelques jours avant sa mort et décrivant sa
méthode pour le déchiffrement des codes espagnols, est considéré comme un des textes
fondateurs de la cryptologie.
Une anecdote montre la haute estime en laquelle Henri IV tenait son déchiffreur ;
elle est rapportée par Tallemant des Réaux.
Du temps d’Henri IV, un Hollandais, nommé Adrianus Romanus, savant
aux mathématiques, mais non pas tant qu’il croyait, fit un livre où il mit
37
une proposition qu’il donnait à résoudre à tous les mathématiciens de l’Eu-

rope ; or, en un endroit de son livre il nommait tous les mathématiciens de
l’Europe, et n’en donnait pas un à la France. Il arriva peu de temps après
qu’un ambassadeur des États vint trouver le Roi à Fontainebleau. Le Roi
prit plaisir à lui en montrer toutes les curiosités, et lui disait les gens excel-
lents qu’il y avait en chaque profession dans son royaume. « Mais, Sire, –
lui dit l’ambassadeur – vous n’avez point de mathématiciens, car Adrianus
Romanus n’en nomme pas un de français dans le catalogue qu’il en fait.
« Si fait, si fait – dit le Roi – j’ai un excellent homme : qu’on m’aille qué-
rir M. Viète. » M. Viète avait suivi le conseil, et était à Fontainebleau ; il
vient. L’ambassadeur avait envoyé chercher le livre d’Adrianus Romanus.
On montre la proposition à M. Viète, qui se met à une des fenêtres de la
galerie où ils étaient alors, et avant que le roi en sortît, il écrivit deux so-
lutions avec du crayon. Le soir il en envoya plusieurs à cet ambassadeur,
et ajouta qu’il lui en donneroit tant qu’il lui plairait, car c’était une de ces
propositions dont les solutions sont infinies.
Ut legi, ut solvi (aussitôt lu, aussitôt résolu) commente sobrement Viète.
3.2 L’homme qui savait tout. . . ou pas

Athanase Kircher (1601–1680) est-il né un siècle ou deux trop tard ? S’il avait été
contemporain de Nostradamus (1503–1566) ou bien de Giovanni Pico de la Mirandola
(1463–1494), peut-être aurait-il éclipsé ses illustres prédécesseurs, tant son savoir sem-
blait infini. Optique, géologie, astronomie, égyptologie, acoustique, sinologie, kabbale,
alchimie. . . rares sont les domaines qu’il n’ait pas gratifié de quelques milliers de pages
richement illustrées. Oui mais voilà : en ce xviie siècle où Galilée, Pascal, Descartes
et bien d’autres luttaient pour mettre au monde l’esprit scientifique, savoir sans com-
prendre, affirmer sans justifier était passé de mode. Or, si le savoir de Kircher semblait
n’avoir aucune limite, son imagination et son aplomb pour asséner les énormités les
plus invraisemblables allaient de pair. Crédulité, naïveté extrême, mégalomanie ? Voici
ce que lui écrivit F. Redi après la parution d’un de ses ouvrages sur la Chine (où il
n’avait jamais mis les pieds, contrairement aux missionnaires dont il avait plagié les
récits).
Vous soutenez que dans les mers de la Chine on pêche certains poissons à
écailles de couleur safran, qui tout l’hiver habitent dans l’eau, mais le prin-
temps arrivé, ayant jeté leurs écailles, se recouvrent de plumes, et ouvrant
leurs ailes, s’envolent vers les forêts des montagnes où ils vivent tout l’été et
l’automne, à la fin duquel ils retournent s’ébrouer dans les eaux, reprenant
leur ancienne forme de poisson. Bien que vous-même, illustre Père, dans
votre livre de la Chine illustrée, montrez clairement de le croire, moi au
contraire, je suis d’avis qu’au fond de votre cœur vous ne le croyez pas, et
que vous avez seulement le but de montrer le mieux possible la hauteur
38
de votre intelligence, et la profondeur de votre doctrine, méditant et ra-

contant les causes de ces métamorphoses successives, en espérant qu’elles
soient vraies et peu distantes des habituelles lois de la nature.
Descartes était plus expéditif : « Ledit [Kircher] a quantité de forfanteries, et est plus
charlatan que savant ». Il faut tout de même rendre à Kircher cette justice : dans un
siècle passionnément religieux, où la gaudriole n’était pas toujours de mise, le « bon
Père Athanase » a fourni maints sujets de rigolade. Contemporain de Kircher, Molière
(Les Précieuses ridicules, Le Bourgeois gentilhomme, Les Femmes savantes) avait cer-
tainement en tête quelques modèles bien réels, mais il ne les a pas dévoilés. D’autres
n’eurent pas sa retenue. Quand J.B. Mencke publie en 1721 « De la charlatanerie des
savans », augmenté des remarques critiques (et jubilatoires) de divers autres auteurs,
Kircher est une cible de choix.
On dit qu’à Rome, une jeunesse badine, ayant résolu de se divertir aux dé-
pens de ce Jésuite, grava plusieurs figures fantasques sur une pierre informe,
qu’ils enterrèrent dans un endroit, où ils savaient qu’on devait bâtir dans
peu. Qu’arriva-t-il ? Bientôt les ouvriers s’assemblent ; bientôt on creuse la
terre pour jeter les fondements du nouvel édifice, et bientôt on rencontre la
pierre, ce nouveau reste de l’Antiquité ; monument d’autant plus admirable,
que la fureur du temps l’a respecté tout entier. On cherche un Oedipe ; c’est
le Père : on lui présente la pierre. À ce spectacle, il sent des transports de
joie qui ne se peuvent dire, il saute, il trépigne, et comme s’il était inspiré
d’Apollon, il fait à l’instant le plus beau discours du monde, sur la signifi-
cation des croix, des lignes, des cercles, et de tous les traits irréguliers, dont
la pierre était chargée : jamais tant d’éloquence, ni tant d’érudition.
Vous vous doutez bien que les mathématiques (qu’il enseignait) n’allaient pas échap-
per à la production d’un esprit aussi universel. Après une « démonstration » de la qua-
drature du cercle qui fit bien rire les mathématiciens de l’Europe, il récidiva quelques
années plus tard en publiant son « Ars Magna Sciendi, sive Combinatoriae » : quelque
500 pages d’élaborations fumeuses pillant sans trop de vergogne les travaux de Ramón
Llull (antérieurs de plus de trois siècles). À la page 157 de cet ouvrage mémorable,
on trouve une « Table générale, de laquelle les conjugaisons possibles de toutes choses
peuvent se calculer simplement ». Suit la liste des valeurs de n!, pour n allant de 1 à
50. Devinez quoi ? Ces valeurs sont fausses à partir de la 39e. Euh. . . avant de ricaner,
essayez donc de calculer 50! à la main sans vous tromper !
3.3 Triangle de Pascal, binôme de Newton et poésie védique

Dans le chapitre IV de son « Traité du Triangle Arithmétique », Pascal expédie
en deux pages l’utilisation des coefficients binomiaux pour calculer des puissances de
binômes, puis il conclut : « Je ne donne pas la démonstration de tout cela, parce que
d’autres en ont déjà traité, comme Hérigone, outre que la chose est évidente d’elle-
même. »
39
Pascal n’a jamais prétendu avoir inventé son triangle, qui était connu en Europe
depuis plus d’un siècle : il apparaît entre autres dans les travaux de Apianus (1527),
Stifel (1544), Scheubel (1545), Tartaglia (1556), Bombelli (1572). Le même tableau et
son application au développement de (a+b)n , étaient connus des mathématiciens arabes
depuis al-Karaji (1000) et chinois depuis Chia Hsien (1100). Mais tous ignoraient que
les mathématiciens indiens l’avaient découvert bien longtemps avant.
Dans les poèmes en ancien Sanskrit 1 , la musique des vers provient en grande partie
de l’alternance des syllabes courtes ou longues. Pour la poésie védique, les vers pou-
vaient contenir de 1 à 13 syllabes ; se posait alors la question d’énumérer les rythmes
différents (alternances de syllabes courtes ou longues) que l’on pouvait former avec un
nombre fixé de syllabes. Dans son traité Chandrahsūtra, Pingala (iie siècle av. J.C. ?)
donne de manière assez cryptique la manière de décomposer tous les vers de n syllabes.
La voici, par son commentateur Halāyudha (xe siècle).
Ici est expliquée la règle de développement pyramidal (meru-prastāra) des
combinaisons d’une, deux etc., syllabes formées de sons courts et longs.
Après avoir dessiné un carré en haut, deux carrés sont dessinés en dessous,
de sorte que la moitié de chacun soit étendu de chaque côté. En-dessous trois
carrés, en-dessous quatre carrés sont dessinés et le processus est répété jus-
qu’à atteindre la pyramide désirée. Dans le premier carré, le symbole pour
un doit être placé. Ensuite dans chacun des deux carrés de la seconde ligne,
le chiffre un est placé. Ensuite sur la troisième ligne le chiffre un est placé
dans chacun des carrés extrêmes. Dans le carré du milieu la somme des
chiffres des deux carrés immédiatement au-dessus doit être placée. Dans la
quatrième ligne, un doit être placé dans chacun des deux carrés extrêmes.
Dans chacun des deux carrés intermédiaires, la somme des chiffres des deux
carrés immédiatement au-dessus, c’est-à-dire trois, doit être placée. Les car-
rés suivants sont remplis de cette manière. Ainsi la seconde ligne donne le
développement des combinaisons d’une syllabe ; la troisième ligne la même
chose pour deux syllabes, la quatrième ligne pour trois syllabes, et ainsi de
suite.
C’est bien la construction du triangle arithmétique. Pingala savait énumérer les ma-
nières d’écrire n syllabes courtes ou longues, ce qui représente, après le Yi Jing, la
seconde plus ancienne énumération binaire connue. Cela ne donne pas exactement la
formule du binôme de Newton, mais c’est tout de même plutôt remarquable.
À propos, que vient faire Newton dans cette affaire ? Vers 1665, il généralisa la
formule du binôme à des exposants réels quelconques (et plus seulement des entiers
positifs), en remplaçant les sommes finies par des séries infinies. Mais ceci est une
autre histoire, que nous vous raconterons un jour. . .
1. Amulya Kumar Bag : Binomial Theorem in ancient India, Indian Journal of History of Sciences
p. 68–74 (1966)
40
3.4 Les formules de Ramanujan

Srinivasa Ramanujan (1887-1920) avait appris tout seul les mathématiques, grâce
à deux livres seulement. Admis en 1903 dans un collège gouvernemental du sud de
l’Inde, il était tellement obnubilé par ses recherches qu’il échoua à ses examens, et ce
quatre ans de suite. Ayant obtenu un poste dans un comptoir de Madras, ses supérieurs
l’encouragèrent à envoyer ses résultats à d’éminents mathématiciens anglais. Seul G.H.
Hardy (1877–1947) fit l’effort de s’intéresser à la lettre qu’il reçut le 16 janvier 1913,
et qui contenait 120 formules. L’écriture mathématique était particulière et aucune
justification n’était fournie. Ramanujan n’aura d’ailleurs jamais une idée claire de ce
qu’est une démonstration. Il disait : « une équation pour moi n’a aucun sens, à moins
qu’elle n’exprime une pensée de Dieu ».
Après quelques heures d’effort, Hardy reconnut certaines formules ; d’autres étaient
erronées. Mais un grand nombre étaient totalement nouvelles. Hardy déclara « un coup
d’œil sur ces formules était suffisant pour se rendre compte qu’elles ne pouvaient être
pensées que par un mathématicien de la plus grande classe. Elles devaient être vraies,
car si elles ne l’étaient pas, personne n’aurait eu assez d’imagination pour les inventer ».
Hardy invita Ramanujan à Cambridge où il séjourna de 1914 à 1919. Au fil du
temps, la santé de Ramanujan déclinait, et son régime strictement végétarien ainsi que
les restrictions dues à la première guerre mondiale ne l’amélioraient pas. Il retourna en
Inde, ou il mourut à seulement 32 ans. Personne, pas même Hardy, n’avait eu le temps
de comprendre d’où lui venaient ses intuitions géniales. Il fit dans sa vie environ 6000
découvertes qu’il consignait dans des carnets. Le déchiffrage de ces carnets a occupé
de nombreux mathématiciens tout au long du xxe siècle.
Voici une des nombreuses formules que Ramanujan donna pour le calcul de π : elle
date de 1910 mais ne fut démontrée qu’en 1985.
9801
π= √ X ∞ .
(4n)! 1103 + 26390n
2 2 4
n=0 (n!) 3964n
3.5 Le Rapido
Voulez-vous calculer vos chances de gagner au Bridge, au Poker, au Loto, au Keno ?
Le procédure est à peu près la même et vous avez tous les outils en main.
Commençons par une formule générale, qui vous servira pour tous les jeux de hasard.
Soit N un entier au moins égal à 2. Soient m et n deux autres entiers inférieurs ou
égaux à N .
! min{m,n} ! !
N X m N −m
= (8)
n k=0 k n−k
On peut démontrer cette formule par récurrence, en utilisant les propriétés des coeffi-
cients du binôme, mais il est plus intéressant de la comprendre. Disons que N est un
nombre d’objets parmi lesquels vous vous apprêtez à en piocher n : N = 52 cartes et
41
vous en recevez n = 13 (Bridge) ; N = 32 cartes et vous en recevez n = 5 (Poker) ;

N = 49 numéros et vous en cochez n = 6 (Loto) etc. . . Parmi les N objets, m sont
marqués et ce sont ceux qui peuvent vous faire gagner : m = 4 as au bridge, m = 6
numéros du tirage
officiel au loto, etc. . .
Vous avez Nn choix possibles. Ces choix se répartissent selon le nombre d’objets
marqués que vous aurez en main. Il peut y en avoir au plus min{m, n}. Comment
constituer une sélection de n objets en tout, parmi
lesquels k sont marqués ? Il faut
choisir les k objets marqués parmi m en tout : m k
façons de le faire. Il faut ensuite

−m
choisir n − k objets non marqués parmi N − m : Nn−k possibilités. La formule (8)
traduit cette décomposition.
Comme cas particulier, voici comment décomposer le nombre de mains au bridge
(13 cartes distribuées sur 52) en fonction du nombre d’as qu’elles contiennent.
! ! ! ! ! ! ! ! ! ! !
52 4 48 4 48 4 48 4 48 4 48
= + + + + .
13 0 13 1 12 2 11 3 10 4 9
Comment en déduire vos chances d’avoir 4 as dans une main ? C’est facile, il suffit de
diviser le nombre de mains contenant 4 as par le nombre total de mains.

4 48
4 9

52
' 0.002641 .
13
Le Rapido, comme son nom l’indique, ne demande pas une réflexion très puissante,
et les résultats défilent toutes les 10 minutes sur un écran de télé. Pour jouer, vous
cochez 8 numéros parmi 20 sur la grille A, et 1 numéro parmi 4 sur la grille B. Les
« bons » numéros affichés à la télé sont choisis de même. Vous pouvez donc avoir k
bons numéros (k entre 0 et 8) sur la grille A et 0 ou 1 sur la grille B. Vos chances
d’avoir k bons numéros sur la grille A sont de :

8 12
k 8−k

20
.
8
Pour avoir vos chances d’avoir en plus le bon numéro de la grille B, multipliez par 1/4.
Voici les probabilités pour k allant de 0 à 8 et b = 0 ou 1 selon que vous avez ou non
le numéro de la grille B.
b\k 0 1 2 3 4 5 6 7 8
0 0.00295 0.03772 0.15404 0.26406 0.20630 0.07335 0.01100 0.00057 0.00001
1 0.00098 0.01257 0.05135 0.08802 0.06877 0.02445 0.00367 0.00019 0.00000
Vos chances d’avoir au moins 3 bons numéros sur la grille A sont de 74%, ce qui
vous encourage à jouer. Cependant vous ne gagnez qu’à partir de 4 bons numéros. Voici
42
les gains en euros offerts pour 1 euro misé, pour chacune des combinaisons gagnantes.
b\k 4 5 6 7 8
0 0 2 10 50 1000
1 1 6 30 150 10000
D’après les probabilités calculées plus haut, sur 100 000 joueurs payant chacun 1 euro,
environ 6877 gagneront 1 euro, environ 7335 gagneront 2 euros, environ 2445 gagneront
6 euros, . . . Au total, la Française des Jeux reversera en moyenne 66 518 euros, pour
100 000 euros de mise empochés.
3.6 Si non è vero, è bene trovato

Voici comment Daniel Kehlmann raconte les déboires scolaires du jeune Karl Frie-
drich Gauss (1777-1855) 2 .
Le maître d’école s’appelait Büttner et il aimait rosser ses élèves. Il feignait
d’être sévère et ascétique, et, en quelques rares occasions, l’expression de son
visage révélait le plaisir qu’il prenait à les rouer de coups. Ce qu’il aimait par
dessus tout, c’était leur donner des problèmes qui demandaient beaucoup
de temps et qui étaient malgré tout presque impossibles à résoudre sans
faire d’erreur, si bien qu’à la fin, il avait une raison valable pour sortir le
bâton. Cela se passait dans le quartier le plus pauvre de Brunswick, aucun
de ces enfants n’irait jamais à l’école secondaire, personne ici ne travaillerait
autrement qu’avec ses mains. Gauss savait que Büttner ne pouvait pas le
souffrir. Il avait beau se taire et répondre aussi lentement que les autres, il
percevait la méfiance du maître, il sentait que ce dernier n’attendait qu’une
occasion de le frapper un peu plus fort que le reste du groupe.
Et un beau jour, il lui fournit une occasion.
Büttner leur avait demandé d’additionner tous les nombres de un à cent.
Cela prendrait des heures, et même avec la meilleure volonté du monde, ce
n’était pas possible sans faire à un moment ou à un autre une erreur de
calcul, pour laquelle on pouvait alors être puni. Au travail, avait crié Bütt-
ner, qu’ils ne restent pas là à bailler aux corneilles, au travail, et plus vite
que ça ! Par la suite, Gauss fut incapable de dire si, ce jour-là, il était plus
fatigué que d’habitude, ou seulement étourdi. Toujours est-il qu’il n’avait
pas réussi à se contrôler et qu’au bout de trois minutes, il s’était retrouvé
devant le pupitre du maître, avec son ardoise sur laquelle ne figurait qu’une
seule et unique ligne.
Bon, dit Büttner, et il saisit le bâton. Son regard tomba sur le résultat et
sa main se figea. Qu’est-ce que c’est que ça ?
Cinq mille cinquante.
2. Les arpenteurs du monde, Editions Actes Sud (2006), traduit de l’allemand par Juliette Aubert
43
Quoi ? Gauss resta sans voix, il se racla la gorge, il transpirait. Il ne souhai-

tait qu’une chose, être encore assis à sa place et calculer comme les autres
qui, la tête penchée, faisaient mine de ne pas écouter. C’était pourtant bien
cela qu’il fallait faire, dit-il, additionner tous les nombres de un à cent.
Cent plus un faisaient cent un. Quatre-vingt dix-neuf plus deux faisaient
cent un. Quatre-vingt dix-huit plus trois faisaient cent un. Toujours cent
un. On pouvait répéter l’opération cinquante fois. Donc : cinquante fois
cent un.
Büttner ne dit rien.
Cinq mille cinquante, répéta Gauss en espérant que, pour une fois, le maître
comprendrait.
Cinquante fois cent un faisait cinq mille cinquante. Gauss se frotta le nez.
Il était au bord des larmes.
Que Dieu me damne dit Büttner. Sur quoi il se tut pendant un long moment.
Son visage travaillait : le maître rentra les joues, son menton s’allongea, il
se frotta le front et se tapota le nez. Puis il renvoya Gauss à sa place : qu’il
s’assoie, qu’il se taise et reste après les cours.
Brian Hayes 3 a recensé pas moins de 111 versions différentes de cette histoire.
L’origine ? L’éloge funèbre de Gauss, prononcé en 1856 par un de ses amis, Wolfgang
Sartorius von Waltershausen. Voici le paragraphe où apparaît l’anecdote. L’histoire est
assez sensiblement différente, les nombres de un à cent ne sont pas mentionnés, pas
plus que la méthode par laquelle Gauss aurait trouvé le résultat.
Le jeune Gauss venait juste d’arriver dans cette classe quand Büttner donna
en exercice la sommation d’une suite arithmétique. À peine avait-il donné
l’énoncé que le jeune Gauss jeta son ardoise sur la table en disant « la voici ».
Tandis que les autres élèves continuaient à compter, multiplier et ajouter,
Büttner, avec une dignité affectée, allait et venait, jetant de temps en temps
un regard ironique et plein de pitié vers le plus jeune de ses élèves. Le garçon
restait sagement assis, son travail terminé, aussi pleinement conscient qu’il
devait toujours l’être une fois une tâche accomplie, que le problème avait
été correctement résolu et qu’il ne pouvait y avoir d’autre réponse.
Que Gauss ait eu très jeune des capacités propres à impressionner son maître d’école
Büttner, est avéré : il obtint grâce à celui-ci et à son assistant Bartels le droit l’aller
gratuitement au lycée, et plus tard une bourse du duc de Brunswick. Qu’il ait compris
à huit ans comment additionner les nombres de un à cent l’est moins. Mais après tout,
un conte de fées n’est peut-etre pas inapproprié pour celui qui est resté dans l’histoire
comme « le Prince des mathématiciens ».
3. B. Hayes : Gauss’s day of reckoning, American Scientist (2006), Vol. 94(3), p. 200
44
3.7 La marquise de Tencin

Claudine Alexandrine Guérin, marquise de Tencin (1682-1749) était une femme du
siècle des lumières. Née à Grenoble, elle fut placée au couvent de Montfleury à l’âge de
8 ans. Contrainte de prononcer ses vœux afin que sa famille puisse disposer de ses biens,
elle se révolta et, dès la mort de son père en 1705, après avoir déposé une protestation
chez un notaire, elle s’enfuit du couvent. Relevée de ses vœux par le pape en 1712, elle
gagna Paris où elle se lança dans l’intrigue politique et la galanterie. On lui prêta de
nombreux amants, parmi lesquels le chevalier Destouches, dont elle eut un fils en 1717.
Abandonné dès sa naissance sur les marches de la chapelle de Saint-Jean-le-Rond près
de Notre-Dame, ce fils fut baptisé Jean Le Rond.
À 12 ans, il entre au collège janséniste des Quatre-Nations, où il étudie la philoso-
phie, le droit et les arts, et devient avocat en 1738. Il s’intéresse à la médecine et aux
mathématiques. Il s’était d’abord inscrit sous le nom de Daremberg, puis il le change
en d’Alembert, nom qu’il conservera toute sa vie. Il est un des maîtres d’œuvre de
l’Encyclopédie, dont le premier tome paraît en 1751.
En 1743 dans son Traité de Dynamique, il énonce le théorème fondamental de
l’algèbre, qui dit que tout polynôme de degré n à coefficients complexes possède n
racines dans C (ceci avait déjà été conjecturé par Girard au début du xviie siècle). La
démonstration que d’Alembert donne de ce résultat est incomplète, et il faudra attendre
Carl Friedrich Gauss (1777–1855) pour une démonstration rigoureuse. En fait, celui-ci
en donnera 4 tout au long de sa vie, clarifiant au passage considérablement la notion
de nombre complexe.
Et Madame de Tencin ? On raconte que dès les premiers succès de son fils, elle
désira se rapprocher de lui et le fit venir dans le salon littéraire (et aussi politique et
financier) qu’elle tenait à Paris. D’Alembert y vint accompagné de sa mère adoptive,
et se montra très froid à l’égard de la belle marquise. . .
3.8 Equations résolubles par radicaux

On résout des équations du premier et du second degré au moins depuis les Ba-
byloniens, au début du deuxième millénaire avant notre ère, mais ce n’est que depuis
les xvie et surtout xviie siècles que zéro et les nombres négatifs sont traités de la
même façon que les nombres positifs. Ainsi il y avait avant une théorie pour l’équation
x2 = ax + b et une autre pour x2 + ax = b, a et b étant supposés positifs.
Au début du ixe siècle Al Khawarizmi (dont le nom a donné algorithme) décrit
la méthode de résolution des équations du second degré, pratiquement telle que vous
la connaissez (mais en supposant que le discriminant est positif ou nul). Il faudra
attendre sept siècles et une belle bagarre avant que l’on sache résoudre les équations
de degrés 3 et 4. Elle mit aux prises essentiellement deux mathématiciens italiens de
la renaissance, Niccolò Fontana, dit Tartaglia (1499-1557) et Girolamo Cardano (1501-
1576) (l’inventeur du joint de Cardan) : si vous êtes sages, nous vous la raconterons
dans un autre chapitre.
45
Voici ce que l’on appelle de manière assez injuste les « formules de Cardan ». Consi-
dérons l’équation :
(E) ax3 + bx2 + cx + d = 0 ,
avec a 6= 0. En divisant par a puis en posant z = x + b/(3a), on obtient l’équation
(E 0 ) z 3 + pz + q = 0 ,
où
3ac − b2 27a2 d − 9abc + 2b3
p= et q = .
3a2 27a3
Si 4p3 + 27q 2 > 0, La formule suivante donne une solution réelle en z :
v s v s
u u
u
3 q 1 4p3 +27q 2 u
3 q 1 4p3 + 27q 2
z0 = − + + − − . (9)
t t
2 2 27 2 2 27
Tartaglia et Cardan n’utilisaient leurs formules que pour des équations dont on
savait à l’avance qu’elles avaient des solutions réelles. Quand tout se passait bien, (9)
donnait cette solution réelle. En factorisant par (z − z0 ), on se ramenait à une équation
de degré 2 que l’on savait résoudre.
Cardan, puis Bombelli furent intrigués par l’équation x3 − 15x − 4 = 0, dont 4 est
racine. Pourtant, la formule de Cardan donne comme solution
q
3 √ q
3 √
2 + 11 −1 + 2 − 11 −1 .
En fait dans le cas général (9) définit six nombres complexes, parmi lesquels seulement
trois sont solutions de l’équation (E 0 ). En effet, si u est tel que u3 = z, les deux autres
racines cubiques de z sont ju et ju, où j = e2iπ/3 et j = j 2 = e4iπ/3 sont les deux racines
cubiques de l’unité différentes de 1. Voici la solution complète de (E 0 ).
1. Si 4p3 + 27q 2 > 0, soient u et v les deux réels tels que
s s
q 1 4p3 + 27q 2 q 1 4p3 + 27q 2
u3 = − + et v 3 = − −
2 2 27 2 2 27
Les trois solutions de (E 0 ) sont
z1 = u + v , z2 = ju + jv , z3 = ju + jv .
L’équation (E 0 ) a une solution réelle, et deux solutions complexes conjuguées.
2. Si 4p3 + 27q 2 < 0, soit u un des complexes tels que :
s
q i −4p3 − 27q 2
u3 = − + .
2 2 27
Les trois solutions de (E 0 ) sont :
z1 = u + u , z2 = ju + ju , z3 = ju + ju .
L’équation (E 0 ) a trois solutions réelles, même s’il faut passer par les complexes
pour les écrire.
46
En 1540, un élève de Cardan, Ludovico Ferrari donne des expressions explicites pour les
solutions d’équations de degré 4, mais le problème des solutions non réelles demeure.
En 1572, Bombelli surmonte sa répulsion à l’égard des racines carrées de nombres
négatifs et écrit le nombre « più di meno », c’est-à-dire i, puis définit les règles que
vous connaissez, en particulier « più di meno via più di meno fa meno » : i × i = −1.
On constata bientôt qu’en acceptant les racines complexes et en comptant ces racines
avec leur multiplicité, toute équation de degré 2 avait 2 racines, toute équation de degré
3 en avait 3 et toute équation de degré 4 en avait 4. Ceci fut énoncé par Girard en
1629, puis Descartes en 1637.
Et les équations de degré 5 ? On chercha longtemps une « résolution par radicaux » :
une formule générale ne faisant intervenir que les opérations de C et l’extraction de
racines. Le mémoire sur la résolution algébrique des équations que Joseph Louis La-
grange (1736–1813) publia en 1772 était une avancée importante. Il proposait une
théorie ramenant le problème à l’étude des différentes valeurs que peuvent prendre cer-
taines fonctions des racines lorsque l’on permute ces racines entre elles. Il y montrait
aussi que les méthodes qui avaient conduit à la résolution des équations de degrés 2
3 et 4 ne pouvaient pas fonctionner sur une équation de degré 5 générale. Il s’écoula
encore 60 ans avant qu’Evariste Galois (1811–1832) ne comprenne que la résolubilité
par radicaux était liée aux propriétés du groupe des permutations des racines. Une
conséquence de la théorie de Galois était la démonstration du fait que les équations de
degré 5 n’étaient pas résolubles par radicaux en général. Ce n’est qu’en 1870, avec la
parution du « Traité des substitutions et des équations algébriques » de Camille Jordan
(1838–1922) que l’ampleur des conceptions de Galois fut pleinement comprise.
Il faut dire que Galois avait exposé ses idées dans des articles plutôt mal écrits,
souvent incomplets, ainsi que dans une lettre à un ami, fébrilement écrite dans la nuit
du 29 mai 1832. Elle se terminait par ces mots : « Après cela, il y aura j’espère des gens
qui trouveront leur profit à déchiffrer tout ce gâchis. Je t’embrasse avec effusion ». Le
lendemain matin, il mourait des suites d’un duel ; il avait 21 ans.
47
Nombres réels
Bernard Ycart
Vous savez déjà compter, et vous connaissez les propriétés des réels. Une seule
nouveauté dans ce chapitre, la notion de borne (supérieure ou inférieure) d’un en-
semble. Au-delà des définitions, vous allez commencer à vous habituer aux « epsilons
strictement positifs », à comprendre comme des quantités pouvant prendre des valeurs
arbitrairement petites. À part ça, pas grand chose de neuf ni de difficile dans ce chapitre
d’introduction à l’analyse.
Table des matières

1 Cours 1
1.1 Opérations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Bornes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Intervalles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Rationnels et irrationnels . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5 Approximation des réels . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 Construction des bornes . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2 Entraînement 13
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3 Compléments 24
3.1 Papier normalisé . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.2 La constante de Ramanujan . . . . . . . . . . . . . . . . . . . . . . . . 24
3.3 Nombres incommensurables . . . . . . . . . . . . . . . . . . . . . . . . 25
3.4 Les frères Banu-Musâ . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.5 La numérisation des raisons . . . . . . . . . . . . . . . . . . . . . . . . 27
3.6 Les coupures de Dedekind . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.7 Point fixe d’une application croissante . . . . . . . . . . . . . . . . . . . 29
8 novembre 2011
Maths en Ligne Nombres réels UJF Grenoble
1 Cours
1.1 Opérations
Nous ne présenterons pas de construction axiomatique de l’ensemble R des nombres
réels. Cette section rappelle quelques notations, les propriétés des opérations (addition,
multiplication) et de la relation d’ordre.
Nous utilisons les notations classiques suivantes pour les ensembles emboîtés de
nombres N ⊂ Z ⊂ Q ⊂ R ⊂ C.
Notation Ensemble Exemples
N Entiers naturels 0, 1, 2, 3, . . .
Z Entiers relatifs −2, −1, 0, 1, 2, . . .
355
Q Rationnels 1.2,
√ 1/2, 0.0012, 113 , . . .
R Réels 2, π, e, . . . √
C Complexes 1 + 2i, 1 + i 3, 2eiπ/3 , . . .
L’exposant ∗ signifie « privé de 0 ». Ainsi, R∗ = R \ {0}, N∗ = {1, 2, 3, . . .}.

Pour les calculs usuels (à la main, sur les calculettes ou par ordinateur), ce sont
forcément des nombres décimaux, donc rationnels, que l’on manipule. Pourtant l’en-
semble Q n’est pas un cadre de calcul mathématiquement suffisant, pour plusieurs
raisons, qui seront énoncées dans la suite de ce chapitre. La première, reconnue dès
l’antiquité grecque, est que certaines quantités, qui pourtant apparaissent couramment
en géométrie élémentaire, ne s’expriment pas comme
√ rapports d’entiers. La plus√ simple
de côté 1, à savoir 2 : nous verrons plus loin que 2 n’est
est la diagonale d’un carré √
3
pas un nombre rationnel ; 5, π, ou e n’en sont pas non plus.
Les propriétés de l’addition, de la multiplication et de la relation d’ordre sont rap-
pelées ci-dessous.
Addition
• Associativité : ∀x, y, z ∈ R , x + (y + z) = (x + y) + z
• Élément neutre : ∀x ∈ R , x + 0 = 0 + x = x
• Opposé : ∀x ∈ R , x + (−x) = x − x = 0
• Commutativité : ∀x, y ∈ R , x + y = y + x
L’ensemble des réels muni de l’addition est un groupe commutatif.
Multiplication L’ensemble R∗ (ensemble des réels privé de 0), muni de la multiplica-
tion, est un autre groupe commutatif.
• Associativité : ∀x, y, z ∈ R , x(yz) = (xy)z
• Élément neutre : ∀x ∈ R , x 1 = 1 x = x
• Inverse : ∀x ∈ R∗ , x (1/x) = (1/x) x = 1
• Commutativité : ∀x, y ∈ R , xy = yx
• Distributivité : ∀x, y, z ∈ R , x(y + z) = (xy) + (xz)
L’ensemble des réels muni de l’addition et de la multiplication est un corps commutatif.
Relation d’ordre
1
• Réflexivité : ∀x ∈ R , x 6 x
• Transitivité : ∀x, y, z ∈ R , (x 6 y et y 6 z) =⇒ x 6 z
• Antisymétrie : ∀x, y ∈ R , (x 6 y et y 6 x) =⇒ x = y
• Ordre total : ∀x, y ∈ R , x 6 y ou y 6 x
Les trois premières propriétés définissent une relation d’ordre. Ici l’ordre est total car
deux réels quelconques peuvent toujours être comparés.
Pour des raisons de commodité, on utilise aussi couramment les notations >, <, > :
Notation Définition
x>y y6x
x<y x 6 y et x 6= y
x>y x > y et x 6= y
On utilise aussi les ensembles de réels notés R+ , R− , R+∗ et R−∗ .

Ensemble Définition Notation
Réels positifs ou nuls {x ∈ R , x > 0} R+
Réels strictement positifs {x ∈ R , x > 0} R+∗
Réels négatifs ou nuls {x ∈ R , x 6 0} R−
Réels strictement négatifs {x ∈ R , x < 0} R−∗
La relation d’ordre est compatible avec l’addition par un réel quelconque, et avec la
multiplication entre réels positifs.
• ∀x, y, z ∈ R , x 6 y =⇒ x + z 6 y + z
• ∀x, y, z ∈ R , x < y =⇒ x + z < y + z
• ∀x, y ∈ R , ∀z ∈ R+ , x 6 y =⇒ x z 6 y z
• ∀x, y ∈ R+∗ , ∀z ∈ R+∗ , x < y =⇒ x z < y z
Comme conséquence de ces relations de compatibilité, on obtient les règles suivantes
qui permettent de combiner des inégalités.
∀x, y, z, t ∈ R , (x 6 y et z 6 t) =⇒ x + z 6 y + t
On peut donc ajouter deux inégalités de même sens (attention : on ne peut pas ajouter
deux inégalités de sens opposés ni soustraire deux inégalités de même sens).
∀x, y ∈ R , ∀z, t ∈ R+ , (x 6 y et z 6 t) =⇒ x z 6 y t
On peut multiplier deux inégalités de même sens, si elles concernent des réels positifs ou
nuls. (attention : on ne peut pas mutiplier deux inégalités de sens opposés, ni diviser des
inégalités de même sens, ni multiplier des inégalités qui concernent des réels négatifs).
Pour se ramener à des inégalités de même sens, ou à des réels positifs, il peut être utile
de changer de signe ou de passer à l’inverse.
• ∀x, y ∈ R , (x 6 y) =⇒ (−x > −y)
• ∀x, y ∈ R+∗ , (x 6 y) =⇒ (1/x > 1/y)
2
1.2 Bornes
Définition 1. Soit A une partie de R et M un réel. On dit que M est un majorant de
A si :
∀x ∈ A , x 6 M .
De même, m ∈ R est un minorant de A si :
∀x ∈ A , m6x.
On dit qu’un ensemble de réels A admet un plus grand élément (respectivement

plus petit élément) s’il existe x ∈ A tel que pour tout y ∈ A, y 6 x (respectivement :
y > x). Donc le plus grand élément (s’il existe il est nécessairement unique) est à la fois
un majorant de A et un élément de A. Le fait que l’ordre sur R soit total entraîne que
tout ensemble fini de réels admet un plus petit élément et un plus grand élément. Si
{a1 , . . . , an } est un ensemble fini de réels, nous noterons min{a1 , . . . , an } le plus petit
et max{a1 , . . . , an } le plus grand élément. Nous réserverons les notations min et max
aux ensembles finis. Un ensemble infini de réels n’admet pas nécessairement de plus
petit ou de plus grand élément. Voici quelques exemples.
Ensemble Plus petit élément Plus grand élément
N 0 Non
Z Non Non
{1/n , n ∈ N∗ } Non 1
{(−1)n (1 − 1/n) , n ∈ N∗ } Non Non
{(−1)n (1 + 1/n) , n ∈ N∗ } −2 3/2
{(−1)n + 1/n , n ∈ N∗ } Non 3/2
{(−1)n − 1/n , n ∈ N∗ } −2 Non
Non seulement N n’a pas de plus grand élément mais de plus aucun réel n’est plus grand
que tous les éléments de N. Par contre, les 5 derniers ensembles du tableau ci-dessus
sont bornés au sens suivant.
Définition 2. Soit A une partie de R (un ensemble de réels). On dit que A est :
• majorée s’il existe un majorant de A,
• minorée s’il existe un minorant de A,
• bornée si A est à la fois majorée et minorée.
Si M est un majorant de A, alors M + 1, M + 2 et plus généralement tout réel plus

grand que M sont aussi des majorants. Nous admettrons pour l’instant le théorème
suivant, dont nous donnerons une démonstration dans la section 1.6.
Théorème 1. Soit A une partie non vide de R.

1. Si A est majorée, alors l’ensemble des majorants de A admet un plus petit élé-
ment.
3
2. Si A est minorée, alors l’ensemble des minorants de A admet un plus grand

élément.
Définition 3. Soit A une partie non vide de R.

1. Si A est majorée, on appelle borne supérieure de A et on note sup(A) le plus
petit des majorants de A.
2. Si A est minorée, on appelle borne inférieure de A et on note inf(A) le plus grand
des minorants de A.
Du fait que l’ordre des réels est total, la borne supérieure et la borne inférieure, si
elles existent, sont nécessairement uniques. Lorsque A admet un plus grand élément,
la borne supérieure de A est ce plus grand élément. Lorsque A admet un plus petit
élément, la borne inférieure de A est ce plus petit élément. On étend la définition de
sup et inf aux ensembles non majorés et non minorés par la convention suivante.
1. Si A n’est pas majorée, sup(A) = +∞
2. Si A n’est pas minorée, inf(A) = −∞
Reprenons comme exemples les 6 ensembles du tableau précédent.
Ensemble Borne inférieure Borne supérieure
N 0 +∞
Z −∞ +∞
{1/n , n ∈ N∗ } 0 1
{(−1)n (1 − 1/n) , n ∈ N∗ } −1 1
{(−1)n (1 + 1/n) , n ∈ N∗ } −2 3/2
{(−1)n + 1/n , n ∈ N∗ } −1 3/2
{(−1)n − 1/n , n ∈ N∗ } −2 1
Dans le cas où A est majorée et n’admet pas de plus grand élément, alors sup(A)
n’appartient pas à A, mais on trouve néanmoins des éléments de A arbitrairement
proches de la borne supérieure.
Proposition 1. Soit A une partie non vide de R.

1. Si A est majorée, alors
∀ε > 0 , ∃a ∈ A , sup(A) − ε 6 a 6 sup(A)
2. Si A est minorée, alors
∀ε > 0 , ∃a ∈ A , inf(A) 6 a 6 inf(A) + ε
Démonstration : Comme sup(A) est le plus petit des majorants, sup(A)−ε ne peut pas
être un majorant. Il existe donc un élément de A supérieur à sup(A)−ε. Comme sup(A)
4
est un majorant, cet élément est inférieur à sup(A). Le raisonnement pour inf(A) est
analogue.
Nous allons souvent rencontrer dans ce cours des réels ε strictement positifs ar-
bitrairement petits. On peut s’en faire une idée concrète en pensant ε = 0.001, ou
bien ε = 10−6 . Prenons comme exemple A = {1/n2 , n ∈ N∗ }. La borne inférieure est
inf(A) = 0. La proposition 1 permet d’affirmer que pour tout ε > 0, il existe un élément
de l’ensemble inférieur à ε. Et d’ailleurs l’équivalence ci-dessous permet de l’exhiber.
q
2
1/n 6 ε ⇐⇒ n > 1/ε .
Pour ε = 0.001, 1/402 < ε.

La proposition 1 admet la réciproque suivante.
Proposition 2. Soit A une partie non vide de R.

1. Si x est un majorant de A tel que
∀ε > 0 , ∃a ∈ A , x−ε6a,
alors x = sup(A).
2. Si x est un minorant de A tel que
∀ε > 0 , ∃a ∈ A , a6x+ε,
alors x = inf(A).
Démonstration : Si
∀ε > 0 , ∃a ∈ A , x−ε6a,
alors pour tout ε > 0, x − ε n’est pas un majorant de A, donc si x est un majorant,
c’est bien le plus petit.
Le raisonnement pour inf(A) est analogue.
La borne supérieure peut donc être caractérisée de deux manières différentes.
• sup(A) est le plus petit des majorants de A
• sup(A) est le seul majorant x de A tel que pour tout ε > 0, il existe un élément
de A entre x − ε et x.
De manière analogue,
• inf(A) est le plus grand des minorants de A
• inf(A) est le seul minorant x de A tel que pour tout ε > 0, il existe un élément
de A entre x et x + ε.
En liaison avec la proposition précédente, voici pour terminer cette section une ap-
plication simple des notions de borne supérieure et inférieure, que l’on retrouve dans
beaucoup de démonstrations.
5
Proposition 3. Soient a et b deux réels.

1. Si pour tout ε > 0, a > b − ε alors a > b.
2. Si pour tout ε > 0, a 6 b + ε alors a 6 b.
Démonstration : Considérons la première affirmation. l’ensemble {b − ε , ε > 0} a pour

borne supérieure b. L’hypothèse affirme que a est un majorant de cet ensemble. Il est
donc supérieur ou égal à la borne supérieure, par définition de celle-ci. Or d’après la
proposition 2, la borne supérieure de {b − ε , ε > 0} est b. La seconde affirmation est
analogue.
L’ensemble {b − ε , ε > 0} de la démonstration précédente est un intervalle de R.
Nous les décrivons dans la section suivante.
1.3 Intervalles
Définition 4. Une partie I de R est un intervalle si, dès qu’elle contient deux réels,
elle contient tous les réels intermédiaires :
∀c, d ∈ I , ∀x ∈ R , (c 6 x 6 d) =⇒ (x ∈ I) .
Par exemple, R+ est un intervalle, car tout réel compris entre deux réels positifs
est positif. Mais R∗ n’en est pas un, car il contient 1 et −1 sans contenir 0. L’ensemble
vide et les singletons sont des cas très particuliers d’intervalles. Nous allons utiliser
sup et inf pour caractériser tous les intervalles contenant au moins deux éléments. Ils
se répartissent en 9 types, décrits dans le tableau ci-dessous. Dans ce tableau, a et b
désignent deux réels tels que a < b.
6
Description Définition Notation
fermé borné (segment) {x ∈ R , a 6 x 6 b} [a, b]

borné, semi-ouvert à droite {x ∈ R , a 6 x < b} [a, b[
borné, semi-ouvert à gauche {x ∈ R , a < x 6 b} ]a, b]
ouvert borné {x ∈ R , a < x < b} ]a, b[
fermé non majoré {x ∈ R , a 6 x} [a, +∞[

ouvert non majoré {x ∈ R , a < x} ]a, +∞[
fermé non minoré {x ∈ R , x 6 b} ] − ∞, b]

ouvert non minoré {x ∈ R , x < b} ] − ∞, b[
droite réelle R ] − ∞, +∞[
Voici la discussion pour les intervalles bornés. Si un intervalle I est borné et contient
deux éléments, il admet une borne inférieure et une borne supérieure distinctes. Notons
a = inf(I) et b = sup(I) .
Par définition de sup et inf, tout élément x de I est entre a et b :
∀x ∈ I , a6x6b.
Nous allons montrer que tout réel x tel que a < x < b appartient à I. En effet, si
a < x < b, x n’est ni un majorant, ni un minorant de I. Il existe donc deux éléments
y et z de I tels que y < x < z. Par la définition 4, x appartient à I. Selon que a et b
appartiennent ou non à I, on obtient les 4 premiers types du tableau.
Considérons maintenant un intervalle minoré mais non majoré. Soit a la borne
inférieure. Tout élément de I est supérieur ou égal à a. Montrons que I contient tous
les réels x strictement supérieurs à a. Comme x n’est pas un minorant, I contient un
élément y < x, et comme I n’est pas majoré, il contient un élément z > x. Donc x
appartient à I. Selon que a appartient ou non à I, on obtient 2 types d’intervalles non
majorés. Les deux types d’intervalles non minorés sont analogues.
Enfin, si un intervalle I n’est ni majoré, ni minoré, pour tout réel x, on peut trouver
deux réels y et z dans I tels que y < x < z, ce qui entraîne x ∈ I. Donc I = R.
1.4 Rationnels et irrationnels

Un nombre rationnel est le quotient de deux entiers relatifs. La somme de deux
rationnels, ainsi que leur produit, sont des rationnels. Muni de l’addition et de la
7
multiplication, Q est un corps commutatif totalement ordonné, comme R. En revanche,

Q ne possède pas la propriété de la borne supérieure. L’ensemble des rationnels dont le
carré est inférieur
√ ou égal à 2 est non vide, majoré, mais il n’a pas de borne supérieure
dans Q, car 2 est irrationnel. C’est une application du résultat suivant.
√
Proposition 4. Soient m et n deux entiers strictement positifs. Le nombre n m est
soit entier, soit irrationnel.
√
Démonstration : Nous allons démontrer que si n m est√rationnel, alors il est entier.
Soient p et q deux entiers premiers entre eux tels que n m = p/q. Alors, q n m = pn .
Mais alors q divise pn , or q et p sont premiers entre eux. Ce n’est possible que si q = 1
et m = pn .
Observons que la somme d’un rationnel et d’un irrationnel est irrationnelle ; il en
est de même pour leur produit. Par contre√la somme √ ou le produit de deux irrationnels
peuvent être rationnels (par exemple 1 + 2 et 1 − 2).
Les rationnels et les irrationnels sont intimement mêlés, comme le montre le théo-
rème suivant.
Théorème 2. Si un intervalle de R contient au moins deux points distincts, il contient
au moins un rationnel et un irrationnel.
On traduit cette propriété en disant que Q et R \ Q sont denses dans R.
Démonstration : Soit I un intervalle contenant deux points a et b, tels que a < b.

Soit q un entier strictement supérieur à 1/(b − a) et p le plus petit entier strictement
supérieur à aq. On a donc :
p − 1 6 aq < p ,
et comme q est strictement positif,
p 1 p
− 6a< .
q q q
D’où :
p 1
a< 6 a + < a + (b − a) = b .
q q
Donc l’intervalle ]a, b[, inclus dans I, contient le rationnel pq .
√
De même, l’intervalle ] √a2 , √b2 [ contient un rationnel r ; donc ]a, b[ contient r 2, qui
est irrationnel.
En fait, tout intervalle contenant au moins deux points contient une infinité de
rationnels et une infinité d’irrationnels.
Les rationnels que l’on manipule le plus souvent sont les nombres décimaux, qui
sont les multiples entiers de 10−n , où n est le nombre de chiffres après la virgule :
3141592
3.141592 = 3 + 141592 10−6 = .
1000000
Les nombres décimaux sont le moyen le plus courant d’approcher les réels.
8
1.5 Approximation des réels

Nous définissons d’abord les outils de base de l’approximation que sont la valeur
absolue, la distance et la partie entière.
La valeur absolue d’un réel x, notée |x|, est max{x, −x}. Elle est égale à x si x est
positif, −x si x est négatif.
Si x et y sont deux réels quelconques, la valeur absolue du produit xy est le produit
des valeurs absolues ; |xy| = |x||y|. Par contre, on peut seulement encadrer la valeur
absolue de la somme.
Proposition 5. Soient x et y deux réels quelconques. La valeur absolue de leur somme
est majorée par la somme des valeurs absolues, et minorée par la différence des valeurs
absolues.
∀x, y ∈ R , |x| − |y| 6 |x + y| 6 |x| + |y| . (1)

Démonstration : Quitte à échanger x et y, nous pouvons supposer sans perte de

généralité que |x| > |y|. Si l’un des deux est nul, alors les inégalités sont vérifiées : ce
sont des égalités. Sinon, il suffit d’examiner les 4 cas possibles selon le signe de x et y.
1. x > 0 et y > 0 : |x + y| = x + y = |x| + |y| > |x| − |y|
2. x > 0 et y < 0 : |x + y| = x + y = |x| − |y| < |x| + |y|
3. x < 0 et y > 0 : |x + y| = −x − y = |x| − |y| < |x| + |y|
4. x < 0 et y < 0 : |x + y| = −x − y = |x| + |y| > |x| − |y|
Observez que dans tous les cas, l’une des deux inégalités est une égalité, mais ce n’est
pas toujours la même.
En remplaçant y par −y, on obtient le même encadrement pour la valeur absolue
d’une différence.
|x| − |y| 6 |x − y| 6 |x| + |y|

On appelle distance entre deux réels x et y la valeur absolue de leur différence. La

proposition 5, appliquée à (x − y) + (y − z), entraîne :
∀x, y, z ∈ R , |x − z| 6 |x − y| + |y − z| .
Pour aller d’un point à un autre, on ne peut qu’allonger le parcours si on s’impose de
passer par un troisième : c’est l’inégalité triangulaire.
Étant donné un réel x et un réel ε strictement positif, nous dirons que a est une
approximation (ou une valeur approchée) de x « à ε près » si la distance de a à x est
inférieure à ε, ce qui équivaut à dire que x appartient à l’intervalle ]a − ε, a + ε[.
|x − a| < ε ⇐⇒ x ∈ ]a − ε, a + ε[ ⇐⇒ a ∈ ]x − ε, x + ε[ .
Les approximations décimales se construisent à l’aide de la partie entière. La partie
entière d’un réel x est le plus grand entier inférieur ou égal à x. On le note bxc :
bxc 6 x < bxc + 1 .
9
On en déduit :
x − 1 < bxc 6 x .
La partie entière de π est 3. Attention : la partie entière de −π est −4, et non −3. On
appelle partie décimale de x et on note D(x), la différence de x avec sa partie entière.
D(x) = x − bxc ∈ [0, 1[ .
Soit x un réel, et n un entier. Considérons la partie entière de 10n x :
b10n xc 6 10n x < b10n xc + 1 ,
donc,
10−n b10n xc 6 x < 10−n b10n xc + 10−n ,
Le nombre décimal dn = 10−n b10n xc est l’approximation de x par défaut à 10−n près.
Observez que dn et dn+1 coïncident jusqu’à la dernière décimale de dn :
dn 6 dn+1 6 x < dn+1 + 10−(n+1) < dn + 10−n
Par exemple, pour x = π,
d0 = 3 , d1 = 3.1 , ; d2 = 3.14 , d3 = 3.141 , d4 = 3.1415 , d5 = 3.14159 . . .
Réciproquement, la donnée d’une suite de décimaux (dn )n∈N , telle que

1. ∀n ∈ N , 10n dn ∈ N
2. ∀n ∈ N , dn 6 dn+1 < dn + 10−n
détermine un réel x tel que pour tout n dn 6 x 6 dn + 10−n . La suite (dn )n∈N est
croissante et converge vers x. Notez (dn ) peut déterminer un réel dont elle n’est pas la
suite d’approximations décimales, dans le cas où x est lui même décimal :
1 = 0.99999999 . . .
En théorie, on peut approcher un réel x par un nombre décimal à n’importe quelle

précision. En pratique, la précision habituelle sur des calculs d’ordinateurs est de l’ordre
de 10−15 .
1.6 Construction des bornes

Le but de cette section est de démontrer le théorème 1 : toute partie non vide et
majorée de R admet une borne supérieure et toute partie non vide et minorée admet
une borne inférieure. Soit A une partie non vide et majorée de R :
∃M ∈ R , ∀x ∈ A , x6M .
10
Si x 6 M , alors −x > −M . Si A est non vide et majorée, alors −A = {−x , x ∈ A} est

une partie non vide et minorée. Si la borne supérieure de A (plus petit des majorants
de A) existe, alors la borne inférieure de −A (plus grand des minorants) existe aussi
et réciproquement ; de sorte que nous nous dispenserons de démontrer l’existence de la
borne inférieure.
La démontration va consister à construire explicitement la borne supérieure, en déter-
minant ses approximations décimales par défaut. Nous vérifierons ensuite que le réel
ainsi construit est bien le plus petit des majorants.
Démonstration : [du théorème 1] Soit A une partie non vide de R et M un majorant
de A. Pour tout n ∈ N, l’ensemble
{ b10n xc , x ∈ A } .
est un ensemble d’entiers, majoré par M . Il admet donc un plus grand élément. Divisons
chacun de ses éléments par 10−n :
Dn = { 10−n b10n xc , x ∈ A } .
L’ensemble Dn est l’ensemble des approximations par défaut à 10−n près des éléments
de A. Comme le précédent, il admet un plus grand élément, que nous noterons dn . Par
construction, pour tout n ∈ N, dn+1 > dn . Nous allons démontrer par l’absurde que
dn+1 < dn + 10−n .
Si ce n’était pas le cas, il existerait x ∈ A tel que
10−(n+1) b10n+1 xc > dn + 10−n
Mais alors b10n xc serait supérieur ou égal à 10n dn + 1, ce qui contredit la définition de
dn . La suite (dn )n∈N est donc bien une suite d’approximations décimales et détermine
un réel unique que nous notons b. Nous voulons montrer b est la borne supérieure de
A. Montrons d’abord que c’est un majorant de A. Toujours par l’absurde, supposons
qu’il existe x ∈ A tel que x > b. Fixons n tel que 10−n < x − b. Alors
10−n b10n xc > 10−n b10n bc = dn ,
ce qui contredit la définition de dn . Il nous reste à montrer que pour tout ε > 0, il
existe x ∈ A tel que b − ε < x. Fixons n tel que 10−n < ε. Par construction, il existe
x ∈ A tel que dn = 10−n b10n xc. Donc
b − ε < b − 10−n 6 dn 6 x .

Ne nous leurrons pas : la démonstration qui précède, si elle présente l’avantage
de construire explicitement la borne supérieure, n’est pas parfaitement étanche. Vous
11
avez dû admettre qu’une suite d’approximations décimales détermine un réel, ce qui

pour être parfaitement intuitif, n’en est pas moins un acte de foi. Pour le justifier,
il vous manque une construction axiomatique de l’ensemble des réels, que nous vous
raconterons certainement un jour, mais qui pour l’heure dépasse sensiblement le niveau
de ce chapitre.
12
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit A une partie non vide de R. Parmi les affirmations suivantes les-
quelles sont vraies, lesquelles sont fausses et pourquoi ?
1. A possède une borne supérieure, finie ou infinie.
2. Si A est minorée, alors A possède une borne inférieure finie.
3. Si x 6 sup(A) alors x ∈ A.
4. Si A contient au moins 2 réels distincts, alors A contient un rationnel.
5. Si A est infinie, alors A contient une infinité d’irrationnels.
6. Si A contient un intervalle de R, contenant lui-même deux points distincts,
alors A contient une infinité d’irrationnels.
7. Si A contient un intervalle de R, alors A contient une infinité de rationnels.
Vrai-Faux 2. Soit A une partie non vide de R. On note |A| = {|x| , x ∈ A}. Parmi les
affirmations suivantes lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. Si A est majorée, alors |A| possède une borne supérieure finie.
2. 0 est un minorant de |A|.
3. |A| possède toujours une borne inférieure finie.
4. |A| possède toujours une borne supérieure finie.
5. A est bornée si et seulement si |A| est majorée.
6. Si A est un intervalle, alors |A| est un intervalle.
7. Si |A| est un intervalle, alors A est un intervalle.
8. Si A est un intervalle ouvert, alors |A| est un intervalle ouvert.
9. Si A est un intervalle fermé, alors |A| est un intervalle fermé.
Vrai-Faux 3. Soit a un réel quelconque. Parmi les affirmations suivantes lesquelles sont
1. Si (∀ε > 0 , a < ε), alors a < 0.
2. Si (∀ε > 0 , a > 1 − ε), alors a > 1.
3. Si (∀ε > 0 , a > 1 − ε2 ), alors (∀ε > 0 , a > 1 − 2ε).
4. Si (∀ε > 0 , a > 1 − ε), alors (∀ε > 0 , a > 1 − ε2 ).
√
5. Si (∀n ∈ N∗ , a > 1/ n), alors a > 1.
√
6. Si (∀n ∈ N∗ , a < 1/ n), alors a < 0.
√
7. Si (∀n ∈ N∗ , a > 1 − 1/ n), alors (∀ε > 0 , a > 1 − ε).
13
Vrai-Faux 4. Soient a et b deux réels quelconques. Parmi les affirmations suivantes

1. Si a + b est rationnel, alors soit a est rationnel soit b est rationnel.
2. Si a + b est irrationnel, alors soit a est irrationnel soit b est irrationnel.
3. Si a est rationnel, alors sa partie décimale est rationnelle.
4. Si a est irrationnel, alors la partie décimale de a + b est irrationnelle.
5. Si la partie décimale de a est rationnelle, alors a est rationnel.

1. |ab| = |a| |b|.
2. |a| − |b| 6 |a − b|.
3. |a − b| 6 max{|a|, |b|}.
4. |a − b| = |a − (a + b)/2| + |(a + b)/2 − b|.
5. |a − b| = |a − (a + b)| + |(a + b) − b|.
6. Si |a − b| < |a|, alors |ab| = ab.
7. ba + bc = bac + bbc.
8. ba + bc > bac + bbc.
9. ba + bc 6 bac + bbc + 1.
10. D(a + b) = D(a) + D(b).
2.2 Exercices
Exercice 1. Pour chacun des ensembles de réels suivants :
{(−1)n , n ∈ N} , {(−1)n /n , n ∈ N∗ } , {(−1)n n , n ∈ N} ,
2n + (−1)n
( )
n+1 2n + 1

, n∈N , , n∈N , , n∈N ,
n+2 n+2 n+2
m+n 2m + n m−n

, m, n ∈ N∗ , , m, n ∈ N∗ , , m, n ∈ N∗ .
m + 2n m + 2n m + 2n
1. L’ensemble est-il majoré ? minoré ?
2. L’ensemble admet-il un plus grand élément ? un plus petit élément ?
3. Déterminer la borne supérieure et la borne inférieure de l’ensemble.
14
Exercice 2. On considère les ensembles de réels suivants :

n o n o
{x ∈ R , |x| > 1} , x ∈ R , x2 6 1 , x ∈ R , x3 < 1
n o
{x ∈ R∗ , 1/x 6 1} , {x ∈ R∗ , 1/x > 1} , x ∈ R∗ , 1/x2 < 1
( √ )
1 1 2
n o
x ∈ R+ , sin x 6 0 , x ∈ R+∗ , sin 6 0 , x ∈ R+∗ , | sin | < .
x x 2
1. Ecrire l’ensemble comme un intervalle ou une réunion d’intervalles disjoints.
2. L’ensemble est-il majoré ? minoré ?
3. L’ensemble admet-il un plus grand élément ? un plus petit élément ?
4. Déterminer la borne supérieure et la borne inférieure de l’ensemble.
Exercice 3. Soient A et B deux parties non vides et bornées de R.

1. Montrer que A ⊂ B implique sup(A) 6 sup(B) et inf(A) > inf(B).
2. Montrer que A ∪ B admet une borne supérieure et une borne inférieure finies.
Montrer que
sup(A ∪ B) = max{sup(A), sup(B)} et inf(A ∪ B) = min{inf(A), inf(B)} .
3. Montrer que si l’intersection A ∩ B est non vide, alors elle admet une borne
supérieure et une borne inférieure finies. Montrer que
sup(A ∩ B) 6 min{sup(A), sup(B)} et inf(A ∩ B) > max{inf(A), inf(B)} .
4. On note A + B = {a + b , a ∈ A, b ∈ B}. Montrer que A + B admet une borne

supérieure et une borne inférieure finies. Montrer que
sup(A + B) = sup(A) + sup(B) et inf(A + B) = inf(A) + inf(B) .
5. On note AB = {ab , a ∈ A , b ∈ B}. Montrer que AB admet une borne su-

périeure et une borne inférieure. Montrer que, si A et B sont inclus dans R+ ,
alors
sup(AB) = sup(A) sup(B) et inf(AB) = inf(A) inf(B) .
Exercice 4. Soient A et B deux intervalles de R.

1. Montrer que A ∩ B est un intervalle.
2. Montrer que si A ∩ B est non vide, alors A ∪ B est un intervalle.
3. Montrer par un exemple que A ∪ B peut être un intervalle même si A ∩ B est
vide.
4. On note A + B = {a + b , a ∈ A, b ∈ B}. Montrer que A + B est un intervalle.
15
5. On note AB = {ab , a ∈ A , b ∈ B}. Montrer que AB est un intervalle.

√ √
Exercice 5. Soient x et y deux rationnels distincts tels que x et y soient irrationnels.
√ √ √ √
1. On considère les deux réels x + y et x − y. Montrer que leur produit est
rationnel, leur somme irrationnelle. En déduire qu’ils sont irrationnels.
√ √
2. Soient r et s deux rationnels. Montrer que r x + s y est irrationnel.
√ √
3. Montrer par des exemples que x y peut être rationnel ou irrationnel.
4. Montrer que les réels suivants sont irrationnels.
√ √ √ √ √
1 + 2 , 2 + 3 , ( 2 + 3)2 ,
√ √ √ √ √ √ √ √ √
2 + 3 − 6 , 2 − 3 + 6 , ( 2 + 3 + 6)2 .
Exercice 6. Soit I un intervalle de R contenant deux points distincts. Montrer que I
contient :
1. une infinité de rationnels,
2. une infinité d’irrationnels,
3. une infinité de nombres décimaux,
4. une infinité de nombres multiples entiers d’une certaine puissance négative de 2
(nombres dyadiques).
2.3 QCM
rapporte 2 points.
Question 1. Soient x et y deux réels quelconques.
A Si x < y alors x2 6 y 2 .
B Si 0 < x < y alors 0 < 1/y < 1/x.
C Si x < y alors 1 − x > 1 − y.
D Si x < y alors x2 < xy.
E Si 0 < x < y alors xy 2 < x2 y.
Question 2. On considère l’ensemble A suivant.
n o
A = (−2)n , n ∈ Z .
A L’ensemble A est majoré.

B L’ensemble A possède une borne inférieure finie.
16
C L’ensemble A possède un plus petit élément.

D sup(A) = +∞.
E inf(A ∩ R+ ) = 0.
Question 3. On considère l’ensemble A suivant.
n o
A = 1 + (−1)n+1 + (−1/2)n , n ∈ N .
A L’ensemble A est majoré.

B L’ensemble A possède un plus grand élément.
C sup(A) = 2.
D 1 est un minorant de A.
E inf(A ∩ R+ ) = −1.
Question 4. Soit x un réel.
A Si pour tout ε strictement positif x < ε, alors x = 0.
B Si pour tout ε strictement positif x2 < ε, alors x = 0.
C Si pour tout entier n strictement positif x < n, alors x 6 0.
D Si pour tout entier n strictement positif x < 2−n , alors x 6 0.
E Si pour tout entier n strictement positif x < n−2 , alors x = 0.
Question 5. Soit I un intervalle de R.
A Si I contient −3 et 1, alors [0, 1] ⊂ I.
B Si I contient −3 et 1, alors I est borné.
C Si I est majoré, alors il admet un plus grand élément.
D Si I contient sa borne supérieure, alors il contient au moins deux réels.
E Si I est non vide et non majoré, alors il contient au moins deux réels.
6. Soit x un réel.
Question √ √
A Si x est irrationnel, alors 4 x est irrationnel.
√ √
B Si x est rationnel, alors 3 x est irrationnel.
√ √
C Si x est irrationnel, alors 3x est irrationnel.
√
D Si x est rationnel, alors x3 est rationnel.
√ √
E Si 4 x est irrationnel, alors 3 x est irrationnel.
A Si I est non vide, alors il contient au moins un rationnel.
B Si I contient au moins deux réels distincts, alors il contient au moins deux
irrationnels.
C Si I contient un rationnel et un irrationnel, alors il contient un nombre décimal.
D Si I contient un nombre rationnel, alors il contient un nombre décimal.
E Si I contient un multiple entier d’une puissance négative de 2, alors il contient
un irrationnel.
17

A |x − y| 6 |x| + |y|.
B |x| − |y| 6 |x − y|.
C |x − y| 6 |x| − |y| .
D |x + y| < |x| + |y|.
E |x + y| < |x − y| + 2|y|.
n 9. Soit a un réel et oε un réel strictement positif.
Question
A x ∈ R , |x| < |a − ε| =]a − ε, a + ε[.
n o
B x ∈ R , |x − a| > ε =]a − ε, a + ε[.
n o
C x ∈ R , |a − x| 6 ε = [a − ε, a + ε].
n o
D x ∈ R , x − a > ε =] − ∞, a + ε[.
n o
E x ∈ R , |x| < |a − ε| =] − |a − ε|, |a − ε|[.
Question 10. Soit x ∈ R+ \ N un réel positif non entier.
A b−xc = −bxc.
B b1 − xc = −bxc.
C x + D(x) = bxc.
D D(2 − x) = 2 − D(x).
E D(−x) = 1 − D(x).
Réponses : 1–BC 2–DE 3–AC 4–BD 5–AE 6–AD 7–BC 8–AB 9–CE 10–BE
2.4 Devoir
répondu.
Questions de cours : Soit A une partie non vide et majorée de R. Soit a un réel.
1. Quand dit-on que a est un majorant de A ?
2. Quand dit-on que a est le plus grand élément de A ?
3. Quand dit-on que a est la borne supérieure de A ?
4. Quand dit-on que A est un intervalle ?
5. Démontrer que si A est un intervalle majoré, non minoré, et si a est la borne
supérieure de A, alors A =] − ∞, a [ ou bien A =] − ∞, a ].
Exercice 1 : Soit A une partie non vide de R+ et B une partie non vide de R+∗ . On
note A : B l’ensemble des quotients d’un élément de A par un élément de B.
n o
A : B = a/b , a ∈ A , b ∈ B .
18
1. Montrer que si m est un minorant de A et M un majorant de B alors m/M est

un minorant de A : B.
2. Montrer que si B n’est pas majorée alors :
∀ε > 0 , ∃x ∈ A : B , x<ε.
3. Montrer que si B n’est pas majorée, alors inf(A : B) = 0.

4. Montrer que si A 6= {0} et si inf(B) = 0 alors A : B n’est pas majoré.
5. On suppose que A et B sont deux intervalles. Montrer que A : B est un intervalle.
6. Soit ε un réel strictement positif quelconque. On pose et A = B =]0, ε]. Montrer
que A : B = R+∗ .
Exercice 2 : Dans tout l’exercice, x ∈ R+ \ Q désigne un irrationnel positif.
√
1. Montrer que pour tout n ∈ N∗ , n x = x1/n est irrationnel.
2. Montrer par un exemple que x2 peut être rationnel.
3. Montrer que si x2 est rationnel, alors pour tout n ∈ N, x2n est rationnel et x2n+1
est irrationnel.
4. Soient a, b ∈ Q deux rationnels. Montrer que ax + b est rationnel si et seulement
si a = 0.
5. Soient a, b, c, d ∈ Q quatre rationnels. On suppose que c et d ne sont pas tous
les deux nuls. Montrer que (ax + b)/(cx + d) est rationnel si et seulement si
ad − bc = 0.
Exercice 3 : Soient x et y deux réels quelconques.
1. Montrer, en utilisant l’inégalité triangulaire, que 2|x| 6 |x + y| + |x − y|.
2. En déduire que |x| + |y| 6 |x + y| + |x − y|.
Exercice 4 :
1. Soit x un réel et n un entier. Montrer que bn + xc = n + bxc.
2. Soient x et y deux réels. Montrer que bx + yc − bxc − byc ∈ {0, 1}.

1. On dit que a est un majorant de A si :
∀x ∈ A , x 6 a .
2. On dit que a est le plus grand élément de A si a est un majorant de A et s’il

appartient à A.
a ∈ A et ∀x ∈ A , x 6 a .
19
3. On dit que a est la borne supérieure de A si c’est le plus petit des majorants de
A.
4. On dit que A est un intervalle si tout point entre deux points de A est aussi dans
A.
∀x, y ∈ A , ∀z ∈ R , (x 6 z 6 y) =⇒ z ∈ A .
5. Démontrer que A =] − ∞, a [ ou bien A =] − ∞, a ] équivaut à montrer les deux
inclusions suivantes.
A ⊂ [−∞, a ] et ] − ∞, a [ ⊂ A .
Montrons d’abord la première. Par définition, la borne supérieure est un majo-

rant. Donc aucun réel strictement supérieur à a ne peut appartenir à A. Donc :
x ∈]
/ − ∞, a ] =⇒ x ∈
/A.
La contraposée est :
x ∈ A =⇒ x ∈] − ∞, a] ,
ce qui équivaut à la première inclusion.
Montrons la seconde inclusion. Soit x un réel strictement inférieur à a. Puisque
A n’est pas minoré, x n’est pas un minorant. Donc il existe c ∈ A tel que c < x.
Puisque a est le plus petit des majorants de A, x n’est pas un majorant. Donc il
existe d ∈ A tel que x < d. Les deux réels c et d appartiennent à A et sont tels
que c < x < d. Comme A est un intervalle, ceci entraîne que x appartient à A.
Au total nous avons montré que
x < a =⇒ x ∈ A ,
soit ] − ∞, a [ ⊂ A.
Exercice 1 :
1. Observons que M est strictement positif, car B ⊂ R+∗ . Si m < 0, alors m/M < 0
et la propriété annoncée est vraie puisque A : B ⊂ R+ . Supposons donc m > 0.
Pour tout y ∈ B, 0 < y 6 M , donc 0 < 1/M 6 1/y. Pour tout x ∈ A, 0 6 m 6 x.
Donc :
m x
∀x ∈ A , ∀y ∈ B , 6 .
M y
Donc m/M est un minorant de A : B.
2. Soit a un élément quelconque de A. Comme B n’est pas majoré, il existe y ∈ B
tel que y > a/ε > 0. Donc x = a/y < ε, or x ∈ A : B, d’où le résultat.
3. Par hypothèse, tout élément de A : B est positif ou nul. Donc 0 est un minorant de
A : B. D’après la question précédente, pour tout ε > 0, ε n’est pas un minorant de
A : B. Donc 0 est le plus grand des minorants de A : B ; c’est la borne inférieure.
20
4. Par hypothèse, A contient un réel strictement positif. Si inf(B) = 0 alors pour

tout ε > 0, il existe y ∈ B tel que 0 < y < ε. Soit M un réel strictement positif
quelconque. Soit y ∈ B tel que 0 < y < a/M . Alors a/y ∈ A : B et a/y > M .
Donc A : B n’est pas majoré.
5. Si A : B est un singleton, c’est un intervalle particulier. Sinon nous devons montrer
que
∀z1 , z2 ∈ A : B , ∀z ∈ R , (z1 < z < z2 ) =⇒ z ∈ A : B .
Par hypothèse, il existe x1 ∈ A et y1 ∈ B tels que z1 = x1 /y1 . De même, il existe
x1 ∈ A et y1 ∈ B tels que z1 = x1 /y1 . Supposons d’abord y1 6 y2 . Alors :
x1 x2 y1
<z< =⇒ x1 < zy1 < x2 6 x2 .
y1 y2 y2
Comme A est un intervalle, tout réel compris entre x1 et x2 appartient à A, donc
zy1 appartient à A, donc z appartient à A : B.
Supposons maintenant que y1 > y2 . Alors x1 /y1 < x1 /y2 . Si z = x1 /y2 , z ∈ A : B.
Sinon, de deux choses l’une : soit z < x1 /y2 , soit z > x1 /y2 . Dans le premier cas :
x1 x1 x1
<z< ⇐⇒ y2 < < y1 .
y1 y2 z
Comme B est un intervalle, x1 /z = y appartient à B, donc z = x1 /y appartient
à A : B.
Dans le second cas :
x1 x2
<z< ⇐⇒ x1 < zy2 < x2 .
y2 y2
Comme A est un intervalle, zy2 = x appartient à A, donc z = x/y2 appartient à
A : B.
6. Soit x un réel strictement positif. Supposons d’abord x 6 1. Ecrivons x = xε/ε.
Or xε ∈ A et ε ∈ B. Donc x ∈ A : B. Supposons maintenant x > 1. Ecrivons :
(xε)/x
x= .
ε/x
Comme (xε)/x = ε ∈ A et ε/x ∈ B, on en déduit encore que x ∈ A : B.
Exercice 2 :
1. Démontrons la contraposée : si x1/n est rationnel, alors x = (x1/n )n est rationnel
(car le produit de deux rationnels est rationnel). D’où le résultat.
√
2. x = 2 est irrationnel mais x2 = 2 est rationnel.
3. Pour n = 0, x2n = 1 ∈ Q. Pour n > 1, x2n = (x2 )n ∈ Q. Supposons que x2n+1
et x2n soient rationnels, alors x = x2n+1 /x2n est rationnel, d’où le résultat, par
contraposée.
21
4. Si a = 0 alors ax + b = b ∈ Q. Montrons la réciproque : si ax + b ∈ Q, alors

ax = (ax + b) − b ∈ Q. Supposons a 6= 0 et ax ∈ Q. Alors x = ax/a ∈ Q. D’où le
résultat, par contraposée.
5. L’hypothèse entraîne que cx + d est non nul. Posons :
ax + b
= r ⇐⇒ x(a − rc) = (rd − b) .
cx + d
Si r est rationnel, alors rd − b est rationnel. D’après la question précédente, c’est
le cas si et seulement si a = rc et b = rd. Alors ad − bc = rcd − rcd = 0.
Réciproquement, supposons ad − bc = 0. Si ad = bc = 0, on distingue 3 cas
(rappelons que c et d ne sont pas tous les deux nuls) :
• a = 0 et b = 0 : alors (ax + b)/cx + d) = 0 ∈ Q ;
• a = 0 et c = 0 : alors (ax + b)/cx + d) = b/d ∈ Q ;
• d = 0 et b = 0 ; alors (ax + b)/cx + d) = a/c ∈ Q.
Si ad = bc 6= 0 alors :
ax + b b adx + bd b
= = ∈Q.
cx + d d bcx + bd d
Exercice 3 : Soient x et y deux réels quelconques.
1.
2|x| = |2x| = |(x + y) + (x − y)| 6 |x + y| + |x − y| .
2. On applique le résultat en échangeant x et y :
2|y| 6 |y + x| + |y − x| = |x + y| + |x − y| .
En ajoutant les deux inégalités précédentes, on obtient :
2|x| + 2|y| 6 2|x + y| + 2|x − y| .
D’où le résultat en divisant les deux membres par 2.
Exercice 4 :
1. Par définition la partie entière de n + x est le plus grand entier inférieur ou égal
à n + x. Or pour tout entier k,
k 6 n + x ⇐⇒ k − n 6 x .
En utilisant la condition nécessaire, pour k = bn + xc, bn + xc − n 6 bxc. En
utilisant la condition suffisante pour k − n = bxc, n + bxc 6 bx + nc. D’où le
résultat.
2.
bx + yc = b bxc + D(x) + byc + D(y) c = bxc + byc + bD(x) + D(y)c ,
d’après la question précédente. Or par définition la partie décimale d’un réel
appartient à [0, 1[. Donc D(x)+D(y) ∈ [0, 2[, donc la partie entière de D(x)+D(y)
vaut soit 0 soit 1.
22
3 Compléments
3.1 Papier normalisé
Les dimensions des feuilles de papier que vous avez sous les yeux sont irrationnelles !
La norme internationale ISO 216 définit les formats utilisés dans la plupart des pays
aujourd’hui, dont le très connu format A4. À l’origine, le standard fut adopté par la
DIN (Deutsche Institut für Normung, organisme de normalisation et standardisation
allemand) en Allemagne en 1922. Certaines grandeurs avaient été définies en France
durant la Révolution, puis oubliées. La norme ISO 216 définit trois séries de format
de papier, A, B et C. La série C est principalement utilisée pour les enveloppes. Voici
comment est définie la série A.
Si on divise en deux une feuille, on souhaite que la plus grande et la plus petite
dimension des deux moitiés restent dans le même rapport que celles de la feuille entière.
Par exemple soient L et l la plus grande et la plus petite dimension d’une feuille A0.
Quand on la divise en deux, on obtient deux feuilles A1 dont la plus grande dimension
est l et la plus petite L/2. On doit avoir :
L l
= ,
l L/2
√
soit L2 /2 = l2 . Le rapport L/l vaut donc 2. Les dimensions de la feuille A0 sont
choisies de √
sorte que sa surface soit 1 mètre carré. Exprimée en mètres, L doit donc
vérifier L / 2 = 1, soit L = 21/4 . Voici les dimensions théoriques des feuilles de papier
2
de A0 à A4.
Papier L l
A0 21/4 2−1/4
A1 2−1/4 2−3/4
A2 2−3/4 2−5/4
A3 2−5/4 2−7/4
A4 2−7/4 2−9/4
Les approximations décimales à 10−3 près de 2−9/4 et 2−7/4 sont 0.210 et 0.297 ; ce sont
bien les dimensions de vos feuilles de papier, exprimées en mètres.
3.2 La constante de Ramanujan

Le mathématicien indien S. Ramanujan (1887-1920) a donné dans sa courte vie
beaucoup d’énoncés justes et très peu d’explications sur sa démarche. Contrairement
à la légende, il n’a jamais affirmé :
√
eπ 163
∈N.
23
√
Les trois nombres e, π et 163 sont irrationnels. Il n’est bien sûr pas exclu qu’en
combinant des irrationnels on tombe sur des rationnels ou même des entiers. L’exemple
le plus célèbre est celui de la formule d’Euler : eiπ = −1.
Il s’en faut de très peu que l’affirmation
√ supposée de Ramanujan soit vraie. Voici
π 163
les 30 premiers chiffres significatifs de e :
√
eπ 163
= 262537412640768743.999999999999 . . .
La partie entière a 18 chiffres, et les 12 premières décimales valent 9. Mais la treizième
décimale vaut 2 et le nombre n’est pas entier. Ce fait
√ était connu bien avant Ramanujan,
par Hermite en 1859. Pourquoi alors le nombre eπ 163 porte-t-il le nom de « constante
de Ramanujan » ? À cause d’un poisson d’avril monté par M. Gardner en 1975 : on ne
prête qu’aux riches !
3.3 Nombres incommensurables

Pour les Grecs, les nombres représentaient des longueurs. Or ils avaient compris
qu’il existait des longueurs, comme le côté et la diagonale d’un carré, qui ne pouvaient
pas être mesurées en nombres entiers dans la même unité. C’est la raison pour laquelle
on dit que deux √ réels dont le rapport
√ n’est pas rationnel sont incommensurables. C’est
le cas de 1 et 2, mais aussi de 2 et π, de π et e, etc. . .
Supposons que l’on utilise un nombre y comme unité pour mesurer les multiples
d’un autre : {nx , n ∈ N}. Pour tout n, on trouve un nombre entier d’unités, bnx/yc,
puis un reste qui est inférieur à y. Si x/y est rationnel, il n’y a qu’un nombre fini de
restes possibles. Par contre si x/y 6∈ Q, non seulement il y a une infinité de restes
possibles, mais ces restes sont denses dans l’intervalle [0, y]. Nous commençons par le
cas particulier y = 1.
Proposition 6. Soit x un irrationnel. L’ensemble des parties décimales des multiples
de x est dense dans [0, 1].
En d’autres termes, pour tout intervalle inclus dans [0, 1], il existe un entier n tel
que D(nx) = nx − bnxc appartient à cet intervalle.
Démonstration : Soit A = {D(nx) , n ∈ N∗ }. Nous allons montrer que la borne

inférieure de A est 0.
Le fait que x soit irrationnel entraîne que A ne contient ni 0 ni 1, et aussi que
les éléments de A sont tous différents. Commençons par la règle d’addition suivante,
valable pour deux réels y et z quelconques :
(
D(y) + D(z) si D(y) + D(z) < 1
D(y + z) =
D(y) + D(z) − 1 si D(y) + D(z) > 1
Pour un n donné, notons δ la partie décimale de nx et k = b1/δc. Comme x est

irrationnel, 1/δ l’est aussi et on a kδ < 1 < (k + 1)δ, donc 0 < (k + 1)δ − 1 < δ. La
24
partie décimale de (k + 1)nx est (k + 1)δ − 1 < δ. Ceci entraîne que l’ensemble A ne
peut pas avoir de plus petit élément. Notons a sa borne inférieure. C’est aussi la borne
inférieure de An = {D(mx) , m > n}, puisque A n’a pas de plus petit élément.
Fixons ε > 0. Il existe n tel que a < D(nx) < a+ε. Mais aussi, il existe m > n tel que
a < D(mx) < a+D(nx), donc 0 < D(nx)−D(mx) < ε. Posons δ = D(nx)−D(mx) et
k = b1/δc. Toujours parce que x est irrationnel, 1/δ ne peut pas être entier. Ecrivons :
k(m − n)x = k(bmxc − bnxc) − 1 + (1 − kδ) .
Cette écriture montre que D(k(m − n)x) = 1 − kδ < δ < ε. Comme ε est quelconque,
nous avons montré que la borne inférieure de A est 0.
Soient a et b deux réels tels que 0 < a < b, et ε < b − a. Soit n un entier tel que
D(nx) = δ < ε. Soit k le plus petit entier tel que a < kδ < b. On a a < D(knx) < b,
ce qui montre que l’ensemble A est dense dans [0, 1].
Considérons maintenant deux réels x et y incommensurables. Si z est un réel, on
notera z mod y (« z modulo y »), le réel yD(z/y), qui appartient à l’intervalle [0, y[.
Si x et y sont incommensurables, alors l’ensemble {nx mod y , n ∈ N} est dense dans
[0, y]. Ceci découle de la proposition 6 appliquée à x/y.
Par exemple, puisque π est irrationnel, 2π et 1/(2π) le sont aussi. Donc 1 et 2π
sont incommensurables. D’après ce qui précède, {n mod 2π , n ∈ N} est dense dans
[0, 2π]. On déduit de la continuité des fonctions sin et cos que {sin(n) , n ∈ N} et
{cos(n) , n ∈ N} sont denses dans [−1, 1].
3.4 Les frères Banu-Musâ

Il vivait à Bagdad sous le règne du Calife Haroun al-Rashid ; il avait commencé
sa vie comme voleur puis s’était élevé dans l’échelle sociale par son intelligence. Il ne
s’appelait pas Aladin mais Musâ ibn Shakir, et était devenu un astronome réputé à
la cour du Calife. Entre 803 et 809, il eut trois fils : Jafar Muhammed, Ahmed et
al-Hassan. À la mort de leur père, l’éducation des trois frères fut prise en charge par
le successeur d’Haroun al-Rashid : al-Mahmoun ; éducation poussée d’ailleurs : géo-
métrie, mécanique, musique, astronomie. . . Plus tard les trois frères se spécialisèrent,
qui dans la géométrie, qui dans la mécanique, qui dans la musique, mais ils conti-
nuèrent à signer collectivement leurs découvertes. Poursuivant le mécénat scientifique
de son prédécesseur, al-Mahmoun créa une « Maison de la Sagesse », où les écrits des
Grecs étaient traduits, une bibliothèque (la première de grande ampleur depuis Alexan-
drie), et plusieurs observatoires. Outre les frères Banu-Musâ, d’autres noms célèbres
furent pensionnaires de la Maison de la Sagesse : al-Khawarizmi, Thabit ibn Qurra,
al-Kindi. . .
Les frères Banu-Musâ furent les premiers scientifiques arabes à étudier les textes
grecs, en particulier ceux d’Archimède. Leur livre le plus anciennement connu en occi-
dent, grâce à sa traduction par Gérard de Crémone au 12e siècle, est intitulé « Livre
de la mesure des figures planes et sphériques ». Du point de vue des résultats, ce livre
25
n’apporte rien de fondamental par rapport à Archimède. En revanche, les auteurs y

amorcent un saut conceptuel crucial, en évoluant vers une notion de nombre plus gé-
nérale. Par exemple π est considéré comme la quantité qui multipliée par le diamètre
d’un cercle donne sa circonférence. Ceci donne un même statut à π, au diamètre et à la
circonférence, au lieu de considérer comme les Grecs que π (un rapport) est de nature
différente des deux autres quantités (qui sont des longueurs).
Entre autres réalisations remarquables, les frères Banu-Musâ ont écrit en 850 un
« Livre des dispositifs ingénieux », dans lequel ils donnent les plans d’une centaine de
dispositifs mécaniques et leurs instructions d’utilisation : manivelle, valve, soupape,
masque à gaz, pompe, robinet, bouilloire, fontaine automatique, etc. Un de leurs chefs-
d’œuvre est un orgue hydraulique entièrement automatique, qui fonctionnait avec des
rouleaux à picots : un principe encore utilisé de nos jours. Une autre de leurs inventions
musicales, la flûte automatique, est considérée comme la première machine program-
mable.
3.5 La numérisation des raisons

Au temps d’Euclide 1 , les rapports de longueurs, ou raisons (ratio en latin), ne sont
pas considérés et manipulés comme des nombres. Tout le Moyen-Âge arabe ou euro-
péen cherchera à apprivoiser une numérisation des raisons, avec des contributions re-
marquables comme celles d’Omar Kayyam (1049-1125) et Nicolas Oresme (1325-1382),
par la pratique des proportions. Mais dans la mesure où on ne savait pas rendre compte
d’une telle numérisation par une procédure théorique ayant la netteté de celle d’Eu-
clide, il restait, dans la pratique des mathématiciens exigeants,
√ une profonde différence
de nature opératoire entre des quantités comme 1, 3, 5/3, 2 ou π. Cette différence est
balayée d’un coup par Simon Stevin (1548-1620) dans son traité des incommensurables
grandeurs en 1585. Voici ce qu’il écrit.
C’est chose
√ vulgaire, entre les auteurs d’arithmétique, de traiter de nombres
comme 8 et semblables, et qu’ils appellent absurdes, irrationnels, irrégu-
liers, sourds 2 , etc. Ce que nous nions, à quelque nombre à venir. Mais par
quelle raison l’adversaire le pourra-t-il prouver ? Il me dit premièrement que
racine√de 8 est à nombre arithmétique (comme 3 ou 4) incommensurable,
ergo 8 est absurde. Vu que l’incommensurance ne cause pas d’absurdité
des termes incommensurables, ce qui s’éprouve par la ligne et superficie qui
sont grandeurs incommensurables ; c’est-à-dire qu’ils ne reçoivent point de
commune mesure, toutefois ni ligne ni superficie n’est quantité absurde ni
explicable : car disant que celle-là est la ligne et celle-ci, superficie, nous
les expliquons. Et encore que cette incommensurance procréait (ce qui tou-
tefois ne peut être, mais posons les cas) absurdité à l’une des quantités
comparées, nous trouverons le nombre arithmétique autant coupable que
1. Ceci est tiré de Mathématiques au fil des âges, J. Dhombres et al. Gauthier-Villars (1987).
2. Le mot sourd vient du vocable arabe signifiant irrationnel.
26
le radical, car, comme la sphère autant que le cube et le cube autant que
la sphère, est cause de leur dissimilitude ; ainsi, de ces nombres. Mais pour
faire autre preuve par deux quantités d’un même genre de grandeur, pre-
nons le côté et diagonale d’un carré, qui sont les lignes entre elles (par la
dernière proposition du livre X d’Euclide) incommensurables, toutefois ni
diagonale, ni côté (abstrait de nombre) n’est ligne absurde ou irrationnelle,
l’incommensurance donc des quantités n’est pas l’absurdité d’icelles, mais
c’est plutôt leur naturelle mutuelle habitude.
√
Il me manque de lui expliquer quelle chose soit 8. Je lui réponds qu’il
m’explique quelle chose soit 3/4 (qui selon son dire est rationnel) et je la
lui expliquerai.
3.6 Les coupures de Dedekind

La construction rigoureuse de l’ensemble des réels ne date que de la seconde moitié
du 19e siècle. De nombreux mathématiciens y ont participé, parmi eux Julius Dedekind
(1831-1877). Voici ce qu’il écrivit dans « Continuité et nombres rationnels » en 1872,
pour définir ce que l’on nommera coupures de Dedekind.
[. . . ] La comparaison faite ci-dessus entre le domaine des nombres rationnels
et une droite a induit à reconnaître que le premier est lacunaire, incomplet
ou discontinu, tandis que la droite doit être dite complète, non-lacunaire
ou continue. Mais en quoi consiste en fait cette continuité ?
Tout doit être contenu dans la réponse donnée à cette question, et elle
seule fournit un fondement scientifique aux recherches portant sur tous les
domaines continus. On n’obtient rien bien sûr par de vagues discours sur
la connexion ininterrompue existant dans les plus infimes parties ; il s’agit
d’indiquer une caractéristique de la continuité, utilisable comme base de
déductions effectives. J’y ai réfléchi longtemps en vain, mais finalement
j’ai trouvé ce que je cherchais. Les avis sur cette découverte seront peut-
être partagés ; je crois cependant que la plupart des gens en trouveront le
contenu très trivial. Il consiste en ceci. Au paragraphe précédent, on attire
l’attention sur le fait que tout point p de la droite opère une division de
celle-ci en deux portions telles que tout point d’une portion est à gauche
de tout point de l’autre. Je trouve alors l’essence de la continuité dans la
réciproque, c’est-à-dire dans le principe suivant :
Si tous les points de la droite sont répartis en deux classes, telles que tout
point de la première classe soit situé à gauche de tout point de la seconde
classe, il existe un point et un seul qui opère cette partition de tous les
points en deux classes, cette découpe de la droite en deux portions.
27
3.7 Point fixe d’une application croissante

Pour illustrer l’utilisation de la notion de borne supérieure, nous allons démontrer
la proposition suivante.
Proposition 7. Soit f une application croissante de l’intervalle [0, 1] dans lui-même :
∀x, y ∈ [0, 1] , x 6 y =⇒ f (x) 6 f (y) .
Alors f admet un point fixe :
∃a ∈ [0, 1] , f (a) = a .
Démonstration : Soit A l’ensemble des réels x dans [0, 1] tels que l’image de x dépasse
x:
A = {x ∈ [0, 1] , f (x) > x} .
Par hypothèse l’ensemble A est non vide puisqu’il contient 0, et il est majoré par 1.
Notons a sa borne supérieure. Nous allons montrer d’abord f (a) > a, puis f (a) 6 a.
Par la proposition 1, pour tout ε > 0, il existe x ∈ A tel que a − ε 6 x 6 a. Comme
x est dans A, f (x) > x, et puisque f est croissante, f (x) 6 f (a). Donc :
f (a) > f (x) > x > a − ε .
Pour tout ε, f (a) > a − ε, donc f (a) > a par la proposition 3.

De f (a) > a, on déduit f (f (a)) > f (a) car f est croissante. Donc f (a) ∈ A, par
définition de A. Donc f (a) 6 a, car a est la borne supérieure de A.
Vous pouvez refaire cette démonstration en remplaçant A par
B = {x ∈ [0, 1] , f (x) 6 x} ,
et en étudiant la borne inférieure de B.
28
Axiomatique des nombres

Christine Laurent-Thiébaut
Enfin, vous allez apprendre comment définir les ensembles de nombres que vous
manipulez depuis si longtemps. Ce chapitre n’est pas indispensable au reste du cours,
mais fait néanmoins partie de la culture générale de tout mathématicien. Pour le com-
prendre, vous n’aurez besoin que d’une bonne maîtrise de la notion d’ensemble quotient,
ainsi que des notions de base sur les structures algébriques : groupes, anneaux, corps
et espaces vectoriels.
Table des matières

1 Cours 1
1.1 Contruction des entiers naturels . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Bases de numération . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Construction des entiers relatifs . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Construction des rationnels . . . . . . . . . . . . . . . . . . . . . . . . 18
1.5 Construction des réels . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.6 Construction des complexes . . . . . . . . . . . . . . . . . . . . . . . . 34
2 Entraînement 36
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3 Compléments 53
3.1 Every Texan kills a Texan . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.2 Les démons de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.3 Pourquoi pas douze ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Et après ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
27 septembre 2014
Maths en Ligne Axiomatique des nombres UJF Grenoble
1 Cours
1.1 Contruction des entiers naturels
Nous allons proposer une définition axiomatique de l’ensemble N des entiers natu-
rels. Nous déduirons ensuite de cette définition axiomatique les principales propriétés
de N. En particulier nous définirons l’addition de deux entiers naturels, la relation
d’ordre sur N et la multiplication de deux entiers naturels.
Nous avons choisi d’exposer ici l’axiomatique dite de Peano. D’autres choix sont
possibles comme par exemple l’axiomatique de l’ordre, comme nous le verrons plus
loin.
Définition 1. On appelle triplet naturel un triplet (O, N , s), où N est un ensemble, O
un élément de N et s une application de N dans N qui vérifie les propriétés suivantes :
(P1 ) s est injective,
(P2 ) s(N ) = N \ {O},
(P3 ) Si A est une partie de N telle que si O ∈ A et s(A) ⊂ A alors A = N .
Les 3 propriétés (P1 ), (P2 ), (P3 ) sont les axiomes de Peano (bien qu’ils soient dus à
Dedekind). L’application s est l’application « successeur » : comprenez O =« origine »
ou « zéro », et s(n) = n + 1 ; mais ne le dites pas tout haut tant que nous n’avons pas
défini l’addition.
Il convient de s’assurer qu’il existe effectivement de tels triplets (O, N , s). . . sans
bien sûr invoquer l’ensemble des entiers que nous sommes en train de construire. On
peut en exhiber dans différents contextes, selon le langage logique que l’on suppose
connu. Puisque la notion de triplet naturel suppose la notion d’ensemble, nous pouvons
supposer au minimum que les notions d’ensemble vide et de réunion sont connues. Dans
notre premier exemple N sera un ensemble d’ensembles dont le zéro est l’ensemble vide.
Définissons l’application successeur s par s(A) = A ∪ {A}. Les premiers éléments de
N sont :
∅ , {∅} , {∅, {∅}} , {∅, {∅}, {∅, {∅}}} , {∅, {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}} . . .
Ce n’est pas le plus commode pour compter, d’accord. Disons que vous soyez doté de la
notion de chaîne de caractères, et de la concaténation. Commencez par la chaîne vide,
puis définissez le successeur d’une chaîne comme la concaténation de cette chaîne avec
la chaîne composée d’un seul caractère, mettons a. Voici les premiers éléments.
[] , [a] , [a, a] , [a, a, a] , [a, a, a, a] , [a, a, a, a, a] . . .
Disons maintenant que vous soyez à la préhistoire, et que vos « naturels » sont des
paquets de barres, tracées sur la paroi de la caverne. L’application successeur consiste
à tracer une nouvelle barre à la suite des barres déjà écrites.
| , || ||| , |||| , ||||| , |||||| . . .
1
L’axiome (P3 ) s’appelle l’axiome de récurrence. On en déduit la formulation clas-

sique du raisonnement par récurrence.
Proposition 1 (raisonnement par récurrence). Soit (O, N , s) un triplet naturel et P
une propriété définie sur N , qui vérifie :
– P(O) est vraie
– Pour tout a ∈ N , (P(a) vraie) implique (P(s(a)) vraie).
Alors P(a) est vraie pour tout a ∈ N .
Démonstration : Il suffit d’appliquer l’axiome (P3 ) au sous-ensemble

A = {a ∈ N | P(a) est vraie}
de N .
Théorème 1. Soient (O1 , N1 , s1 ) et (O2 , N2 , s2 ) deux triplets qui vérifient les axiomes
(P1 ), (P2 ), (P3 ), il existe une unique application bijective f12 : N1 → N2 telle que
f12 (O1 ) = O2 , (1)
et
f12 ◦ s1 = s2 ◦ f12 . (2)
Démonstration : Vérifions que les deux conditions (1) et (2) définissent une unique
application f12 de N1 dans N2 . Soit A l’ensemble des éléments a de N1 pour lesquels
f12 (a) est défini de manière unique. La partie A satisfait les hypothèses de l’axiome
(P3 ) et par conséquent A = N1 .
De manière analogue on définit f21 en échangeant les rôles de N1 et N2 . Montrons
que f21 ◦ f12 = IdN1 par récurrence. Pour a ∈ N1 considérons la propriété :
P(a) : f21 ◦ f12 (a) = a.
Par définition de f12 et f21 , P(O1 ) est vraie. Soit a ∈ N1 , supposons que P(a) est vraie,
c’est-à-dire f21 ◦ f12 (a) = a. Alors
f21 ◦ f12 (s1 (a)) = f21 (s2 (f12 (a)) = s1 (f21 ◦ f12 (a)) = s1 (a)
et P(s(a)) est donc vraie. De la même manière on montrerait que f12 ◦ f21 = IdN2 , ce
qui prouve que f12 est bijective.
Le Théorème 1 montre que les axiomes (P1 ), (P2 ), (P3 ) caractérisent le triplet
(O, N , s) à isomorphisme près.
On peut donc identifier tous les triplets (O, N , s) qui vérifient les axiomes (P1 ),
(P2 ), (P3 ) à un triplet modèle que l’on notera (0, N, s) et que l’on appelle ensemble des
entiers naturels.
Opérations sur les entiers
Sur l’ensemble des entiers naturels, nous allons maintenant définir l’addition, la multi-
plication et la relation d’ordre. Commençons par l’addition.
2
Définition 2. On définit par récurrence sur l’ensemble N des entiers naturels, une loi
de composition interne appelée addition et notée +, en posant :
(i) ∀a ∈ N, a + 0 = a
(ii) ∀(a, b) ∈ N2 , a + s(b) = s(a + b)
Ces propriétés définissent complètement la loi +. En effet considérons la partie A
de N définie par
A = {b ∈ N | ∀a ∈ N a + b est bien défini}.
On vérifie facilement que 0 ∈ A et s(A) ⊂ A d’où A = N par (P3 ).
Traditionnellement on note 1 = s(0) et, par définition de la loi +, on a s(a) =
s(a + 0) = a + s(0) = a + 1 pour tout a ∈ N.
Proposition 2. La loi + définie ci-dessus est associative, commutative, admet 0
comme élément neutre et tout entier naturel est régulier par rapport à cette opération.
Démonstration :
– Associativité : Soient a, b, c ∈ N, on montre que (a + b) + c = a + (b + c) par
récurrence sur c, a et b étant fixés. Le cas c = 0 est une conséquence immédiate
de (i). Supposons que (a + b) + c = a + (b + c) alors
(a + b) + s(c) = s((a + b) + c) d’après (ii)
= s(a + (b + c)) par hypothèse de récurrence
= a + s(b + c) d’après (ii)
= a + (b + s(c)) d’après (ii),
d’où le résultat.
– Élément neutre : Montrons par récurrence que pour tout a ∈ N on a 0 + a = a,
d’après (i) on aura a + 0 = 0 + a = a et 0 sera donc l’élément neutre de la loi +.
Par définition de +, 0 + 0 = 0 et pour a ∈ N tel que 0 + a = a, on a 0 + s(a) =
s(0 + a) = s(a). Par conséquent si A = {a ∈ N | 0 + a = a}, 0 ∈ A et s(A) ⊂ A
et par (P3 ) A = N.
– Commutativité : Si a ∈ N est fixé, montrons par récurrence sur b que a+b = b+a.
On sait déjà que a + 0 = 0 + a, car 0 est l’élément neutre de +.
Montrons que a + 1 = 1 + a pour tout a ∈ N. C’est vrai pour a = 0 et si c’est
vrai pour un a donné, l’associativité permet d’écrire
s(a) + 1 = (a + 1) + 1 = (1 + a) + 1 = 1 + (a + 1) = 1 + s(a)
ce qui achève le raisonnement.
Supposons que a + b = b + a, alors grâce à l’associativité,
a + s(b) = a + (b + 1) = (a + b) + 1 = (b + a) + 1
= b + (a + 1) = b + (1 + a) = (b + 1) + a = s(b) + a
ce qui termine la récurrence.
3
– Régularité : Montrons que pour tous a, x et y de N on a
a + x = a + y =⇒ x = y. (3)
Soient x, y ∈ N, on pose A = {a ∈ N | a + x = a + y ⇒ x = y}. La partie

A contient 0, par définition de l’élément neutre. Soit a ∈ A, supposons que
s(a) + x = s(a) + y. Par la propriété (ii) de +, on obtient s(a + x) = s(a + y) et
grâce à l’injectivité de s (axiome (P2 )) a + x = a + y. Mais puisque a ∈ A, cela
implique x = y et donc s(A) ⊂ A d’où A = N par P3 .

Proposition 3. Soient a, b ∈ N tels que a + b = 0 alors a = b = 0.
Démonstration : Soit b ∈ N∗ , il existe alors c ∈ N tel que b = s(c) et si a ∈ N on a

a + b = a + s(c) = s(a + c) par définition de l’addition. Mais l’application s est à valeurs
dans N∗ et par conséquent a + b 6= 0. On a donc prouvé que si a, b ∈ N sont tels que
a + b = 0 alors b = 0 et de plus a = a + 0 = 0.
Passons maintenant à la relation d’ordre.
Définition 3. Soient (a, b) ∈ N2 , on dira que a 6 b, s’il existe c ∈ N tel que b = a + c.
Proposition 4. La relation 6 est une relation d’ordre sur N compatible avec l’addition.
Démonstration : Nous devons prouver que 6 est réflexive, antisymétrique, transitive

et que si a, b ∈ N vérifient a 6 b, alors a + n 6 b + n pour tout n ∈ N.
– Réflexivité : Pour tout a ∈ N, on a a = a + 0 par définition de l’addition, soit
a 6 a.
– Antisymétrie : Soient a, b ∈ N tels que a 6 b et b 6 a, c’est-à-dire il existe c, d ∈ N
tels que b = a + c et a = b + d. Par conséquent b = (b + d) + c et puisque + est
associative et que tout élément est régulier pour +, on a d + c = 0, d’où c = d = 0
par la Proposition 3, soit a = b.
– Transitivité : Soient a, b, c ∈ N tels que a 6 b et b 6 c, c’est-à-dire il existe
n, p ∈ N tel que b = a + n et c = b + p. Alors c = (a + n) + p = a + (n + p) car +
est associative, d’où a 6 c.
– Compatibilité avec l’addition : Soient a, b ∈ N tels que a 6 b, c’est-à-dire il existe
c ∈ N tel que b = a + c, et n ∈ N. Alors
b + n = (a + c) + n = a + (c + n) = a + (n + c) = (a + n) + c
grâce à l’associativité et à la commutativité de l’addition, soit a + n 6 b + n.

Proposition 5. L’ensemble ordonné (N, 6) vérifie les propriétés suivantes :

– 0 est le plus petit élément de N ;
4
– (O1 ) toute partie non vide de N possède un plus petit élément ;

– (O2 ) toute partie non vide et majorée de N possède un plus grand élément ;
– (O3 ) l’ensemble N n’admet pas de plus grand élément.
Les propriétés (O1 ), (O2 ) et (O3 ) constituent les axiomes de l’ordre : le terme axiome
peut vous sembler inappropri’e, car ce sont autant de propositions que nous allons dé-
montrer. Il se trouve que (O1 ), (O2 ) et (O3 ), si on les prend comme axiomes, constituent
une définition alternative de N, à partir de laquelle on peut démontrer ce qui précède.
Démonstration : Puisque 0 est élément neutre de l’addition, pour tout a ∈ N on a
a = 0 + a, soit 0 6 a par définition de la relation d’ordre. L’élément 0 de N est donc
son plus petit élément.
– Axiome (O1 ) : Soit A une partie non vide de N. Si 0 ∈ N, c’est terminé, 0 est le
plus petit élément de A. Si 0 ∈ / A, l’ensemble B = {n ∈ N\A | ∀a ∈ A, n 6 a} des
minorants stricts de A est non vide puisqu’il contient 0, de plus B 6= N puisque
A 6= ∅. Il résulte alors de l’axiome (P3 ) qu’il existe b ∈ B tel que s(b) = b + 1 ∈
/ B.
Vérifions que b + 1 est un minorant de A. Puisque b ∈ B, on a b 6 a pour tout
a ∈ A. Si a ∈ A, il existe donc c ∈ N tel que a = b + c avec c 6= 0 car b 6= a et donc
c = s(d) = d + 1. Par conséquent, grâce à l’associativité et à la commutativité
de l’addition, a = b + (d + 1) = (b + 1) + d, soit s(b) = b + 1 6 a. Mais s(b) ∈ A
car sinon il serait dans B ce qui contredirait la définition de b, c’est donc le plus
petit élément de a.
– Axiome (O3 ) : Supposons que N possède un plus grand élément N . Alors s(N ) =
N + 1 vérifie N 6 s(N ), par définition de la relation d’ordre, et comme N est le
plus grand élément de N, s(N ) 6 N et donc N = s(N ), c’est-à-dire N = N + 1
et par régularité de N pour l’addition 0 = 1 = s(0), ce qui contredit (P2 ).
– Axiome (O2 ) : Soit A une partie non vide, majorée de N et B = {n ∈ N \ A | ∀a ∈
A, a 6 n} l’ensemble des majorants stricts de A. L’ensemble B n’est pas vide car
nous avons prouvé que N satisfait (O3 ), il possède donc, comme nous venons de
le montrer, un plus petit élément b 6= 0 puisque A est non vide. Grâce à (P2 ), il
existe alors c ∈ N tel que b = s(c). Vérifions que c est un majorant de A. Puisque
s(c) ∈ B, on a a 6 s(c) et a 6= s(c) pour tout a ∈ A. Si a ∈ A, il existe donc
d ∈ N∗ tel que s(c) = a + d, avec d = s(e) = e + 1 et par conséquent, grâce à
l’associativité de l’addition, c + 1 = a + (e + 1) = (a + e) + 1 et, par régularité de
1 pour +, c = a + e, soit a 6 c. Mais alors c ∈ A car sinon il serait dans B ce qui
contredirait la définition de b comme plus petit élément de B, puisque b = s(c).

Sur le même modèle que l’addition, nous allons construire une nouvelle loi de com-
position interne dans N, la multiplication.
Définition 4. On définit par récurrence sur l’ensemble N des entiers naturels, une loi
de composition interne appelée multiplication et notée ×, en posant :
(i) ∀a ∈ N, a × 0 = 0
5
(ii) ∀(a, b) ∈ N2 , a × s(b) = (a × b) + a
Comme dans le cas de l’addition, ces propriétés définissent complètement la loi ×,

en vertu de (P3 ).
Proposition 6. La loi × définie ci-dessus est associative, commutative, distributive

par rapport à l’addition, admet 1 comme élément neutre et tout entier naturel non nul
est régulier par rapport à cette opération.
Démonstration : Remarquons tout d’abord que par définition de la multiplication on

a pour tout n ∈ N
n × 1 = n × s(0) = (n × 0) + n = 0 + n = n.
Montrons par récurrence que pour tout n ∈ N on a
0 × n = 0 et 1 × n = n.
Ces propriétés sont vraies pour n = 0 et si elles sont vraies au rang n, on a
0 × s(n) = (0 × n) + 0 = 0 + 0 = 0 et 1 × s(n) = (1 × n) + 1 = n + 1 = s(n),
ce qui termine la récurrence.

Nous venons en particulier de prouver que 1 est l’élément neutre de la multiplication.
– Distributivité : Montrons par récurrence sur c que pour tout a, b, c ∈ N on a
(a+b)×c = a×c+b×c. Fixons a, b ∈ N, pour c = 0 nous obtenons (a+b)×0 = 0
et a × 0 + b × 0 = 0, d’où (a + b) × 0 = a × 0 + b × 0 = 0. Supposons que l’égalité
est satisfaite pour c et calculons (a + b) × s(c) et a × s(c) + b × s(c). En appliquant
l’hypothèse de récurrence, on obtient
(a + b) × s(c) = (a + b) × c + a + b = a × c + b × c + a + b
et
a × s(c) + b × s(c) = a × c + a + b × c + b = a × c + b × c + a + b
par définition de la multiplication et grâce à la commutativité de l’addition, d’où
le résultat.
– Commutativité : Montrons par récurrence sur b que pour tout a, b ∈ N on a
a × b = b × a. Fixons a quelconque dans N, si b = 0, nous avons déjà prouvé que
a × 0 = 0 = 0 × a. Supposons que a × b = b × a, alors a × s(b) = a × b + a et
s(b) × a = (b + 1) × a = (b × a) + (1 × a) = (b × a) + a grâce à la distributivité de
× par rapport à +, soit a × s(b) = s(b) × a en utilisant l’hypothèse de récurrence.
– Associativité : Montrons par récurrence sur c que pour tout a, b, c ∈ N on a
(a × b) × c = a × (b × c). Fixons a, b ∈ N, pour c = 0 nous obtenons (a × b) × 0 = 0
et a×(b×0) = a×0 = 0. Supposons que l’égalité est satisfaite pour c et calculons
6
(a × b) × s(c) et a × (b × s(c)). Par définition de la multiplication, on obtient en

utilisant l’hypothèse de récurrence
(a × b) × s(c) = ((a × b) × c) + a × b = (a × (b × c)) + a × b
et
a × (b × s(c)) = a × ((b × c) + b) = ((b × c) + b) × a

= (b × c) × a + b × a
= = (a × (b × c)) + a × b ,
grâce à la commutativité de × et à la distributivité de × par rapport à +. D’où

le résultat.
– Régularité : Montrons que pour tous a 6= 0, x et y de N on a :
x × a = y × a =⇒ x = y. (4)
Soient x, y ∈ N, on pose A = {a ∈ N∗ | x × a = y × a ⇒ x = y}. La partie A

contient 1, par définition de l’élément neutre. Soit a ∈ A, supposons que x×s(a) =
y × s(a). Par définition de la multiplication, on obtient (x × a) + x = (y × a) + y
puis (y × a) + x = (y × a) + y, puisque a ∈ A. La régularité de l’addition implique
alors x = y, donc s(a) ∈ A et par conséquent A = N∗ .
Notons que la régularité des éléments non nuls de N par rapport à la multipli-
cation implique en particulier que si a, b ∈ N vérifient a × b = 0 alors a = 0 ou
b = 0.

Montrons maintenant le lien entre la multiplication et l’addition dans N.
Proposition 7. Soient a ∈ N et n ∈ N∗ , alors :
a×n=a
|
+ ·{z
· · + a} .
n fois
Démonstration : Soit a ∈ N, prouvons le résultat par récurrence sur n. Si n = 1, c’est

évident puisque a × 1 = a. Supposons le résultat vrai pour n 6 1 alors par définition
de la multiplication
a × s(n) = (a × n) + a = (a
|
+ ·{z
· · + a}) + a = a
|
+ ·{z
· · + a} ,
n fois (n+1) fois
d’où le résultat puisque s(n) = n + 1.

Voici maintenant la compatibilité entre la relation d’ordre et la multiplication.
7
Proposition 8. La relation d’ordre 6 sur N est compatible avec la multiplication :

a 6 b =⇒ ∀n ∈ N , an 6 bn .
Démonstration : Soient a, b ∈ N tels que a 6 b, prouvons que, pour tout n ∈ N, on a

a × n 6 b × n. Puisque a 6 b, il existe c ∈ N tel que b = a + c, alors b × n = (a + c) × n =
a × n + c × n grâce à la distributivité de × par rapport à +, d’où a × n 6 b × n.
Notons que si de plus a 6= b et n 6= 0 alors a × n 6= b × n. En effet si a 6= b alors
c 6= 0 et c × n 6= 0 puisque n 6= 0.
Proposition 9. L’ensemble ordonné (N, 6) est archimédien, c’est-à-dire pour tout
a ∈ N∗ et tout b ∈ N, il existe n ∈ N tel que b 6 n × a et n × a 6= b.
Démonstration : Soient a, b ∈ N. Si b 6 a et a 6= b, n = 1 convient. Si a 6 b, on

considère l’ensemble
B = {x × a, x ∈ N | 1 6 x × a 6 b}.
L’ensemble B est non vide, puisque a ∈ B, et il est majoré par b. Il possède donc
un plus grand élément x0 × a. Posons n = s(x0 ) = x0 + 1, alors x0 × a 6 n × a et
n × a 6= x0 × a donc n × a ∈
/ B soit b 6 n × a et n × a 6= b.
1.2 Bases de numération

Le but de cette section est de définir un système d’écriture qui permette de mani-
puler aisément les nombres entiers, en particulier d’expliciter facilement les opérations
addition et multiplication.
Pour simplifier les notations, la multiplication sur N sera notée ab pour a × b, le
résultat de la multiplication de a par a itérée n fois sera noté an et l’inégalité stricte
a < b pour a 6 b et a 6= b.
On décide de représenter les premiers entiers par un symbole unique appelé chiffre
et on cherche un moyen d’utiliser ces symboles pour écrire tous les nombres entiers.
Deux symboles ont déjà été définis : 0 pour le plus petit élément de N et 1 pour s(0).
Traditionnellement on note 2 pour s(1), 3 pour s(2), 4 pour s(3), 5 pour s(4), 6 pour
s(5), 7 pour s(6), 8 pour s(7), 9 pour s(8), A pour s(9), B pour s(A), C pour s(B), D
pour s(C), E pour s(D), F pour s(E). . .
Etant donné un nombre entier a > 1 appelé base, par exemple 2, 8, A, C ou G, on
peut proposer l’algorithme suivant pour dénombrer un ensemble :
on fait autant de paquets de a éléments qu’il est possible, puis autant de paquets
de a paquets et ainsi de suite. . .
Remarquons qu’à la n-ième étape, on obtient des regroupements de an éléments.
Par exemple pour a = 2, considérons l’ensemble E = {♣♣♣♣♣♣♣} et appliquons
l’algorithme
♣♣ ♣♣ ♣♣ ♣
|{z} |{z} |{z}
| {z }
8
nous obtenons un paquet de 2 paquets, qui regroupe donc 22 éléments, plus un paquet
de 2 éléments, plus 1 élément. Le nombre d’éléments de E pourrait alors être représenté
par le triple symbole 111, le premier 1 à gauche correspondant au nombre de paquets de
paquets, le second 1 au nombre de paquets restant et le dernier 1 au nombre d’éléments
distincts.
L’algorithme se formalise de la manière suivante : écrire un nombre entier x sous la
forme
x = xn an + · · · + x1 a + x0 , 0 6 xi < a,
appelé développement de x dans la base a. Si cette écriture est unique le nombre x
pourrait alors être représenté par le multi-symbole xn . . . x1 x0 .
Proposition 10. Si a ∈ N vérifie 1 < a, la suite de terme général un = an est

strictement croissante et non majorée.
Démonstration : Puisque 1 < a, la compatibilité de la relation d’ordre avec la multi-

plication implique an < an+1 car an est non nul. La suite (un )n∈N est donc croissante.
Nous devons prouver que pour tout b ∈ N, il existe n ∈ N tel que b < un . Puisque
N est archimédien (cf. Proposition 9), il suffit de montrer que na 6 an pour tout n tel
que 1 6 n.
Pour n = 1 on a bien a1 = a. Supposons que na 6 an . Puisque 1 6 n et 1 < a, soit
2 6 a, on a
(n + 1)a 6 2(na) 6 2an 6 aan 6 an+1 .
On a donc montré par récurrence que na 6 an pour tout n tel que 1 6 n.
Théorème 2. Pour tout a ∈ N et tout b ∈ N∗ , il existe des entiers q et r uniques tels

que
a = bq + r et 0 6 r < b.
Démonstration : On considère l’ensemble A = bN ∩ {x ∈ N | x 6 a}, où bN = {x ∈

N | ∃n ∈ N, x = bn}. L’ensemble A contient 0 et est majoré par a, il possède donc un
plus grand élément bq. L’élément bq ainsi défini est unique et vérifie bq 6 a < b(q + 1).
On note r la solution de l’équation bq + x = a, qui existe puisque bq 6 a, elle vérifie
0 6 r < b puisque a < b(q + 1).
L’opération définie dans le théorème s’appelle la division euclidienne de a par b, q
est le quotient de la division et r le reste. Si r = 0, on dit que a est divisible par b.
Théorème 3. Si a ∈ N vérifie 1 < a, tout nombre entier x s’écrit de manière unique
x = xn an + · · · + x1 a + x0 , 0 6 xi < a, 1 6 i 6 n, et xn 6= 0 .
Démonstration :
9
– Unicité : Supposons qu’un tel développement existe alors
x = (xn an−1 + · · · + x1 ) a + x0 et x0 < a.

| {z }
X1
Les nombres x0 et X1 sont respectivement le reste et le quotient de la division

euclidienne de x par a, ils sont donc déterminés de manière unique. Si on pose
Xk = xn an−k + · · · + xk+1 a + xk
on remarque que xk est le reste de la division euclidienne de Xk par a et Xk+1

son quotient. En posant X0 = x une récurrence immédiate prouve que les xk sont
déterminés de manière unique.
– Existence : Pour x fixé dans N, les conditions
y0 = x, yk = ayk+1 + xk avec xk < a
déterminent par récurrence deux suites (xk )k∈N et (yk )k∈N . Nous allons prouver
que la suite (yk )k∈N est stationnaire identiquement égale à 0 à partir d’un certain
rang. Remarquons que, puisque 1 < a, la suite (yk )k∈N vérifie
2yk+1 6 ayk+1 6 yk ,
ce qui implique que 2k yk 6 x. Nous avons vu dans la preuve de la Proposition 9

que 2k 6 2k , on en déduit donc que 2kyk 6 x et par conséquent yk = 0 dès que
x < 2k en raison de la compatibilité de la relation d’ordre avec la multiplication.
On désigne par n le plus grand entier k tel que yk 6= 0. Par définition de n et de
la suite (yk )k∈N , on a
y n = xn et yn−k = xn ak + · · · + xn−k , k = 1, . . . , n,
en particulier pour k = n, on obtient
x = y 0 = x n an + · · · + x 1 a + x 0 .

Notons que dans la base a, le nombre entier a s’écrit toujours 10 puisque a =
(1 × a) + 0.
La base communément utilisée est a = s(9), que l’on appelle la base dix, et tout
nombre entier s’écrit alors en utilisant les chiffres 0, 1, 2, 3, 4, 5, 6, 7, 8 et 9. L’usage
courant veut que l’on écrive simplement 545 pour 545 lorsqu’il n’y a pas d’ambiguïté
sur la base choisie.
En informatique les bases a = 2 et a = s(F ) sont souvent utilisées, c’est ce qui est
appelé système de numération binaire et système de numération hexadécimale.
10
Exemple : Si x s’écrit 125 en base dix, il s’écrit 1111101 en binaire et 7D en hexadé-

cimal.
La démonstration de l’existence du développement dans une base a fixée donne
un algorithme pour calculer les chiffres qui apparaissent dans l’écriture d’un nombre
entier x dans cette base. Le premier chiffre de droite est donné par le reste de la
division euclidienne de x par a, le second chiffre par le reste de la division euclidienne
du quotient de la division précédente par a et ainsi de suite jusqu’à l’obtention d’un
quotient nul.
Relation d’ordre et numération
On considère le problème suivant : étant donnés deux entiers x et y, peut-on déter-
miner facilement si x 6 y à partir de leur écriture dans une base donnée.
Fixons une base a arbitraire. L’unicité du développement d’un entier relativement
à la base a implique que x = y si et seulement si ils ont même écriture dans la base a.
Lemme 1. Si x ∈ N s’écrit xn . . . x0 dans la base a, alors an 6 x < an+1 .
Démonstration : L’hypothèse du lemme se traduit par
x = x n an + · · · + x 1 a + x 0 .
Par conséquent an 6 xn an 6 x puisque 1 6 xn . Montrons par récurrence sur n que

x < an+1 . Si n = 0, x = x0 < a. Supposons l’inégalité vraie pour les nombres dont
l’écriture dans la base a contient n + 1 chiffres. Soit x qui s’écrit xn+1 xn . . . x0 , alors
x = xn+1 an+1 + y,
avec y qui s’écrit xn . . . x0 dans la base a et par conséquent on obtient
x < xn+1 an+1 + an+1 6 an+1 (xn+1 + 1) 6 an+2
en utilisant l’hypothèse de récurrence et le fait que xn+1 < a.

Supposons que x et y s’écrivent respectivement xn . . . x0 et ym . . . y0 dans la base a
et que x 6= y.
Supposons que n < m alors n + 1 6 m et puisque 1 < a, le Lemme 1 implique
x < an+1 6 am 6 y,
d’où x < y.
Nous avons donc prouvé que :
Si deux entiers s’écrivent dans une même base avec un nombre de chiffres différent,
le plus petit est celui dont l’écriture possède le moins de chiffres.
11
Supposons que m = n. Puisque x 6= y, il existe 1 6 r 6 n + 1 tel que xi = yi pour

tout r 6 i et xr−1 < yr−1 . On déduit alors du Lemme 1 que
x = xn an + · · · + xr−1 ar−1 + xr−2 ar−2 + · · · + x1 a + x0

< xn an + · · · + xr−1 ar−1 + ar−1
< xn an + · · · + (xr−1 + 1)ar−1
< xn an + · · · + yr−1 ar−1
<y
Nous avons donc prouvé que :

Si deux entiers s’écrivent dans une même base avec un même nombre de chiffres
et si en partant de la gauche les chiffres sont tous égaux jusqu’au rang r, alors le plus
petit des deux est celui qui a le plus petit chiffre de rang r − 1.
Lois de composition internes et numération
Soient x et y deux nombres entiers qui s’écrivent respectivement xn . . . x0 et ym . . . y0
dans la base a, on cherche un mécanisme pour déterminer l’écriture dans la base a des
nombres x + y et x × y.
Comme + et × sont toutes deux commutatives, on peut supposer sans perte de
généralité que m 6 n.
• Cas de l’addition
Si m 6= n on pose yn = · · · = ym+1 = 0. Les propriétés de commutativité et
d’associativité de + et de distributivité de × par rapport à + donnent
x + y = (xn + yn )an + · · · + (x1 + y1 )a + (x0 + y0 ).
Si pour tout i = 0, . . . , n, xi + yi < a, le développement ci-dessus correspond au

développement de x + y dans la base a.
Sinon supposons que l’un des entiers xi + yi est supérieur ou égal à a, alors
xi + yi = a + zi avec zi < a
et le nombre xi + yi s’écrit alors 1zi dans la base a. Par suite (xi + yi )ai = ai+1 + zi ai
et xi+1 + yi+1 doit être remplacé par xi+1 + yi+1 + 1, c’est le mécanisme de la retenue.
En conclusion, l’écriture dans la base a du résultat de l’addition de deux entiers
nécessite seulement la connaissance de la table d’addition en base a des nombres dont
l’écriture en base a ne possède qu’un seul chiffre.
• Cas de la multiplication
Grâce à la distributivité de × par rapport à + et à l’associativité de ×, on a
xy = xn (an y) + · · · + x1 (ay) + x0 y.
On est donc ramené

1) à multiplier un entier par une puissance de la base,
12
2) à multiplier un entier par un nombre strictement inférieur à la base et qui s’écrit

donc avec un seul chiffre,
3) à faire des additions.
- Multiplication par ak
Cherchons l’écriture en base a de ak y. On a
ak y = yak = ym am+k + · · · + y0 ak
et ak y s’écrit donc
ym . . . y0 0| .{z
. . 0}.
k
L’existence des k chiffres 0 dans la partie droite de l’écriture de ak y en base a, explique

le décalage dans la disposition pratique de la multiplication.
Exemple : En base a avec 5 < a, effectuons la multiplication de 45 par 101, on aura
45 × 101 = (4a + 5)(a2 + 1) = (4a3 + 5a2 ) + (4a + 5) = 4500 + 45
qui en pratique s’écrit

45
×101
45
45
4545
- Multiplication par un entier strictement inférieur à a
Soit b < a, alors by = bym am + · · · + by0 . Si byi < a pour tout i = 0, . . . , m, c’est
fini sous réserve de connaître la table de multiplication en base a des nombres dont
l’écriture en base a ne possède qu’un seul chiffre.
Si l’un des byi est supérieur ou égal à a, alors
byi = ci a + zi avec ci < a et zi < a
car byi < a2 et le nombre byi s’écrit alors ci zi dans la base a. Par suite (byi )ai =
ci ai+1 + zi ai et byi+1 doit être remplacé par byi+1 + ci , c’est le mécanisme de la retenue.
1.3 Construction des entiers relatifs

L’ensemble N des entiers naturels a été défini de manière axiomatique et deux lois
de composition interne ont été définies sur cet ensemble : l’addition et la multiplication.
Certaines équations liées à ces deux lois comme
a = b + x ou a = b × x, b 6= 0 ,
13
n’admettent pas toujours une solution. Il serait intéressant de construire un ensemble de

nombres contenant N dans lequel ces équations simples auraient toujours une solution.
Étant donné un couple (a, b) ∈ N × N, on s’intéresse d’abord à l’équation
a = b + x. (5)
Par définition de la relation d’ordre sur N, cette équation possède une solution dans
N si et seulement si b 6 a. On cherche à construire un nouvel ensemble de nombres Z
contenant N, muni d’une loi de composition interne associative et commutative, notée
+, dont la restriction à N coïncide avec l’addition de N et dans lequel l’équation (5)
possède toujours une unique solution. Dans le cas particulier où a = 0, x sera un inverse
de b pour + et (Z, +) sera un groupe abélien.
L’idée est d’identifier la solution x de (5) au couple (a, b), mais malheureusement
deux couples (a, b) et (a0 , b0 ), vérifiant a 6 b et a0 6 b0 , peuvent définir le même entier
x. Cherchons à quelle condition les deux couples (a, b) et (a0 , b0 ) définissent le même
entier x. Si x ∈ N satisfait à la fois
a = b + x et a0 = b0 + x,
alors a + b0 + x = a0 + b + x et par régularité de l’addition, on doit avoir a + b0 = a0 + b.
Proposition 11. La relation R définie sur N × N par
(a, b)R(a0 , b0 ) ⇔ a + b0 = a0 + b (6)
est une relation d’équivalence compatible avec l’addition sur N × N.
Démonstration : La relation R est clairement réflexive et symétrique. Montrons qu’elle

est transitive. Soient (a, b), (a0 , b0 ) et (a00 , b00 ) trois couples d’entiers tels que (a, b)R(a0 , b0 )
et (a0 , b0 )R(a00 , b00 ), ils vérifient donc
a + b0 = a0 + b et a0 + b00 = a00 + b0 .
En ajoutant membre à membre ces deux égalités on obtient
a + b00 + a0 + b0 = a00 + b + a0 + b0
grâce à l’associativité et à la commutativité de l’addition dans N, soit a+b00 = a00 +b par
régularité de l’addition. La relation R est donc une relation d’équivalence sur N × N.
Montrons qu’elle est compatible avec l’addition. Soient (a, b), (a0 , b0 ) deux couples
d’entiers tels que (a, b)R(a0 , b0 ) et (c, d), (c0 , d0 ) deux autres couples d’entiers tels que
(c, d)R(c0 , d0 ), alors a + b0 = a0 + b et c + d0 = c0 + d et en ajoutant membre à membre
(a + c) + (b0 + d0 ) = (a0 + c0 ) + (b + d),
ce qui signifie que (a + c, b + d)R(a0 + c0 , b0 + d0 ).
On notera (a, b) la classe du couple (a, b) pour la relation R.
14
Définition 5. On appelle ensemble des entiers relatifs l’ensemble quotient N × N/R

et on le note Z.
Proposition 12. L’ensemble Z muni de la loi quotient déduite de l’addition sur N×N,
notée encore +, est un groupe abélien.
Démonstration : La relation R étant compatible avec l’addition sur N × N, on définit

une loi de composition interne sur Z en posant
(a, b) + (c, d) = (a + c, b + d).
Cette loi conserve les propriétés d’associativité et de commutativité de l’addition sur

N × N. Vérifions que e = (0, 0) est un élément neutre pour cette loi. En effet si x =
(a, b) ∈ Z, x + e = e + x par commutativité et
x + e = (a, b) + (0, 0) = (a + 0, b + 0) = (a, b) = x.
On peut remarquer que (a, b) ∈ (0, 0) si et seulement si a = b. En effet (a, b)R(0, 0) si

et seulement si a + 0 = 0 + b, i.e. a = b.
Pour obtenir une structure de groupe abélien, il reste à prouver que tout élément x
de Z possède un inverse pour cette loi. Si x = (a, b), posons xe = (b, a), alors x+ xe = xe +x
par commutativité et
x + xe = (a, b) + (b, a) = (a + b, b + a) = (a + b, a + b) = (0, 0) = e.

Proposition 13. On définit un morphisme injectif f : N → Z en posant f (a) = (a, 0)
Démonstration : Vérifions que l’application f : N → Z définie par f (a) = (a, 0) est

additive. Soient a et b dans N, alors
f (a + b) = (a + b, 0) = (a, 0) + (b, 0) = f (a) + f (b)
par définition de l’addition dans Z. Montrons maintenant que f est injective. Soient a
et b dans N tels que f (a) = f (b), c’est-à-dire (a, 0) = (b, 0). Par définition de la relation
R cela signifie que a + 0 = b + 0, soit a = b, d’où l’injectivité de l’application f .
Pour simplifier les écritures on utilise les conventions de notations suivantes :
(i) Si a ∈ N, on note encore a l’élément (a, 0) de Z, identifiant ainsi N et son image
par f dans Z.
(ii) Si a ∈ N, on note −a l’élément (0, a) de Z, c’est-à-dire l’inverse de a pour
l’addition dans Z.
(iii) Si a ∈ N et b ∈ N, on écrira a − b pour a + (−b).
Remarquons également que tout élément (a, b) possède un représentant de la forme
(x, 0) ou (0, x). En effet (x, 0) ∈ (a, b) si et seulement si a = b + x dans N, ce qui
15
équivaut à b 6 a par définition de la relation d’ordre sur N, de même (0, x) ∈ (a, b) si

et seulement si a + x = b ce qui équivaut à a 6 b. La relation d’ordre sur N étant une
relation d’ordre total, si a ∈ N et b ∈ N alors soit a 6 b, soit b 6 a et d’après ce qui
précède dans le premier cas il existe x ∈ N tel que a + x = b et alors (x, 0) ∈ (a, b) et
dans le deuxième cas il existe x ∈ N tel que b + x = a et alors (0, x) ∈ (a, b).
On en déduit que Z = N ∪ (−N), où −N = {y ∈ Z | y = −x, x ∈ N}. De plus
N ∩ (−N) = {0} car si u = (a, b) ∈ Z vérifie u ∈ N et −u ∈ N, alors (a, b) = (b, a) soit
a + a = b + b et donc a = b et u = 0.
On dit que deux éléments x et y de Z sont de même signe si x et y sont tous deux
dans N ou dans −N et de signes contraires si parmi x et y l’un est dans N et l’autre
dans −N.
Nous venons de voir que Z contient strictement N et même que l’ensemble Z \ N
est infini, mais néanmoins il existe une bijection de N sur Z : Z est dénombrable.
Proposition 14. L’ensemble Z est dénombrable.
Démonstration : L’application f : N → Z de N dans Z définie par f (2n) = n et

f (2n + 1) = −(n + 1) est clairement bijective.
Revenons à l’équation (5) du début de ce paragraphe. Soient a et b dans N, alors
avec les notations ci-dessus si x satisfait a = b+x dans Z, cela signifie (a, 0) = (b, 0)+x,
soit x = (0, b) + (a, 0) = (a, b). L’équation (5) possède donc toujours une solution dans
Z et x ∈ N si et seulement si b 6 a. Plus généralement si a et b sont dans Z, a = b + x
équivaut à x = b − a puisque (Z, +) est un groupe et l’équation a = b + x possède
toujours une unique solution.
Relation d’ordre dans Z

Rappelons que si (a, b) ∈ N × N, on a a 6 b, s’il existe c ∈ N tel que b = a + c,
c’est-à-dire b−a ∈ N. Nous pouvons alors prolonger de manière naturelle à Z la relation
d’ordre sur N en posant x 6 y si et seulement si y − x ∈ N. Vérifions qu’il s’agit bien
d’une relation d’ordre. Elle est réflexive car x 6 x puisque x − x = 0 ∈ N. Elle est
antisymétrique, puisque x − y = −(y − x) et N ∩ (−N) = {0} impliquent x = y si x − y
et y − x sont tous deux dans N. Soient x, y, z ∈ Z tels que x 6 y et y 6 z, c’est-à-dire
y − x ∈ N et z − y ∈ N, alors (y − x) + (z − y) = z − x ∈ N et donc x 6 z, ce qui
prouve la transitivité de 6.
Remarquons que les éléments de N sont exactement les x ∈ Z tels que 0 6 x, on
les appelle les entiers positifs et que les éléments de −N sont exactement les x ∈ Z tels
que x 6 0, ils sont dits négatifs.
Multiplication dans Z
Pour terminer nous allons définir dans Z une deuxième loi de composition interne
qui prolongera la multiplication sur N et telle que (Z, +, ×) possède une structure
d’anneau intègre.
16
Soient x = (a, b) et y = (c, d) deux éléments de Z, on pose

x × y = (a, b) × (c, d) = (ac + bd, bc + ad).
Vérifions que cette définition a bien un sens en remarquant qu’elle est indépendante des
représentants choisis. Nous devons prouver que si (a, b)R(a0 , b0 ) et (c, d)R(c0 , d0 ) alors
(ac + bd, bc + ad)R(a0 c0 + b0 d0 , b0 c0 + a0 d0 ). Supposons que a + b0 = a0 + b et c + d0 = c0 + d,
alors
(ac + bd) + (b0 c0 + a0 d0 ) + bc0 = ac + b(d + c0 ) + (b0 c0 + a0 d0 )
= ac + b(c + d0 ) + (b0 c0 + a0 d0 )
= ac + bc + (b + a0 )d0 + b0 c0
= ac + bc + (a + b0 )d0 + b0 c0
= a(c + d0 ) + bc + b0 d0 + b0 c0
= a(c0 + d) + bc + b0 d0 + b0 c0
= ad + bc + (a + b0 )c0 + b0 d0
= ad + bc + (a0 + b)c0 + b0 d0
= (ad + bc) + (a0 c0 + b0 d0 ) + bc0
d’où (ac + bd) + (b0 c0 + a0 d0 ) = (a0 c0 + b0 d0 ) + (ad + bc) et donc (ac + bd, bc + ad)R(a0 c0 +
b0 d0 , b0 c0 + a0 d0 ).
Par un calcul direct, il résulte immédiatement des propriétés de l’addition et de
la multiplication dans N que la loi × est associative, commutative et distributive par
rapport à l’addition. L’élément 1 = (1, 0) est un élément neutre pour × puisque 1 ×
(a, b) = (1a + 0b, 0a + 1b) = (a, b). (Z, +, ×) est donc un anneau. Vérifions qu’il est
intègre. Soient x et y deux éléments de Z tels que xy = 0. Pour simplifier les calculs
choisissons pour x un représentant de la forme (u, 0) ou (0, u) et pour y un représentant
de la forme (v, 0) ou (0, v), alors suivant les cas xy = 0 implique
(uv, 0)R(0, 0) ou (0, uv)R(0, 0),
d’où uv = 0 et donc u = 0 ou v = 0 par les propriétés de la multiplication dans N.
Notons également que tout élément de Z distinct de 0 est régulier pour ×. Soient
x, y et z 6= 0 dans Z tels que xz = yz. Comme précédemment choisissons pour x
un représentant de la forme (u, 0) ou (0, u), pour y un représentant de la forme (v, 0)
ou (0, v) et pour z un représentant de la forme (w, 0) ou (0, w) avec w 6= 0, alors
xz = (uw, 0) ou (0, uw) et yz = (vw, 0) ou (0, vw). L’égalité xz = yz implique donc
soit uw = vw si x et y sont de même signe, soit uw + vw = 0 si x et y sont de signes
contraires et puisque w 6= 0, on obtient u = v dans le premier cas et u = v = 0 dans le
second cas, et donc x = y.
Si x et y sont dans N, on identifie x avec (x, 0) et y avec (y, 0), alors
x × y = (xy, 0) = xy ,
17
après identification. La loi × prolonge donc la multiplication sur N. Par ailleurs, notons
que
x × (−y) = (x, 0) × (0, y) = (0, xy) = −(xy),
de même (−x) × y = −(xy) et
(−x) × (−y) = (0, x) × (0, y) = (xy, 0) = xy.
Nous retrouvons ainsi la règle usuelle des signes : le produit de deux entiers positifs ou
de deux entiers négatifs est toujours un entier positif et le produit d’un entier positif et
d’un entier négatif est toujours un entier négatif. Cette règle s’exprime également de
la manière suivante : le produit de deux entiers de même signe est toujours un entier
positif et le produit de deux entiers de signes contraires est toujours un entier négatif.
Remarquons également que −x = (−1) × x = x × (−1).
1.4 Construction des rationnels

Il reste dans Z des équations sans solution, comme a = b × x pour b 6= 0, dont la
solution en x devrait être le produit de a par un inverse de b pour la multiplication.
Or dans Z \ {0} seuls +1 et −1 ont un inverse. L’idée est alors de reproduire pour
la multiplication dans Z \ {0} la procédure utilisée pour l’addition dans N afin de
construire un groupe multiplicatif Q∗ contenant Z \ {0}. La structure d’anneau de Z
sera alors prolongée à ce nouvel ensemble, faisant de (Q, +, ×) un corps.
Dans l’ensemble Z∗ = Z \ {0} la loi de composition interne × possède les mêmes
propriétés que l’addition dans N, on peut donc appliquer la même procédure que dans
la section 1.3 pour construire un nouvel ensemble de nombres noté Q contenant Z et
tel que Q \ {0} possède une structure de groupe multiplicatif.
Considérons sur Z∗ × Z∗ , la relation R définie par
(a, b)R(a0 , b0 ) ⇐⇒ a × b0 = a0 × b. (7)
C’est une relation d’équivalence compatible avec la multiplication sur Z∗ × Z∗ . La

démonstration de cette assertion est analogue à celle de la Proposition 11 .
On notera ab la classe du couple (a, b) pour la relation R. On remarquera que pour
tout c ∈ Z∗ , on a ab = a×c
b×c
.
Proposition 15. L’ensemble quotient Z∗ × Z∗ /R munit de la loi quotient déduite de

la multiplication sur Z∗ × Z∗ , notée encore ×, est un groupe abélien, on le note Q∗ .
L’élément neutre ce groupe est la classe du couple (1, 1). Un élément (a, b) de
Z∗ × Z∗ /R appartient à 11 si et seulement si a × 1 = 1 × b, c’est-à-dire a = b. L’inverse
de ab est ab .
La démonstration de la proposition est analogue à celle de la Proposition 12.
Proposition 16. On définit un morphisme injectif f : Z∗ → Q∗ en posant f (a) = a

1
18
Démonstration : Vérifions que l’application f : Z∗ → Q∗ définie par f (a) = a

1
est
multiplicative. Soient a et b dans Z∗ , alors
a×b a b
f (a × b) = = × = f (a) × f (b)
1 1 1
par définition de la multiplication dans Q∗ . Montrons maintenant que f est injective.
Soient a et b dans Z∗ tels que f (a) = f (b), c’est-à-dire a1 = 1b . Par définition de la
relation R cela signifie que a × 1 = b × 1, soit a = b, d’où l’injectivité de l’application
f.
Pour simplifier les écritures, on notera a à la place de a1 l’élément f (a) si a ∈ Z∗ .
On écrira souvent ab à la place de a × b pour le produit de deux éléments de Z∗ .
En raison de la structure de groupe multiplicatif de Q∗ , si a ∈ Z∗ et b ∈ Z∗ ,
l’équation a = b × x possède toujours une unique solution : l’élément ab de Q∗ . De plus
si a = 0 et b ∈ Z∗ , l’élément 0 de Z est l’unique solution de a = b × x, car Z est un
anneau intègre.
Définition 6. On appelle ensemble des nombres rationnels l’ensemble Q∗ auquel on a
ajouté l’élément 0 de Z. On le note Q.
Pour compléter la structure algébrique de Q nous allons prolonger à Q la structure
de groupe additif de Z. Soient x = ab et y = dc deux éléments de Q, on pose
ad + bc
x+y = .
bd
Vérifions que cette définition a bien un sens en remarquant qu’elle est indépendante des
représentants choisis. Nous devons prouver que si (a, b)R(a0 , b0 ) et (c, d)R(c0 , d0 ) alors
(ad + bc, bd)R(a0 d0 + b0 c0 , b0 d0 ). Supposons que ab0 = a0 b et cd0 = c0 d, alors
(ad + bc)b0 d0 = (ab0 )dd0 + (cd0 )bb0

= (a0 b)dd0 + (c0 d)bb0
= (a0 d0 + c0 d0 )bd,
c’est-à-dire (ad + bc, bd)R(a0 d0 + b0 c0 , b0 d0 ).

Par un calcul direct, il résulte immédiatement des propriétés de l’addition et de la
multiplication dans Z que l’addition est associative, commutative et que la multiplica-
tion est distributive par rapport à l’addition. Notons que 0 = 10 vérifie :
a a a×1+0×b a
+0=0+ = = ,
b b b×1 b
−a
c’est donc un élément neutre pour l’addition. De plus si x = ab , posons −x = b
=
(−1) × x, alors
ab + (−a)b ab − ab 0
x + (−x) = = = =0.
bb bb bb
19
Tout élément x de Q possède un inverse pour l’addition et (Q, +) est donc un groupe
abélien.
L’ensemble Q ainsi construit muni des lois + et × possède une structure de corps.
Si x et y sont dans Z, on identifie x avec x1 et y avec y1 , alors
x×1+1×y x+y
x+y = = ,
1×1 1
après identification. La loi + prolonge donc l’addition sur Z et (Z, +, ×) est un sous
anneau de Q.
Proposition 17. L’ensemble Q est dénombrable.
Démonstration : L’ensemble Q s’injecte dans le produit cartésien Z × N et contient N.

Il suffit donc de prouver que Z × N est dénombrable, mais comme Z est dénombrable
on est ramené à prouver que N × N est dénombrable. L’application f : N × N → N
définie par
p+q
X (p + q)(p + q + 1)
f (p, q) = q + i= +q ,
i=0 2
qui consiste à compter diagonalement les couples (p, q) donne la bijection cherchée.
Relation d’ordre dans Q

Pour terminer nous allons étendre à Q la relation d’ordre de Z. Rappelons que
si x et y sont deux éléments de Z alors x 6 y si et seulement si y − x ∈ N soit
0 6 y − x. Pour commencer nous allons définir la notion de nombre rationnel positif.
Si ab ∈ Q, nous dirons que 0 6 ab si et seulement si 0 6 a × b. Cette définition ne
0
dépend pas du représentant choisi. En effet si ab = ab0 , c’est-à-dire si a × b0 = a0 × b,
alors (a × b) × (b0 × b0 ) = (a0 × b0 ) × (b × b) et puisque b × b et b0 × b0 sont tous deux
positifs et non nuls comme produits de nombres entiers de même signe, a × b et a0 × b0
ont le même signe.
Avec cette définition, les éléments de Z positifs au sens de Q sont exactement les
éléments positifs de Z, c’est-à-dire les éléments de N. Par analogie avec la relation
d’ordre dans Z, si x et y sont deux éléments de Q, nous posons x 6 y si et seulement
si 0 6 y − x. Cette relation est une relation d’ordre qui prolonge la relation d’ordre de
Z.
La relation d’ordre 6 est compatible avec l’addition et la multiplication sur Q au
sens suivant : soient x, y et z trois éléments de Q
• si x 6 y, alors x + z 6 y + z puisque y − x = (y + z) − (x + z),
• si x 6 y et 0 6 z, alors x × z 6 y × z puisque (y × z) − (x × z) = (y − x) × z et
en particulier si x = 0 on obtient que, si 0 6 y et 0 6 z, alors 0 6 y × z.
On écrira de manière équivalente :
x 6 y ou y > x,
x 6 y, x 6= y ou x < y ou y > x.
20
Dans la suite nous utiliserons la notation suivante : si x ∈ Q, on pose |x| =

max(x, −x). On a bien sûr |x| = x, si x > 0, et |x| = −x, si x 6 0.
1.5 Construction des réels

Par des arguments d’arithmétique élémentaire, il est facile de prouver qu’il n’existe
pas de carré de côté de longueur rationnelle dont l’aire est égale à 2 : l’équation x2 = 2
n’a pas de solution dans Q. Néanmoins, il existe une infinité de suites de rationnels
(xn )n∈Q , telles que x2n converge vers 2. C’est le cas par exemple, pour toute suite définie
par x0 ∈ Q+∗ et :
x2 − 2
∀n ∈ N , xn+1 = xn − n+1 .
2x
(Démontrez-le !) Une conséquence est que la suite (xn )n∈N ne converge pas dans Q.
Sans perdre de propriétés algébriques, nous allons construire un nouveau corps R
totalement ordonné contenant Q et dans lequel toutes les suites qui devraient naturel-
lement converger (ce seront les suites de Cauchy) seront effectivement convergentes.
Définition 7. Soit (xn )n∈N une suite d’éléments de Q, c’est-à-dire une application de
N dans Q.
(i) La suite (xn )n∈N est bornée s’il existe M ∈ Q tel que
(∀n ∈ N) (|xn | 6 M ).
(ii) La suite (xn )n∈N converge dans Q vers x ∈ Q si
(∀ε > 0, ε ∈ Q) (∃Nε ∈ N) (∀n ∈ N) (n > Nε =⇒ |xn − x| < ε).
(iii) La suite (xn )n∈N est de Cauchy dans Q si
(∀ε > 0, ε ∈ Q) (∃Nε ∈ N) (∀p, q ∈ N) (p > Nε , q > Nε =⇒ |xp − xq | < ε).
Proposition 18.
1. Toute suite convergente est de Cauchy.
2. Toute suite de Cauchy est bornée.
3. Si la suite (xn )n∈N converge vers 0 et si la suite (yn )n∈N est bornée, la suite
(xn × yn )n∈N converge vers 0.
4. Si les suites (xn )n∈N et (yn )n∈N sont de Cauchy, les suites (xn + yn )n∈N , (xn −
yn )n∈N et (xn × yn )n∈N sont de Cauchy.
5. Si la suite (xn )n∈N converge vers a et si la suite (yn )n∈N converge vers b, la suite
(xn + yn )n∈N converge vers a + b, la suite (xn − yn )n∈N converge vers a − b et la
suite (xn × yn )n∈N converge vers a × b.
6. Soit (xn )n∈N une suite de Cauchy ne convergeant pas vers 0, alors il existe un
entier n0 tel que si n > n0 on a xn 6= 0 et la suite ( x1n )n>n0 est de Cauchy.
21
Démonstration :
1. Soit (xn )n∈N une suite qui converge dans Q vers x ∈ Q, alors pour ε > 0, ε ∈ Q,
il existe Nε ∈ N tel que pour tout n ∈ N
n > Nε =⇒ |xn − x| < ε.
Par conséquent pour n > Nε/2 et p > Nε/2 on a |xp − xn | 6 |xp − x| + |xn − x| < ε
et la suite (xn )n∈N est donc de Cauchy dans Q.
2. Soit (xn )n∈N une suite de Cauchy dans Q, alors
(∀ε > 0, ε ∈ Q) (∃Nε ∈ N) (∀p, q ∈ N) (p > Nε , q > Nε =⇒ |xp − xq | < ε).
En prenant ε = 1 on obtient que si n > N1 on a xN1 +1 − 1 < xn < xN1 +1 + 1. Par
conséquent si on pose M = max(|x0 |, . . . , |xN1 |, |xN1 +1 | + 1), pour tout n ∈ N,
|xn | 6 M et la suite (xn )n∈N est bornée.
3. Soit (xn )n∈N une suite qui converge dans Q vers 0 et (yn )n∈N une suite bornée,
alors pour ε > 0, ε ∈ Q, il existe Nε ∈ N tel que pour tout n ∈ N
n > Nε =⇒ |xn | < ε,
et il existe M > 0, M ∈ Q, tel que pour tout n ∈ N
|yn | 6 M.
On en déduit que si n > Nε/M alors
ε
|xn × yn | 6 M × |xn | < M × = ε.
M
Les assertions 4) et 5) pour les sommes et les différences de suites sont des consé-
quences immédiates de l’inégalité triangulaire et des définitions et leur démons-
tration est laissée au lecteur. Prouvons 4) pour le produit, la démonstration de
5) pour le produit est analogue. Soient (xn )n∈N et (yn )n∈N deux suites de Cauchy,
alors pour ε > 0, ε ∈ Q, il existe Nε ∈ N et Nε0 ∈ N tels que pour tout p, q ∈ N
p > Nε , q > Nε =⇒ |xp − xq | < ε et p > Nε0 , q > Nε0 =⇒ |yp − yq | < ε.
De plus, d’après 2), il existe M, M 0 > 0, M, M 0 ∈ Q, tels que pour tout n ∈ N
|yn | 6 M et |yn | 6 M.
On en déduit que, pour tout p, q ∈ N,
|xp × yp − xq × yq | = |(xp − xq ) × yp + xq × (yp − yq )| 6 M 0 |xp − xq | + M |yp − yq |.
0
Posons N = max(Nε/2M 0 , Nε/2M ), alors si p > N et q > N on a
ε ε
|xp × yp − xq × yq | < M 0 × + M × = ε.
2M 0 2M
22
6. Soit (xn )n∈N une suite de Cauchy ne convergeant pas vers 0, alors
(∃α > 0, α ∈ Q) (∀N ∈ N) (∃n ∈ N) (n > N et |xn | > α).
La suite (xn )n∈N étant de Cauchy, il existe n0 ∈ N tel que

α
p > n0 , q > n0 =⇒ |xp − xq | < .
2
En prenant N = n0 , n = p alors pour tout q > n0 on a
α
|xn − xq | < et |xn | > α,
2
soit |xq | > α2 grâce à l’inégalité triangulaire, d’où xq 6= 0 si q > n0 . Soient
p, q > n0 , alors |xp | > α2 et |xq | > α2 , d’où

1 1 4
− < 2 |xp − xq |.

xp xq α
Donc puisque (xn )n∈N est une suite de Cauchy, la suite ( x1n )n>n0 est de Cauchy.

Dans Q, il existe des suites de Cauchy non convergentes. Nous en avons vu des
exemples plus haut. En voici un autre. Considérons la suite (xn )n∈N∗ définie par
1 1
xn = 1 + + ··· + .
1! n!
Si p > q, on a
1 1
xp − xq = + ··· +
(q + 1)! p!
1 1 1
6 (1 + + ··· + )
(q + 1)! q+1 (q + 1)p−q−1
1 1 1
6 1 = .
(q + 1)! 1 − q+1 q q!
Pour ε = ab , a, b ∈ N∗ , p > b et q > b implique
1
|xp − xq | < 6 ε.
b b!
a
Cette suite est donc de Cauchy, mais ne converge pas vers un nombre rationnel b
.
Supposons qu’elle converge vers ab . Puisque l’inégalité
1
0 < xp − xq <
q q!
23
est valable pour tout p > q, en faisant tendre p vers l’infini on aurait
a 1
0< − xq < ,
b q q!
la première inégalité restant stricte puisque la suite (xn )n∈N∗ est croissante. Par défini-
tion de xq , si q 6 b, le nombre rationnel ab − xq peut être représenté par une fraction
de la forme q!α , α ∈ Z, et donc 0 < α 6 1q , ce qui est impossible si q > 1.
On peut également considérer la suite (yn )n∈N∗ définie par
1 1 1
yn = 1 + + ··· + + .
1! n! n!
La suite (xn )n∈N∗ est clairement croissante et la suite (yn )n∈N∗ est décroissante
puisque
1 1 1 1−n
yn+1 − yn = + − = 6 0.
(n + 1)! (n + 1)! n! (n + 1)!
De plus la suite (yn − xn = n!1 )n∈N∗ est une suite de rationnels positifs qui converge vers
0 et pour tous p, q ∈ N∗ on a xp 6 yq . Par conséquent si ces suites convergeaient leurs
limites seraient égales et cette limite l vérifierait xp 6 l 6 yq pour tous p, q ∈ N∗ .
On aimerait alors compléter Q en un nouvel ensemble ordonné de nombres dans
lequel toute suite de Cauchy serait convergente. Les deux suites (xn )n∈N∗ et (yn )n∈N∗
précédentes auraient alors une limite commune dans cet ensemble qui serait située entre
chacun des nombres rationnels xn et yn . Nous allons construire un tel ensemble.
Précisons tout d’abord les propriétés souhaitées pour le nouvel ensemble de nombres
que nous souhaitons construire.
Définition 8.
1. Un corps K est dit totalement ordonné s’il est muni d’une relation d’ordre totale
notée 6 telle que
(∀x, y, z ∈ K) (x 6 y =⇒ x + z 6 y + z), (8)
(∀x, y ∈ K) (x > 0 et y > 0 =⇒ xy > 0). (9)

2. Un corps K est dit archimédien s’il est totalement ordonné et si pour tous x, y ∈
K tel que x > 0, il existe n ∈ N tel que nx > y.
3. Un corps K totalement ordonné est dit complet si toute suite de Cauchy dans K
est convergente.
Nous allons construire un corps commutatif noté R contenant Q et qui sera archi-
médien et complet comme quotient de l’ensemble des suites de Cauchy de Q.
Notons QN l’ensemble des suites de rationnels, c’est-à-dire l’ensemble des applica-
tions de N dans Q, et C le sous-ensemble de QN constitué des suites de Cauchy.
24
Grâce à la propriété 4) des suites de rationnels l’ensemble C des suites de Cauchy

dans Q est muni d’une structure d’anneau commutatif si on pose pour x = (xn )n∈N et
y = (yn )n∈N
x + y = (xn + yn )n∈N
x × y = xy = (xn yn )n∈N .
l’élément neutre de + est (0), la suite stationnaire nulle et l’élément neutre de × est
(1) la suite stationnaire d’éléments égaux à 1.
Proposition 19. L’ensemble C0 des suites de rationnels qui convergent vers 0 est un
idéal de C.
Démonstration : Le fait que C0 soit un sous-groupe additif de C est une conséquence

directe des propriétés 1) et 5) des suites de rationnels. Pour prouver que C0 est un idéal
de C, il reste à montrer que si x = (xn )n∈N est un élément de C0 et si y = (yn )n∈N est une
suite Cauchy de rationnels alors xy ∈ C0 . Cela résulte immédiatement des propriétés
2) et 3) des suites de rationnels.
Définition 9. L’anneau quotient C/C0 est appelé droite numérique et noté R. Ses
éléments sont appelés nombres réels.
Proposition 20. R est un corps commutatif.
Démonstration : R est un anneau commutatif qui admet pour unité la classe u des
suites qui convergent vers 1. Il reste à prouver que si une suite de Cauchy x = (xn )n∈N
ne converge pas vers 0, il existe une suite de Cauchy y = (yn )n∈N telle que xy converge
vers 1. Par la propriété 6) des suites de rationnels, si x ne converge pas vers 0 il existe
un entier n0 tel que la suite ( x1n )n>n0 est de Cauchy. Posons yn = 0 si n 6 n0 et yn = x1n
si n > n0 , la suite y = (yn )n∈N ainsi construite est telle que la suite xy converge vers 1.
Ainsi on a
x y = xy = u,
ce qui prouve, puisque x 6= 0 si et seulement si x ∈
/ C0 , que tout élément non nul de R
possède un inverse dans R.
Proposition 21. On définit un isomorphisme ϕ de Q sur un sous-corps de R en asso-
ciant à chaque rationnel q la classe q constituée des suites de rationnels qui convergent
vers q.
Démonstration : Il résulte immédiatement de la propriété 4) des suites de rationnels

que ϕ est un homomorphisme d’anneau. De plus puisque 0 = C0 , ker ϕ = {0} et ϕ est
donc injectif. Il définit donc un isomorphisme de Q sur un sous-corps de R.
Relation d’ordre dans R
25
Soit x ∈ C une suite de Cauchy de rationnels, on dira que x ∈ C + si et seulement si
(∀ε > 0, ε ∈ Q) (∃Nε ) (n > Nε =⇒ xn > −ε)
et que x ∈ C − si et seulement si
(∀ε > 0, ε ∈ Q) (∃Nε ) (n > Nε =⇒ xn < ε).
Lemme 2. On a
C + ∩ C − = C0 et C + ∪ C − = C.
Démonstration : Soient x ∈ C + ∩ C − , pour ε donné il existe Nε et Nε0 tels que si n > Nε

et n > Nε0 on ait respectivement xn > −ε et xn < ε, d’où si n > max(Nε , Nε0 ) on aura
|xn | < ε, c’est-à-dire x ∈ C0 .
Soit x ∈ C, alors x ∈/ C − équivaut à
(∃α > 0, α ∈ Q) (∀n ∈ N) (∃p ∈ N) (p > n et xp > α).
Puisque x est une suite de Cauchy, il existe n0 tel que si n > n0 et p > n0 on a
|xn − xp | < α2 . Choisissons p > n0 tel que xp > α, alors pour tout n > n0 on a
xn > α2 > 0 et donc x ∈ C + .
Lemme 3. Les assertions suivantes sont satisfaites :

(i) x ∈ C − ⇔ (−x) ∈ C + ;
(ii) x ∈ C + et y ∈ C + =⇒ x + y ∈ C + ;
(iii) x ∈ C + et y ∈ C + =⇒ xy ∈ C + ;
(iv) Si x, x0 ∈ C vérifient x − x0 ∈ C0 , alors x et x0 appartiennent toutes deux à C +
ou à C − .
Démonstration : Les assertions (i) et (ii) sont des conséquences directes de la définition
de C + . Considérons l’assertion (iii) : si parmi x et y l’un est dans C0 , alors xy ∈ C0 par
les propriétés 2) et 3) des suites de rationnels et si x et y ne sont pas dans C − , pour n
assez grand on a xn > 0 et yn > 0 et donc xn yn > 0, soit xy ∈ C + , ce qui prouve (iii).
Pour l’assertion (iv) considérons le cas où x ∈ C + , le cas où x ∈ C − se traite de
manière analogue. Si x ∈ C + et si ε > 0, ε ∈ Q est donné, il existe n1 tel que xn > − 2ε
si n > n1 . Comme x − x0 ∈ C0 , il existe n2 tel que si n > n2 alors |xn − x0n | < 2ε . Ainsi
pour n > max(n1 , n2 ) on a x0n > xn − 2ε > −ε, c’est-à-dire x0 ∈ C + .
L’assertion (iv) du Lemme 3 permet de donner la définition suivante :
Définition 10. Un nombre réel est dit positif (resp. négatif) s’il est représenté par une
suite de Cauchy appartenant à C + (resp. C − ).
On note R+ = C + /C0 et R− = C − /C0 .
26
Les Lemmes 2 et 3 permettent de définir une relation d’ordre sur R en posant a 6 b

si et seulement si b − a ∈ R+ . Grâce aux propriétés (i), (ii) et (iii) du Lemme 3, (R, 6)
est un corps totalement ordonné. Notons que l’injection ϕ de Q dans R est croissante,
puisque q > 0 dans Q équivaut à ϕ(q) ∈ R+ .
Théorème 4. R est un corps archimédien.
Démonstration : Il suffit de prouver que pour tout a ∈ R, il existe p ∈ N tel que p > a
(si x, y ∈ R avec x > 0, en posant a = xy on aura px > y). Soit a = (an )n∈N . La suite
(an )n∈N étant de Cauchy, elle est bornée et par conséquent il existe M = mq ∈ Q tel que
|an | 6 M pour tout n ∈ N. La suite (M − an )n∈N est constituée de rationnels positifs,
elle est donc dans C + , ce qui signifie que le nombre réel M-a est positif. On a donc
m
q
> a, d’où m > a et p = m + 1 convient.
Notion de suite de Cauchy et de suite convergente dans R

Les définitions sont analogues à celles des suites de Cauchy et des suites convergentes
dans Q, mais cette fois on autorise ε à appartenir à R. Comme R est archimédien cela
n’apporte rien car si ε > 0 est un nombre réel, il existe ε1 ∈ Q tel que 0 < ε1 < ε (il
suffit de poser ε1 = p1 , avec p ε > 1).
Pour prouver que R est complet nous avons besoin de quelques lemmes qui ont un
intérêt intrinsèque.
Lemme 4. Si x et y sont deux éléments de R tels que x < y, il existe r ∈ Q tel que
x < r < y.
Démonstration : Puisque R est archimédien, il existe q ∈ N tel que q(y − x) > 1. Soit
E = {n ∈ Z | nq 6 x}. Comme R est archimédien et 1q > 0, il existe n0 ∈ N tel que
n0
q
> |x|, par conséquent l’ensemble E n’est pas vide car il contient −n0 et il est majoré
par n0 ; il possède donc un plus grand élément p qui vérifie
p p+1
6x< .
q q
p+1 1
Posons r = q
, alors x < r < x + q
< y par définition de q.
Lemme 5. Toute suite de Cauchy de rationnels converge dans R vers le nombre réel
qu’elle représente.
Démonstration : Soit x = (xn )n∈N une suite de Cauchy dans Q. Choisissons ε > 0,
ε ∈ Q, il existe alors Nε tel que si p > Nε et q > Nε on a |xp − xq | < ε, c’est-à-dire
xp − ε < xq < xp + ε.
Fixons p > Nε , par définition de la relation d’ordre sur R on obtient
xp − ε 6 x 6 xp + ε,
ce qui implique que la suite (xn )n∈N converge vers x dans R.
27
Théorème 5. R est complet.
Démonstration : Soit (xn )n∈N une suite de Cauchy dans R. Nous allons construire une
suite y = (yn )n∈N de rationnels assez « proche » de la suite (xn )n∈N pour qu’elle soit
encore de Cauchy et nous montrerons que la suite (xn )n∈N converge vers y dans R.
Construction de la suite (yn )n∈N
Pour tout n ∈ N∗ , il résulte du Lemme 4 qu’il existe yn ∈ Q tel que
1 1
xn − < yn < xn + .
n n
ε
Pour ε > 0, ε ∈ Q donné, il existe nε tel que si p > nε et q > nε on a |xp − xq | < 3
et
donc
|yp − yq | < |yp − xp | + |xp − xq | + |xq − yq |
1 1
< + + |xp − xq |
p q
1 1 3
< + + .
p q ε
Posons mε = max(nε , 3ε ), alors si p > mε et q > mε on a |yp − yq | < ε. La suite (yn )n∈N
est donc de Cauchy dans Q.
Convergence de la suite (xn )n∈N
Il résulte de la démonstration du Lemme 5 que |y − yp | < ε si p > mε , d’où
1 4ε
|y − xp | < ε + <
p 3
et la suite (xn )n∈N converge donc vers y.
Représentation décimale d’un nombre réel

L’objet de ce paragraphe est de prouver que, pour tout x ∈ R, il existe une unique
suite (xn )n∈N d’éléments de Z tels que, pour tout n ∈ N∗ , 0 6 xn 6 9 et pour tout
N ∈ N il existe n > N tel que xn 6= 9 et x = limn→∞ nk=0 xk 10−k . La suite (xn )n∈N
P
est unique. La suite (xn )n∈N s’appelle un développement décimal propre de x et il est
d’usage de le noter
x0 , x1 x2 . . . xn . . .
Lemme 6. Pour tout ε > 0 et tout x ∈ R, il existe un unique entier p ∈ Z tel que
pε 6 x < (p + 1)ε.
Démonstration : Comme R est archimédien, il existe n ∈ N tel que nε > |x|, i.e.
−nε 6 x 6 nε, donc l’ensemble P des entiers relatifs tels que pε 6 x est non vide
(−n ∈ P ) et majoré par n, il admet donc un plus grand élément p qui vérifie bien sûr
pε 6 x < (p + 1)ε.
28
Si p0 vérifiait également p0 ε 6 x < (p0 + 1)ε, on aurait p0 ε < (p + 1)ε et pε < (p0 + 1)ε,
d’où p0 < p + 1 et p < p0 + 1 puisque ε 6= 0, soit p = p0 .
Lorsque ε = 1, l’entier p du Lemme 6 s’appelle la partie entière de x et est habi-
tuellement noté bxc. On appelle partie décimale de x la différence x − bxc. On la note
D(x), elle appartient à l’intervalle [0, 1[.
Soit d ∈ N, d > 2, prenons ε = d−n . Si x ∈ R, d’après le Lemme 6, il existe un
unique pn ∈ Z tel que
pn d−n 6 x < (pn + 1)d−n .
Le nombre rationnel ζn = pn d−n s’appelle la valeur approchée par défaut de x à d−n
près.
En remplaçant n par n + 1, on obtient pn+1 qui vérifie
pn d−n < (pn+1 + 1)d−n−1 et pn+1 d−n−1 < (pn + 1)d−n ,
d’où dpn 6 pn+1 < d(pn + 1). On peut alors définir par récurrence une unique suite
(xn )n∈N telle que x0 = p0 ∈ Z et pn = nk=0 xk dn−k avec 0 6 xk 6 d − 1 si k > 1. La
P
valeur approchée par défaut de x à d−n près est alors donnée par
n
xk d−k .
X
ζn =
k=0
n
Remarquons que, puisque d > 2, d > 1 + n(d − 1) > 1 + n par la formule du
binôme de Newton donc limn→∞ d−n = 0. La suite (ζn )n∈N des valeurs approchées
vérifie |x − ζn | < d−n et converge donc vers x quand n tend vers l’infini.
Lorsque d = 10 la suite (xn )n∈N s’appelle un développement décimal illimité de x et
on écrit
ζn = x0 , x1 . . . xn .
On dira que le développement décimal est propre si, pour tout N ∈ N, il existe n > N
tel que xn 6= 9. Les développements obtenus par la méthode développée ici sont toujours
propres. En effet si xn = 9 pour tout n > p, on aurait
n
10−k = 10−p − 10−n
X
ζn − ζp = 9
k=p+1
et ζ = ζn + 10−n = ζp + 10−p pour tout n > p, mais

ζ − 10−n = ζn 6 x < ζn + 10−n = ζ
par définition de ζn , soit 0 < 10n (ζ − x) 6 1 pour tout n > p ce qui est impossible
puisque R est archimédien.
Nous venons donc de prouver que tout nombre réel x possède un unique dévelop-
pement décimal illimité propre. Si on note D l’ensemble des suites (xn )n∈N d’entiers
relatifs telles que pour tout n ∈ N, 0 6 xn 6 9 et pour tout N ∈ N il existe n > N tel
que xn 6= 9, nous avons donc défini une application δ : R → D qui a chaque nombre
réel x associe son développement décimal illimité propre.
29
Proposition 22. L’application δ de R dans D qui a chaque nombre réel x associe son
développement décimal illimité propre (xn )n∈N est une bijection et pour tout x ∈ R on
a n
xk 10−k .
X
x = lim (10)
n→∞
k=0
Démonstration : L’existence de l’application δ et la formule (10) résultent de ce qui pré-

cède. Il reste à prouver que δ est une bijection. Soit (xn )n∈N un élément de D, cherchons
x ∈ R tel que δ(x) = (xn )n∈N . Remarquons que la suite de rationnels (ζn )n∈N définie
par ζn = nk=0 xk 10−k est croissante et de Cauchy. En effet ζn+1 −ζn = xn+1 10−n−1 > 0
P
et si n < m
m m
xk 10−k 6 9 10−k = 10−n − 10−m < 10−n .
X X
0 6 ζm − ζn =
k=n+1 k=n+1
La suite de rationnels (ζn )n∈N définit donc un nombre réel x. De plus si on pose pn =
10n ζn , pn ∈ Z et pn 10−n 6 x < (pn + 1)10−n , et par conséquent δ(x) = (xn )n∈N par
construction de δ.
Notons ϕ l’application de D dans R qui à la suite (xn )n∈N associe le nombre réel x
défini par la suite (ζn )n∈N , il est clair que δ ◦ ϕ et ϕ ◦ δ sont respectivement l’application
identique de D et celle de R, ce qui prouve que δ est bijective et que δ −1 = ϕ.
La proposition suivante permet de caractériser nombres rationnels par leurs déve-
loppements décimaux.
Proposition 23. L’ensemble Q des nombres rationnels correspond au sous-ensemble
des nombres réels dont le développement décimal est périodique.
Démonstration : Soit x ∈ R un nombre réel dont le développement décimal est pério-

dique,i.e.
x = x0 , x1 . . . xp y1 . . . yq y1 . . . yq . . .
Alors
p Pq ∞
−k yk 10−k X
k=1
10−kq )
X
x= xk 10 + (
k=0 10p+q k=0
p Pq
X
−k k=1 yk 10−k 1
= xk 10 + p+q −q
k=0 10 10 − 1
et par conséquent x ∈ Q.
Réciproquement soit x = pq ∈ Q avec p et q des entiers premiers entre eux. On
définit par récurrence une suite d’entiers rn , n > 1, tels que 0 6 rn < q en considérant
les restes des divisions euclidiennes successives de p par q, puis de 10 r1 par q et ainsi
de suite. En notant xn−1 les différents quotients on aura
p 10−n
x= = x0 + 10−1 x1 + 10−2 x2 + · · · + 10−n xn + rn+1 .
q q
30
La suite (rn )n∈N prenant ses valeurs dans un ensemble fini à q éléments, les nombres
r1 , . . . , rn+1 ne peuvent pas être deux à deux distincts. Si ri = rj pour 1 6 i < j 6 q +1,
la suite (xn )n∈N vérifie xp = xp+k(j−i+1) pour p > i et k ∈ N, elle est donc périodique.
De plus x0 , x1 . . . xn . . . est le développement décimal de x car
n
rn+1 −n
xk 10−k 6 x 6 ζn + 10 < ζn + 10−n
X
ζn =
k=0 q
puisque rn+1 < q.

Grâce aux développement décimaux on peut montrer que R, qui contient Q, est en
fait beaucoup plus gros que Q.
Proposition 24. L’ensemble R n’est pas dénombrable.
Démonstration : Nous allons démontrer que l’intervalle [0, 1] ⊂ R n’est pas dénom-
brable. Il suffit de prouver que pour tout sous-ensemble dénombrable D de [0, 1] on
peut construire un élément de [0, 1] qui n’est pas dans D.
Soit (xn )n∈N une suite de nombres réels contenus dans l’intervalle [0, 1]. Chaque
terme de cette suite possède un développement décimal illimité propre
xn = 0, xn1 xn2 . . . xnp . . .
On construit maintenant un nombre réel y dans [0,1] en considérant le n-ième chiffre

après la virgule de xn . On définit le nombre réel y par son développement décimal
propre : y = 0, y1 y2 . . . yp . . . où si la n-ième décimale de xn est différente de 1, alors
yn = 1, sinon yn = 2. Le nombre y est clairement dans l’intervalle [0, 1] mais ne peut
pas apparaître dans la suite (xn )n∈N , car il ne peut être égal à aucun des xn puisque
pour tout n sa n-ième décimale est différente de la n-ième décimale de xn .
Définitions axiomatiques de R
Le corps R contenant Q que nous avons construit est un corps commutatif archimédien
et complet. Nous allons montrer qu’un tel corps est unique à isomorphisme près.
Notons que si K est un corps commutatif totalement ordonné on peut définir,
comme nous l’avons fait pour le corps Q, les notions de suites convergentes et de suites
de Cauchy et que les propriétés 1) à 6) restent encore valables.
Théorème 6. Si K est un corps commutatif archimédien et complet, alors il existe

un isomorphisme de R sur K prolongeant l’identité de Q (quand on identifie Q au
sous-corps de K formé des éléments pq e = (pe)(qe)−1 , où e est l’élément unité de K).
Démonstration : Définissons une application f : R → K par : si a ∈ R est la classe d’une

suite de Cauchy de rationnels (an )n∈N alors, on pose, f (a) = limn→∞ an e (cette limite
existe puisque K est complet et ne dépend pas du choix du représentant (an )n∈N ).
31
Par construction, f est un morphisme d’anneau strictement croissant. Enfin, f est

surjective, grâce au fait que K est archimédien : pour tout b ∈ K, b > 0 et tout entier
n > 0, il existe un rationnel an e compris entre b et b + 1/n et an = np , où p est le plus
petit entier majorant nb. Une telle suite (an )n∈N est de Cauchy, et sa classe a ∈ R est
un antécédent de b par f .
L’unicité à isomorphisme près de R a plusieurs conséquences. D’une part R est indé-
pendant du choix de son mode de construction, nous avons privilégié ici une construc-
tion à partir des suites de Cauchy (c’est une méthode classique que l’on retrouve
en topologie pour construire le complété d’un espace vectoriel topologique), d’autres
constructions sont possibles à l’aide des coupures de Dedekind ou à l’aide des dévelop-
pements décimaux. D’autre part cela permet de donner une définition axiomatique de
R comme étant le seul corps commutatif archimédien et complet.
Prouvons pour terminer que R est le seul corps commutatif totalement ordonné tel
que toute partie non vide majorée admet une borne supérieure, ce qui donne une autre
définition axiomatique de R.
Proposition 25. Soit K un corps commutatif totalement ordonné tel que toute partie
non vide majorée admet une borne supérieure, alors K est archimédien et complet.
Démonstration : Prouvons que K est archimédien. Soient a, b deux éléments de K,

on suppose a > 0. On cherche un entier n tel que na > b. Si b 6 0, n = 1 convient. Si
b > 0, on considère l’ensemble A = {ka | k ∈ N, ka 6 b}. Cet ensemble est non vide (il
contient 0) et majoré par b, donc il possède une borne supérieure c. L’élément c − a est
strictement inférieur à c, par conséquent ce n’est pas un majorant de A. Il existe donc
un élément ka de A tel que c − a < ka. Mais c < (k + 1)a donc (k + 1)a n’appartient
pas à A, si bien que (k + 1)a > b.
Montrons maintenant que K est complet. Soit (an )n∈N , une suite de Cauchy dans
K, nous devons prouver que (an )n∈N converge. La suite (an )n∈N est bornée, il existe
donc un élément M de K tel que pour tout entier n, |an | 6 M .
Pour tout n, l’ensemble An = {am | m > n} est majoré par M et non vide, il possède
donc une borne supérieure bn . La suite (−bn )n∈N est alors croissante et majorée par M .
Soit b = sup{−bn | n ∈ N}. Par définition de la borne supérieure, pour tout ε > 0,
ε ∈ K, il existe N tel que b − ε < −bN 6 b et, puisque la suite (−bn )n∈N est croissante,
pour tout n > N on a b − ε < −bn 6 b, soit −b 6 bn < −b + ε et la suite (bn )n∈N
converge donc vers a = −b.
La suite (an )n∈N étant de Cauchy pour tout ε > 0 dans K, il existe N f tel que pour
tous p, q ∈ N
f =⇒ a < a + ε .
p, q > N p q
2
Posons N 0 = max(N, N f). Pour tout n > N 0 , a + ε est alors un majorant de A 0 , donc
n 2 N
un majorant de bN 0 , si bien que
a − ε < bN − ε/2 ≤ an 6 bN < a + ε.
32
Ce qui montre que la suite (an )n∈N converge vers a.

Pour prouver la réciproque de la Proposition 25, nous allons introduire la notion
d’ensembles adjacents dans un corps commutatif K totalement ordonné.
Définition 11. Soient A et B deux parties non vides de K, on dit que (A, B) est un
couple d’ensembles adjacents si et seulement si
(i) Pour tout (a, b) ∈ A × B, a 6 b ;
(ii) Pour tout ε > 0, ε ∈ K, il existe (a, b) ∈ A × B tel que b − a 6 ε.
Lemme 7. Si le corps K est archimédien et complet et si (A, B) est un couple d’en-

sembles adjacents de K, il existe un unique élément c ∈ K tel que pour tout (a, b) ∈
A × B, a 6 c 6 b.
Démonstration : Par définition des ensembles adjacents, pour tout n ∈ N, il existe

1
(an , bn ) ∈ A × B tel que bn − an 6 n+1 Nous allons prouver que la suite (an )n∈N est
une suite de Cauchy dans K.
Grâce au (i) de la définition des ensembles adjacents on a an 6 bp pour tous n, p ∈ N,
par conséquent
1
an − ap 6 b p − ap 6
p+1
1
ap − an 6 b n − an 6
n+1
et donc
1 1
|an − ap | 6 max( , ).
n+1 p+1
Soit ε > 0, ε ∈ K, le corps K étant archimédien, il existe N ∈ N tel que N1+1 < ε.
Alors pour n, p > N on a |an − ap | 6 ε et la suite (an )n∈N est de Cauchy dans K.
Puisque K est complet, elle converge vers une limite c.
De plus par définition de an et bn , la suite (bn − an )n∈N converge vers 0. On en
déduit que la suite (bn )n∈N converge également vers c. Par ailleurs, si b ∈ B, on a, pour
tout n ∈ N, an 6 b et par passage à la limite c 6 b. De manière analogue on a a 6 c
pour tout a ∈ A.
Vérifions maintenant que c est unique. Supposons qu’il existe c et c0 tels que pour
tout (a, b) ∈ A × B
a 6 c < c0 6 b.
Alors pour tout (a, b) ∈ A × B, on a b − a > c0 − c, ce qui contredit la propriété (ii) de
la définition des ensembles adjacents.
Proposition 26. Soit K un corps commutatif archimédien et complet contenant Q,

alors K est totalement ordonné et toute partie non vide majorée de K admet une borne
supérieure.
33
Démonstration : Soit A une partie non vide majorée de K, notons B l’ensemble des
majorants de A. Nous allons prouver que (A, B) est un couple d’ensembles adjacents
de K. Remarquons tout d’abord que B est non vide (puisque A est majorée) et pour
tout (a, b) ∈ A × B, a 6 b. Soit ε > 0, ε ∈ K. Fixons b0 ∈ B et posons
I = {n ∈ N | b0 − nε ∈ B}.
L’ensemble I n’est pas vide car 0 ∈ I et il est majoré. En effet soit a0 ∈ A (A est non
vide), pour tout n ∈ I on a a0 6 b0 − nε et donc n 6 b0 −a
ε
0
. L’ensemble I possède donc
un plus grand élément n0 . Posons b = b0 − nε, alors b ∈ B et b − ε ∈ / B, il existe donc
a ∈ A tel que b − ε < a, soit b − a < ε. Le couple (A, B) est donc adjacent.
D’après le lemme 7, il existe M ∈ K tel que pour tout (a, b) ∈ A × B, a 6 M 6 b.
M est alors le plus petit majorant de A donc sa borne supérieure.
1.6 Construction des complexes

Soit d un élément de R, considérons l’équation x2 = x × x = d. Cette équation ne
peut avoir de solution dans R que si d > 0, puisque dans un corps totalement ordonné
le produit de deux éléments de même signe, en particulier d’un élément par lui-même,
est nécessairement positif. En particulier l’équation x2 = −1 n’a pas de solution dans
R.
Nous voulons construire un sur-corps de R dans lequel l’équation x2 = −1 possède
au moins une solution. La construction proposée s’appuie sur les propriétés algébriques
classiques du quotient d’un anneau par un idéal. Des constructions plus élémentaires
vous seront proposées en exercices.
Considérons R[X], l’anneau des polynômes à coefficients dans R. C’est un anneau
intègre qui contient R si on identifie R à l’ensemble des polynômes de degré nul auquel
on adjoint le polynôme nul. Le corps R peut également être identifié au quotient de
R[X] par l’idéal engendré par le polynôme irréductible X. Cherchons C sous la forme
du quotient de R[X] par un idéal engendré par un polynôme P irréductible (il aura
alors naturellement une structure de corps). Rappelons que deux éléments Q et R de
R[X] sont dans la même classe d’équivalence modulo P si et seulement si ils ont même
reste dans la division euclidienne par P . Considérons le cas où P (X) = X 2 + 1. Alors
la classe Q de tout polynôme Q contient un unique polynôme de degré inférieur ou égal
à 1, le reste rP (Q) de la division euclidienne du polynôme Q par le polynôme P . On
obtient donc par définition de la division euclidienne et du quotient par un idéal
Proposition 27. L’application rfP : R[X]/(X 2 + 1) → R1 [X], qui à la classe Q d’un

polynôme Q associe rP (Q), définit une bijection de R[X]/(X 2 + 1) sur R1 [X] telle que :
(i) rfP (Q + R) = rfP (Q) + rfP (R)
(ii) rfP (QR) = rfP (rfP (Q)rfP (R))
34
Remarquons que la classe X du polynôme X vérifie (X)2 = X 2 = −1. Par consé-

quent si rfP (Q) = aX + b et rfP (R) = cX + d, on a :
rfP (QR) = rP ((aX +b)(cX +d)) = rfP (acX 2 + (ad + bc)X + bd) = (ad+bc)X +bd−ac.
On définit le corps C des nombres complexes par C = R[X]/(X 2 + 1). Grâce à

la Proposition 27 et à la remarque qui suit, on peut identifier C à R[i], où désigne
l’ensemble des polynômes dans R à une indéterminée i qui vérifie i2 = −1. Un élément
z ∈ C s’écrit donc z = x + iy, où x et y sont des nombres réels, et si z = x + iy et
w = u + iv sont deux nombres complexes, on a
z + w = (x + u) + i(y + v)
zw = (xu − yv) + i(xv + yu).
Soit z ∈ C tel que z = x + iy. Alors x s’appelle la partie réelle de z et y la partie

imaginaire de z. On pose z = x − iy, z ∈ C, c’est le conjugué de z. L’application
c : z 7→ z définit un endomorphisme d’anneau qui vérifie c ◦ c = Id et dont l’ensemble
des points fixes est R. Le module de z est le nombre réel positif |z| tel que |z|2 = zz =
x2 + y 2 . Comme nous l’avons déjà remarqué z = 0 si et seulement si |z| = 0. De plus on
vérifie aisément que si z, z 0 ∈ C alors |zz 0 | = |z||z 0 | et l’ensemble T = {z ∈ C | |z| = 1}
définit un sous-groupe multiplicatif de C∗ .
35
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Pour chacune des définitions de O, N et s qui suivent, (O, N , s) est-il un
triplet naturel (oui ou non et pourquoi) ?
1. O = 1, N = {2n , n ∈ N}, s(n) = 2n.
2. O = 1, N = {2n , n ∈ Z}, s(n) = 2n.
3. O = 1, N = {2−n , n ∈ N}, s(n) = n/2.
4. O = {1}, N = {{n} , n ∈ N}, s(n) = {n} ∪ {1}.
5. O = ∅, N = {{1, . . . , n} , n ∈ N}, s({1, . . . , n}) = {1, . . . , n + 1}.
6. O = {0}, N = {n}, s({n}) = {n + 1}).
Vrai-Faux 2. Soit H(n) un énoncé dépendant de l’entier n. Les assertions suivantes

entraînent-elles que H(n) est vraie pour tout n ∈ N (oui ou non et pourquoi) ?

1. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 1) .

2. H(1) ∧ ∀n ∈ N , H(n) =⇒ H(n + 1) .

3. H(0) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

4. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 2) .

5. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(n + 2) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

6. H(0) ∧ ∀n ∈ N , H(n) =⇒ H(2n) ∧ ∀n ∈ N , H(n + 1) =⇒ H(n) .

7. (H(0)∧H(1))∧ ∀n ∈ N , H(n) =⇒ H(2n) ∧ ∀n ∈ N , H(n+1) =⇒ H(n) .
Vrai-Faux 3. Les affirmations suivantes sont-elles vraies ou fausses et pourquoi ?

1. Toute partie de N admet un plus petit élément.
2. Toute partie non vide de N admet un plus grand élément.
3. Toute partie non vide et majorée de Z admet un plus grand élément.
4. Toute partie de N différente de N admet un plus grand élément.
5. Toute partie finie de Q admet un plus grand élément.
6. L’ensemble des majorants d’un sous-ensemble non vide de Q admet un plus
petit élément dans Q.
7. L’ensemble des minorants d’un sous-ensemble non vide de Q+ admet un plus
grand élément dans R.
36
Vrai-Faux 4. Les affirmations suivantes sont-elles vraies ou fausses et pourquoi ?

1. Si un nombre entier est une puissance de 2 alors son écriture dans une base b
impaire ne contient aucun 0.
2. Si un nombre entier est une puissance de 2 alors son écriture dans une base
b 6= 2 ne se termine pas par 0.
3. Si l’écriture d’un nombre entier dans une base impaire se termine par 0, alors
ce nombre est impair.
4. Si l’écriture d’un nombre entier dans un base paire se termine par 0, alors ce
nombre est pair.
5. Si l’écriture hexadécimale d’un nombre commence par 8, suivi seulement de
zéros, alors ce nombre est une puissance de 2.
6. Si l’écriture hexadécimale d’un nombre ne contient que des 2, alors ce nombre
est divisible par 32.
1. Si a + b est rationnel, alors soit a est rationnel soit b est rationnel.
2. Si a + b est irrationnel, alors soit a est irrationnel soit b est irrationnel.
3. Si a est rationnel, alors sa partie décimale est rationnelle.
4. Si a est irrationnel, alors la partie décimale de a + b est irrationnelle.
5. Si la partie décimale de a est rationnelle, alors a est rationnel.
Vrai-Faux 6. Soit (xn ) une suite de rationnels. Parmi les affirmations suivantes les-
1. Si (xn ) est une suite de Cauchy, alors elle converge dans Q.
2. Si (xn ) converge dans Q alors c’est une suite de Cauchy.
3. Si la suite (xn ) est majorée, alors c’est une suite de Cauchy.
4. Si la suite (xn ) tend vers 0, alors elle est bornée.
5. Si (xn ) est une suite de Cauchy, alors elle converge dans R.
Vrai-Faux 7. Soit A une partie non vide de R. Parmi les affirmations suivantes les-
1. Si A est minorée, alors A possède une borne inférieure.
2. Si x 6 sup(A) alors x ∈ A.
3. Si A contient au moins 2 réels distincts, alors A contient un rationnel.
4. Si A est infinie, alors A contient une infinité d’irrationnels.
5. Si A contient un intervalle de R, contenant lui-même deux points distincts,
alors A contient une infinité d’irrationnels.
37
6. Si A contient un intervalle de R, alors A contient une infinité de rationnels.

Vrai-Faux 8. Soit A une partie non vide de R. On note |A| = {|x| , x ∈ A}. Parmi les
1. Si A est majorée, alors |A| possède une borne supérieure.
2. 0 est un minorant de |A|.
3. |A| possède toujours une borne inférieure.
4. |A| possède toujours une borne supérieure.
5. A est bornée si et seulement si |A| est majorée.
6. Si A est un intervalle, alors |A| est un intervalle.
7. Si |A| est un intervalle, alors A est un intervalle.
8. Si A est un intervalle ouvert, alors |A| est un intervalle ouvert.
9. Si A est un intervalle fermé, alors |A| est un intervalle fermé.
1. |ab| = |a| |b|.
2. |a| − |b| 6 |a − b|.
3. |a − b| 6 max{|a|, |b|}.
4. |a − b| = |a − (a + b)/2| + |(a + b)/2 − b|.
5. |a − b| = |a − (a + b)| + |(a + b) − b|.
6. Si |a − b| < |a|, alors |ab| = ab.
7. ba + bc = bac + bbc.
8. ba + bc > bac + bbc.
9. ba + bc 6 bac + bbc + 1.
10. D(a + b) = D(a) + D(b).
Vrai-Faux 10. Parmi les affirmations suivantes lesquelles sont vraies, lesquelles sont
1. Le corps des rationnels est archimédien.
2. Tout corps archimédien contenant Q est isomorphe à R.
3. Le corps des rationnels est archimédien et complet.
4. Dans un corps archimédien, toute partie non vide et majorée possède une borne
supérieure.
5. Tout corps archimédien et complet est isomorphe à R.
Vrai-Faux 11. On considère le quotient Q[X]/(X 2 −2). Parmi les affirmations suivantes
38
√
1. Il est isomorphe à Q + 2Q.
2. C’est un corps archimédien.
3. C’est un corps complet.
4. C’est un corps isomorphe à C.
5. C’est un corps isomorphe à Q + iQ.
2.2 Exercices
Exercice 1. On considère un triplet naturel (O, N , s).
1. Montrer que (s(O), N \ {O}, s) est un triplet naturel.
2. On note s2 l’application composée s ◦ s. Soit P une propriété définie sur N telle
que P(O) est vraie, P(s(O)) fausse et :
∀a ∈ N , P (a) =⇒ P (s2 (a)) .
On note N2 l’ensemble des éléments de N tels que P(a) est vraie. Montrer que
N2 est un ensemble non majoré.
3. Montrer que (O, N2 , s2 ) est un triplet naturel.
4. On note s0 l’application identique, et on définit par récurrence sn comme l’appli-
cation composée s ◦ sn−1 , pour n > 1. Définir l’application successeur σ telle que
(s0 , {sn , n ∈ N}, σ) soit un triplet naturel.
Exercice 2. On dit qu’un ensemble A est infini s’il existe une application injective de
A vers un sous-ensemble de A différent de A.
1. Montrer que N est infini.
2. Montrer que tout sous-ensemble de N non majoré est infini.
3. Soit A un ensemble tel qu’un de ses sous-ensembles soit infini. Montrer que A est
infini.
4. Soit A un ensemble infini. Montrer que le complémentaire de tout sous-ensemble
fini de A est infini.
5. Soit A un ensemble infini, et O un élément de A. Construire un sous-ensemble
N et une application s tels que (O, N , s) soit un triplet naturel.
6. Montrer qu’un ensemble A est infini si et seulement si il existe une application
injective de N dans A.
Exercice 3.
1. Écrire dans les bases 2, 3, 4, 5, 8, 16 le nombre qui s’écrit 2345816 en base 10.
2. Écrire en base 10 le nombre qui s’écrit 12345 en base 8.
3. Écrire en base 10 le nombre qui s’écrit ABCDEF en base 16.
39
4. Écrire en base 4, puis 8, puis 16 le nombre qui s’écrit 1001101011101 en base 2

(sans passer par la base 10).
5. Écrire en base 2 le nombre qui s’écrit ABCDEF en base 16 (sans passer par la
base 10).
6. En base 16, quel est le successeur du nombre EF F EF ?
7. En base 16, quel est le prédécesseur du nombre A0000 ?
Exercice 4. Soit E = R2 \ {(0, 0)}. Soit R la relation sur E définie par :

0 0 0 0
(x, y)R(x , y ) ⇐⇒ ∃λ ∈ R , (x, y) = λ(x , y ) .

2. Montrer que l’ensemble quotient E/R est en bijection avec les droites vectorielles
du plan.
3. Pour tout (x, y) ∈ E, on note (x, y) sa classe d’équivalence pour R. On considère
l’application f , de R dans E/R, qui à x associe (x, 1). Montrer que f est injective
et déterminer Im(f ).
4. L’addition vectorielle sur E induit-elle une loi de composition interne sur E/R ?
5. Soient (a, b, c, d) quatre réels tels que ad − bc 6= 0. On considère l’application g
de R2 dans R2 qui à (x, y) associe (ax + by, cx + dy).
(a) Montrer que g est une bijection de R2 dans R2 , et qu’elle induit une bijection
de E dans E.
(b) Montrer que
∀(x, y), (x0 , y 0 ) ∈ E , (x, y)R(x0 , y 0 ) =⇒ g(x, y)Rg(x0 , y 0 ) .
(c) En déduire que g induit une bijection de E/R dans lui-même.

Exercice 5. Soit d ∈ N∗ un nombre fixé. On note D l’ensemble des « d-cimaux », à
savoir l’ensemble des éléments de Q multiples entiers d’une puissance de d.
D = { ndm , (n, m) ∈ Z2 } .
1. Montrer que (D, +, ×) est un sous-anneau de (Q, +, ×). Est-ce un sous-corps ?

2. On considère le sous-ensemble de DN , formé des suites de Cauchy à valeurs dans
D. On le note D. On le munit de la multiplication et de l’addition terme à terme.
Montrer que (D, +, ×) est un sous-anneau de (C, +, ×) (suites de Cauchy à valeurs
dans Q).
3. Soit D0 l’ensemble des suites de Cauchy à valeurs dans D, dont la limite est 0.
Montrer que D0 est un idéal de D.
4. Montrer que l’anneau quotient D/D0 est un corps commutatif, noté K.
40
5. On note D+ et D− les intersections de D avec C + et C − . Montrer que D+ ∩ D− =

D0 , et que D+ ∪ D− = D.
6. On considère la relation sur D définie par ((un ) (vn )) ⇐⇒ (vn − un ) ∈ D+ .
Montrer que cette relation est compatible avec le quotient par D0 , et qu’elle
définit donc une relation d’ordre sur K encore notée .
7. Montrer que K muni de la relation est un corps totalement ordonné et archi-
médien.
8. On note I l’injection canonique de D dans C. Montrer que I passe au quotient
en une injection canonique de K dans R.
9. On appelle suite d’approximation d-cimale, toute suite (un ) d’éléments de D telle
que :
∀n ∈ N , un 6 un+1 < un + d−n .
Montrer que toute suite d’approximation d-cimale appartient à D.
10. Soit x un réel. Pour tout n ∈ N, on pose un = d−n bx dn c. Montrer que la suite
(un )n∈N est une suite d’approximation d-cimale, et qu’elle converge vers x dans
R. En déduire que K = R.
11. Soit x un réel compris entre 0 et 1. Pour tout m > 1, on définit cm = bdm xc −
dbdm−1 xc. Montrer que cm ∈ {0, . . . , d − 1}. La suite (cm ) est le développement
d-cimal de x. Montrer que la suite de terme général c1 d−1 + . . . + cm d−m est une
suite d’approximation d-cimale et qu’elle converge vers x.
12. Montrer qu’un réel x est un rationnel si et seulement si son développement d-cimal
est périodique.
13. Soit x un réel compris entre 0 et 1 et (cn ) son développement d-cimal. Soient p(x)
et i(x) les deux réels donc les développements d-cimaux sont les suites (c2n )n∈N
et (c2n+1 )n∈N . Montrer que l’application x 7−→ (p(x), i(x)) est une bijection de
[0, 1] dans [0, 1]2 .
14. On se place désormais dans le cas d = 3. On appelle ensemble de Cantor et on note
T, l’ensemble des réels x compris entre 0 et 1, tels que pour tout n, l’entier bx 3n c
vaut 0 ou 2. Construire une bijection entre T et l’intervalle [0, 1]. (Indication :
transformer un développement 3-cimal en un développement 2-cimal).
15. Soit m ∈ N∗ un entier. Soit Tm l’ensemble des éléments de D :
Tm = { c1 3−1 + · · · cm 3−m , c1 , . . . cm ∈ {0, 2} } .
Montrer que Tm est une réunion finie d’intervalles de longueur 1/3m . En déduire
la mesure de Lebesgue de Tm .
16. Montrer que pour tout m ∈ N∗ , T ⊂ Tn . En déduire que la mesure de Lebesgue
de T est nulle.
Exercice 6. Soit K un corps totalement ordonné. On appelle coupure de Dedekind un
couple (A, B) de sous-ensembles de K vérifiant :
41
(i) A 6= ∅, B 6= ∅,
(ii) A ∩ B = ∅
(iii) A ∪ B = K
(iv) ∀x ∈ A , ∀y ∈ B , x < y
(v) A ne possède pas de plus grand élément.
1. Soit r ∈ K. On note Ar = {x ∈ K , x < r}, et Ar son complémentaire. Montrer
que le couple (Ar , Ar ) est une coupure de Dedekind.
2. Soit (A, B) une coupure de Dedekind. Montrer qu’il existe au plus un r ∈ K tel
que A = Ar .
3. Pour K = R : montrer que si (A, B) est une coupure de Dedekind, alors il existe
r ∈ R tel que A = Ar .
4. Pour K = Q : montrer que le couple (A, B) défini comme suit est une coupure
de Dedekind.
A = {x ∈ Q , x 6 0 ou x2 < 2} et B = {y ∈ Q , y > 0 et y 2 > 2} .
5. Retour au cas général : montrer que si (A, B) est une coupure de Dedekind alors

∀x ∈ K , (a ∈ A) ∧ (x 6 a) =⇒ x ∈ A ,
et
∀y ∈ K , (b ∈ B) ∧ (y > b) =⇒ y ∈ B .
6. Soient (A, B) et (C, D) deux coupures de Dedekind. On définit la relation en

posant :
(A, B) (C, D) ⇐⇒ A ⊂ C .
Montrer que est une relation d’ordre total sur l’ensemble des coupures de
Dedekind.
7. Soient r et s deux éléments de K. Montrer que
(Ar , Ar ) (As , As ) ⇐⇒ r 6 s .
8. Montrer que l’ensemble des coupures de Dedekind, muni de l’ordre , possède la
propriété de la borne supérieure.
9. Désormais, K = Q. On définit l’addition de deux sous-ensembles A et C de Q
par :
A ⊕ C = {a + c, a ∈ A, c ∈ C } ,
et l’addition des coupures de Dedekind par :
(A, A) ⊕ (C, C) = (A ⊕ C, A + C) .
Montrer que si r et s sont deux rationnels, alors (Ar , Ar )⊕(As , As ) = (Ar+s , Ar+s ).
Montrer que l’ensemble de coupures de Dedekind, muni de cette addition est un
groupe commutatif.
42
10. Procéder comme dans la question précédente pour définir la multiplication ⊗

des coupures de Dedekind (attention aux nombres négatifs). Montrer que si r
et s sont deux rationnels, alors (Ar , Ar ) ⊗ (As , As ) = (Ars , Ars ). Montrer que
l’ensemble de coupures de Dedekind, muni de ⊕ et ⊗ est un corps commutatif.
11. Montrer que ce corps est archimédien et complet.
12. En déduire qu’il est isomorphe à R.
Exercice 7.
1. On munit R2 des deux lois de composition interne définies par :
(x, y) ⊕ (x0 , y 0 ) = (x + x0 , y + y 0 ) et (x, y) ⊗ (x0 , y 0 ) = (xx0 − yy 0 , xy 0 + yx0 ) .
Montrer que (R2 , ⊕, ⊗) est un corps, isomorphe à C.

2. On considère le sous-ensemble E suivant de M2,2 (R) :
( ! )
a −b 2
E= , (a, b) ∈ R .
b a
Montrer que E, muni de l’addition et de la multiplication matricielles est un

corps, isomorphe à C.
Exercice 8. Montrer qu’il n’existe pas de relation d’ordre total sur C qui prolonge la
relation d’ordre sur R et qui soit compatible avec la somme et le produit c’est-à-dire
telle que :
• a ≤ b et c ≤ d entraîne a + c ≤ c + d, et
• a ≤ b et 0 ≤ c entraîne ac ≤ bc.
Exercice 9.
1. On considère le sous-ensemble H suivant de M2,2 (C) :
( ! )
a + bi −c + di 4
E= , (a, b, c, d) ∈ R .
c + di a − bi
Montrer que H, muni de l’addition et de la multiplication matricielles est un corps

non commutatif (c’est le corps des quaternions).
2. On pose :
! ! ! !
1 0 i 0 0 1 0 i
1= , I= , J= , K= .
0 1 0 −i −1 0 i 0
Vérifier que H est un R-espace vectoriel de dimension 4, dont (1, I, J, K) est une
base.
3. Calculer I 2 , J 2 , K 2 , IJ, IK, KJ, IJK.
43
4. On munit R4 de sa base canonique, que l’on note (e1 , ei , ej , ek ). On munit R4 de

l’addition vectorielle +. Montrer que les trois propriétés suivantes définissent une
loi de composition interne × sur R4 .
i) × est distributive par rapport à + ;
ii) e1 est élément neutre pour × ;
iii) ei × ei = ej × ej = ek × ek = ei × ej × ek = −e1 .
5. Montrer que (R4 , +, ×) est un corps non commutatif, isomorphe à H.
6. On considère le sous-ensemble H de M4,4 (R), formé des matrices de la forme
a −b −c −d
 
 b a −d c 
M (a, b, c, d) =  ,
 
c d a −b

 
d −c b a
pour tout (a, b, c, d) ∈ R4 . Montrer que H, muni de l’addition et de la multipli-

cation matricielles est un corps non commutatif, isomorphe à H.
Exercice 10. Soit K un anneau commutatif. On dit qu’un élément d de K est un carré
dans K s’il existe un élément x ∈ K tel que x2 = x × x = d. Soit K un anneau
commutatif et d un élément de K qui n’est pas un carré dans K. On note L le produit
cartésien K × K.
1. Supposons qu’il existe un anneau A contenant K dans lequel l’équation x2 = d
possède au moins une solution. Notons ω une des solutions de cette équation.
Soit f l’application de L dans A qui à (x, y) associe x + ωy. Notons A0 = Im(f ).
Montrer que A0 est un sous-anneau de A contenant K, dans lequel l’équation
x2 = d possède au moins une solution.
2. Montrer que si K est un corps, alors f est injective.
3. On définit sur L deux lois de composition interne par :
(x, y) ⊕ (x0 , y 0 ) = (x + x0 , y + y 0 ), (11)
(x, y) ⊗ (x0 , y 0 ) = (xx0 + dyy 0 , xy 0 + x0 y). (12)

Montrer que (L, ⊕, ⊗) est un anneau commutatif. On le note K[d], et on l’appelle
extension quadratique de K.
4. Soit j l’application de K dans L qui à x associe (x, 0). Montrer que j(K) est un
sous-anneau de L, et que j est un isomorphisme d’anneaux de K sur j(K).
5. Notons ω l’élément (0, 1) de L. Vérifier que ω 2 = (0, 1) ⊗ (0, 1) = d.
6. Vérifier que pour tout (x, y) ∈ L, (x, y) = j(x) + ωj(y).
7. Montrer que si K est un corps, alors K[d] est un corps.
8. Vérifier que R[i] est isomorphe à C.
44
Exercice 11. Soit Z[i] l’ensemble des nombres complexes de la forme a + ib avec a et b
éléments de Z.
1. Montrer que Z[i] est un sous-anneau de C.
2. Soit z un élément de Z[i]. Montrer que le conjugué z de z appartient à Z[i] et
que |z|2 appartient à N.
3. Soit z un élément de Z[i]. Montrer que z appartient au groupe Z[i]∗ des unités de
Z[i] si et seulement si |z| = 1.
4. Déterminer le groupe Z[i]∗ .
5. Montrer que pour tout z élément de C, il existe un élément z0 de Z[i] tel que
|z − z0 |2 ≤ 21 .
6. Prouver que pour tous z0 et z1 éléments de Z[i] avec z1 6= 0, il existe des éléments
a0 et a1 de Z[i] tels que z0 = a0 z1 + a1 avec |a1 | < |z1 |.
7. Montrer que Z[i] est un anneau principal.
√
Exercice 12. L’objet de cet exercice est de prouver que Z[ 10] n’est pas un anneau
principal.
1. Prouver que l’équation 10 y 2 = x2 n’a pas de solution (x, y) dans Z2 à part
x = y = 0.
2. Déterminer l’ensemble des carrés modulo 10 : un élément y de Z/10Z est un carré
modulo 10 s’il existe un élément x de Z/10Z tel que y = x2 .
3. Prouver qu’il n’existe pas de couple (x, y) dans Z2 tel que 10y 2 = x2 + 3 ou
10y 2 = x2 − 3.
√
4. Soit v = 10 tel que v 2 = 10 et A l’ensemble des x + yv pour x et y éléments de
Z. Prouver que A est un sous-anneau de K et que pour tout élément a de √ A, les
entiers x et y tels que a = x + yv sont uniques. On note souvent A = Z[ 10].
5. Soit c : A → A définie par c(x + yv) = x − yv, pour tous x et y entiers. Montrer
que c est un endomorphisme d’anneau et que les seuls points fixes de c sont les
éléments de Z.
6. Expliciter ac(a) en fonction des coordonnées (x, y) de a = x + yv. En déduire
qu’il n’existe pas d’élément a de A tel que |ac(a)| = 3.
7. Soit n : A → A définie par n(a) = ac(a). Montrer que n est à valeurs dans Z et
vérifie les propriétés suivantes : pour tous a et b éléments de A, n(ab) = n(a)n(b) ;
pour tout a élément de A, n(a) = 0 si et seulement si a = 0.
8. Soit I l’ensemble des 3a + (2 + v)b pour a et b éléments de A. Montrer que I est
un idéal de A contenant 3 et 2 + v et déduire de ce qui précède que cet idéal n’est
pas principal.
√
Exercice 13. On considère l’anneau Z[ −5]. Vérifier que
√ √
(2 + i −5)(2 − i −5) = 3.3 = 9.
√
En déduire que Z[ −5] n’est pas principal.
45
2.3 QCM
rapporte 2 points.
Question 1. Soit (O, N , s) un triplet naturel.

A (s(O), N , s) est un triplet naturel.
B (O, N \ {O}, s) est un triplet naturel.
C (s(O), s(N ), s ◦ s) est un triplet naturel.
D (s(O), N \ {O}, s) est un triplet naturel.
E (s(O), s(N ), s) est un triplet naturel.
Question 2. Soit H(n) un énoncé dépendant de l’entier n. L’assertion entraîne que

H(n) est vraie
pour tout n > 1.
A H(1) ∧ ∀n > 1 , H(n) =⇒ H(n + 1) .

B H(1) ∧ ∀n > 1 , H(n) =⇒ H(n + 2) .

C H(1) ∧ ∀n > 2 , H(n) =⇒ H(n + 1) .

D H(1) ∧ ∀n > 1 , H(n + 1) =⇒ H(n) .

E H(1) ∧ ∀n > 1 , H(n) =⇒ H(2n) ∧ ∀n > 4 , H(n) =⇒ H(n − 1) .
Question 3.
A Toute partie non vide de Z admet un plus petit élément.
B Toute partie non vide et majorée de N admet un plus grand élément.
C Toute partie non vide et majorée de Q admet un plus grand élément.
D L’ensemble des minorants d’une partie non vide de R+ admet un plus grand
élément.
E Toute partie non vide et minorée de R admet un plus petit élément.
Question 4.
A Si un nombre entier est multiple de 16, alors son écriture en base 8 se termine
par deux zéros.
B Si l’écriture d’un nombre en base hexadécimale se termine par deux zéros, ce
nombre est une puissance de deux.
C Si un nombre s’écrit avec deux lettres en base hexadécimale, il est au moins
égal à 170.
D Si l’écriture d’un nombre en base hexadécimale ne comporte que des 8 et des
zéros, alors ce nombre est mutiple de 16.
46
E Si l’écriture d’un nombre en base hexadécimale se comporte que des A, et des

zéros, alors ce nombre est multiple de 10.
5. Soit x un réel.
Question √ √
A Si x est irrationnel, alors 4 x est irrationnel.
√ √
B Si x est rationnel, alors 3 x est irrationnel.
√ √
C Si x est irrationnel, alors 3x est irrationnel.
√
D Si x est rationnel, alors x3 est rationnel.
√ √
E Si 4 x est irrationnel, alors 3 x est irrationnel.

A Si I est non vide, alors il contient au moins un rationnel.
B Si I contient au moins deux réels distincts, alors il contient au moins deux
irrationnels.
C Si I contient un rationnel et un irrationnel, alors il contient un nombre décimal.
D Si I contient un nombre rationnel, alors il contient un nombre décimal.
E Si I contient un multiple entier d’une puissance négative de 2, alors il contient
un irrationnel.
Question 7. Soit (xn )n∈N une suite de rationnels.

A Si (xn ) est une suite de Cauchy, alors (xn ) converge dans Q.
B Si (xn ) est bornée, alors (xn ) est une suite de Cauchy.
C Si (xn ) est une suite de Cauchy, alors (xn ) converge dans R.
D Si (xn ) converge dans Q, alors (xn ) est bornée.
E Si (xn ) converge dans R, alors (xn ) converge dans Q.

A |x − y| 6 |x| + |y|.
B |x| − |y| 6 |x − y|.
C |x − y| 6 |x| − |y| .

D |x + y| < |x| + |y|.

E |x + y| < |x − y| + 2|y|.
Question 9. Soit x ∈ R+ \ N un réel positif non entier.

A b−xc = −bxc.
B b1 − xc = −bxc.
C x + D(x) = bxc.
D D(2 − x) = 2 − D(x).
E D(−x) = 1 − D(x).
Question 10.
A Q est un corps archimédien.
47
√
B Tout corps archimédien contient Q[ 2].
C Tout corps archimédien complet est isomorphe à R.
D Dans un corps archimédien, toute partie non vide et majorée possède une borne
supérieure.
E Tout corps totalement ordonné est archimédien.
Réponses : 1–DE 2–AE 3–BD 4–CE 5–AD 6–BC 7–CD 8–AB 9–BE 10–AC
2.4 Devoir
répondu.
1. Énoncer la définition d’un triplet naturel.
2. Démontrer que si (O1 , N1 , s1 ) et (O2 , N2 , s2 ) sont deux triplets naturels, il existe
une unique application bijective f12 : N1 → N2 telle que :
f12 (O1 ) = O2 et f12 ◦ s1 = s2 ◦ f12 .
3. Énoncer la définition de la relation 6 sur N.

4. Démontrer que 6 est une relation d’ordre sur N.
5. Démontrer que toute partie non vide de N possède un plus petit élément.
6. Démontrer que N n’admet pas de plus grand élément.
7. Démontrer que toute partie non vide et majorée de N possède un plus grand
élément.
Exercice 1 : On appelle ensemble naturel le couple formé d’un ensemble non vide N
et d’une relation d’ordre ≺ sur N , qui vérifie les trois propriétés suivantes.
• (O1 ) toute partie non vide de N possède un plus petit élément ;
• (O2 ) toute partie non vide et majorée de N possède un plus grand élément ;
• (O3 ) l’ensemble N n’admet pas de plus grand élément.
Nous avons montré que (N, 6) est un ensemble naturel : la définition n’est donc pas
vide. Dans ce qui suit, (N , ≺) désigne un ensemble naturel quelconque.
1. Montrer que (N , ≺) possède un plus petit élément. On le notera O.
2. Montrer que (N , ≺) est totalement ordonné.
3. Soit a ∈ N , on appelle successeur de a un élément b ∈ N qui vérifie a ≺ b,
a 6= b et tel qu’il n’existe aucun élément n ∈ N distinct de a et de b qui vérifie
a ≺ n ≺ b. Montrer que tout élément a de N possède un unique successeur. On
le note s(a).
48
4. On considère l’application s qui à a associe s(a). Montrer que s est une application
strictement croissante
5. Montrer que s est une bijection de N sur N \ {O}.
6. Soit A une partie de N telle que :
i) O ∈ A
ii) s(A) ⊂ A.
Montrer que A = N .
7. En déduire que (O, N , s) est un triplet naturel.
Exercice 2 : On suppose connue une définition de l’ensemble R des nombres réels,
indépendante des autres ensembles de nombres. Le but de l’exercice est d’en déduire
une définition de l’ensemble des entiers. On appelle partie inductive de R tout sous-
ensemble U de R contenant 0 et tel que :
∀u ∈ R , (u ∈ U ) =⇒ ((u + 1) ∈ U ) .
1. Montrer que R+ est une partie inductive de R.

2. Soit K un sous-anneau de R. Montrer que K est une partie inductive de R.
\
3. Soit {Ui , i ∈ I} une famille de parties inductives de R. Montrer que Ui est
i∈I
une partie inductive de R.
4. On note N l’intersection de toutes les parties inductives de R, et s l’application
de R dans R qui à x associe x + 1. Montrer que s(N ) = N \ {0}.
5. Soit A une partie de N telle que 0 ∈ A et s(A) ⊂ A. Montrer que A = N .
6. En déduire que (0, N , s) est un triplet naturel.

1. On appelle triplet naturel un triplet (O, N , s), où N est un ensemble, O un
élément de N et s une application de N dans N qui vérifie les trois axiomes de
Peano :
(P1 ) s est injective,
(P2 ) s(N ) = N \ {O},
(P3 ) Si A est une partie de N telle que si O ∈ A et s(A) ⊂ A alors A = N .
2. L’application f12 est définie pour O1 , puisque f12 (O1 ) = O2 . Si elle est définie
pour x ∈ N1 , alors elle est définie pour s1 (x) par f12 (s1 (x)) = s2 (f12 (x)). D’après
l’axiome de récurrence, f12 est donc définie pour tout x ∈ N1 . De même, en
permutant les indices 1 et 2, on définit f21 sur N2 par f21 (O2 ) = O1 et f21 (s2 (y)) =
49
s1 (f21 (y)). Considérons sur N1 la propriété f21 (f12 (x)) = x. Elle est vraie pour
x = O1 . Supposons qu’elle soit vraie pour x, alors :
f21 (f12 (s1 (x))) = f21 (s2 (f12 (x))) = s1 (f21 (f12 (x))) = s1 (x) .
Par l’axiome de récurrence, la propriété est vraie pour tout x : les applications
f12 et f21 sont réciproques l’une de l’autre et elles sont donc bijectives.
3. La relation 6 est définie à partir de l’addition par :

2
∀(a, b) ∈ N , (a 6 b) ⇐⇒ ∃c ∈ N , b = a + c .
4. La relation 6 est :
– réflexive car pour tout a ∈ N, a + 0 = a, donc a 6 a.
– antisymétrique car si a 6 b et b 6 a, alors il existe c, d ∈ N tels que b = a + c
et a = b + d. Par conséquent b = (b + d) + c et puisque + est associative et
que tout élément est régulier pour +, on en déduit d + c = 0, ce qui entraîne
c = d = 0 (propriété de l’addition), soit a = b.
– transitive car si a 6 b et b 6 c, alors il existe d, e ∈ N tels que b = a + d et
c = b + e. Par conséquent c = (a + d) + e = a + (d + e) car + est associative,
donc a 6 c.
5. Pour tout a ∈ N, 0 + a = a : il s’ensuit que 0 6 a, donc 0 est le plus petit élément
de N. Soit A une partie non vide de N. Si A contient 0, alors 0 est le plus petit
élément de A. Sinon, notons B l’ensemble des minorants de A n’appartenant pas
àA:
B = { b ∈ N \ A , b 6 a , ∀a ∈ A } .
L’ensemble B contient 0. D’après l’axiome de récurrence, si pour tout b ∈ B, s(b)
appartenait à B, alors B serait égal à N et A serait vide, ce qui est exclu. Donc
il existe b ∈ B tel que s(b) ∈ A. Nous allons vérifier que ∀a ∈ A, s(b) 6 a, ce qui
entraîne que s(b) est le plus petit élément de A. Soit a un élément quelconque
de A. Par définition de B, b 6 a, donc il existe c ∈ N tel que a = b + c. Or
c 6= 0 car b ∈/ A, donc b 6= a. Donc il existe d tel que c = s(d) = d + 1. Donc
a = b + (d + 1) = (b + 1) + d = s(b) + d, soit s(b) 6 a.
6. Supposons que N possède un plus grand élément N . Alors s(N ) = N + 1 vérifie
N 6 s(N ), par définition de la relation d’ordre, et comme N est le plus grand
élément de N, s(N ) 6 N et donc N = s(N ), c’est-à-dire N = N + 1 et par
régularité de N pour l’addition 0 = 1 = s(0), ce qui est faux car s est injective.
7. Soit A une partie non vide, majorée de N. Si b est un majorant de A, alors pour
tout a ∈ A, il existe c ∈ N tel que b = a + c, donc s(b) = a + (c + 1) : s(b) est aussi
un majorant de A. Par l’axiome de récurrence, l’ensemble des majorants de A,
contient {b+c , c ∈ N}. Or cet ensemble n’est pas majoré, car N ne l’est pas, donc
50
il ne peut pas être inclus dans A : il existe un majorant de A qui n’appartient

pas à A. Notons B l’ensemble des majorants de A n’appartenant pas à A :
B = { b ∈ N \ A , a 6 b , ∀a ∈ A } .
Puisque cet ensemble est non vide, il possède un plus petit élément : notons-le b.
Le plus petit élément de B est non nul, car A est non vide. Il existe donc c tel que
b = s(c). Nous devons montrer que c est le plus grand élément de A, c’est-à-dire
que c’est un majorant, et qu’il appartient à A. Puisque s(c) ∈ B, a 6 s(c) et
a 6= s(c) pour tout a ∈ A. Si a ∈ A, il existe donc d ∈ N∗ tel que s(c) = a + d,
avec d = s(e) = e + 1 et par conséquent, grâce à l’associativité de l’addition,
c + 1 = a + (e + 1) = (a + e) + 1 et, par régularité de 1 pour +, c = a + e, soit
a 6 c. Mais alors c ∈ A car sinon il serait dans B ce qui contredirait la définition
de b comme plus petit élément de B, puisque b = s(c).
Exercice 1 :
1. N est non vide, donc il possède un plus petit élément d’après (O1 ).
2. Pour tout (a, b) ∈ N , l’ensemble {a, b} possède un plus petit élément, d’après
(O1 ). Donc a ≺ b ou b ≺ a : l’ordre ≺ est total.
3. Considérons l’ensemble A des majorants stricts de a :
A = { b ∈ N \ {a} , a ≺ b } .
Si A était vide, puisque l’ordre ≺ est total, a serait un majorant de N , ce qui

est impossible d’après (O3 ). Donc A est non vide, et admet un plus petit élément
d’après (O1 ). Notons-le b. Par construction, a ≺ b et a 6= b. Soit n ∈ N tel que
a ≺ n ≺ b et n 6= a. Alors n ∈ A et donc b ≺ n puisque b est le plus petit élément
de A. Donc n = b. Reste à montrer l’unicité. Soient b1 et b2 deux éléments de N
qui répondent à la définition : il n’existe aucun n ∈ N tel que a ≺ n ≺ b1 avec
n 6= a et n 6= b1 . Puisque a ≺ b2 et a 6= b2 , cela entraîne que b1 ≺ b2 (car l’ordre
est total). Par symétrie, b2 ≺ b1 , donc b1 = b2 .
4. Supposons a ≺ b et a 6= b. Alors s(a) ≺ b car s(a) est le plus petit des majorants
stricts de a. Or b 6 s(b) par définition de s, donc s(a) ≺ s(b) car ≺ est transitive.
Si s(b) était égal à s(a), alors on aurait a ≺ b ≺ s(a) avec a 6= b et b 6= s(a), ce
qui est exclu. Donc s(b) 6= s(a) : s est strictement croissante.
5. Comme s est strictement croissante, elle est injective, et il suffit de montrer que
s(N ) = N \ {O}. Commençons par vérifier que O n’est le successeur d’aucun
élément de N . Soit a tel que s(a) = O. Alors a ≺ O par définition de s, donc
a = O car O est le plus petit élément de N . Ceci contredit la définition de s.
Nous devons maintenant montrer que pour tout élément a de N différent de O,
il existe b ∈ N , tel que a = s(b). Considérons pour cela l’ensemble des minorants
stricts de a :
B = { b ∈ N \ {a} , b ≺ a } .
51
Puisque a 6= O, B contient O. C’est donc un sous-ensemble non vide de N ,

majoré par a. Par (O2 ), il possède un plus grand élément. Notons-le b. Nous
devons prouver que s(b) = a. Par construction, b ≺ a et b 6= a. Soit n tel que
b ≺ n ≺ a avec n 6= a. Par définition n ∈ B, donc n ≺ b car b est le plus grand
élément de B. Donc n = b. Par définition de s, s(b) = a.
6. Notons B le complémentaire de A, et supposons B non vide. D’après (O1 ), B
possède un plus petit élément. Notons-le b. Nécessairement b 6= O car O ∈ A.
Donc il existe a ∈ N tel que b = s(a). Par définition de s, a 6= b et a ≺ b. Puisque
b est le plus petit élément de B, a ∈ / B, donc a ∈ A. Mais l’hypothèse entraîne
que s(a) ∈ A, ce qui contredit la définition de b. Donc B est vide et A = N .
7. Nous avons montré que s est injective à la question 4, que s(N ) = N \ {0} à
la question 5, et que l’axiome de récurrence est vérifié à la question 6. Le triplet
(O, N , s) vérifie les 3 axiomes de Peano, c’est donc un triplet naturel.
Exercice 2 :
1. En supposant que R a été défini, et muni de sa relation d’ordre total 6 compatible
avec l’addition, alors 0 (élément neutre pour l’addition) est inférieur ou égal à 1
(élément neutre pour la multiplication). Donc pour tout x ∈ R+ ,
06x=x+06x+1,
donc R+ est une partie inductive.
2. Si K est un sous-anneau de R, il contient les éléments neutres pour l’addition
et la multiplication, 0 et 1. Pour tout x ∈ K, x + 1 ∈ K, car K est stable pour
l’addition : K est une partie inductive.
3. Si x appartient à chacun des Ui , alors x + 1 appartient à chacun des Ui , donc à
leur intersection.
4. Par définition, si U est une partie inductive de R, alors s(U ) ⊂ U . En particulier,
s(N ) ⊂ N puisque l’intersection de toutes les parties inductives est une partie
inductive d’après la question précédente. Si s(N ) contenait 0, ce serait une partie
inductive, donc s(N ) serait égal à N d’après la définition de N . Dans ce cas, N
contiendrait le sous-anneau de R engendré par 0 et 1. Mais d’après les questions 1,
2 et 3, l’intersection de ce sous-anneau avec R+ est encore une partie inductive, qui
contient donc N : c’est une contradiction. Donc s(N ) ⊂ N \{0}. Réciproquement,
soit x ∈ N \ {0} tel que x ∈ / s(N ). Alors N \ {x} contient 0 et s(N \ {x}) ⊂
N \ {x} : c’est une partie inductive strictement incluse dans N , ce qui contredit
la définition de N . Donc s(N ) = N \ {0}.
5. Si 0 ∈ A et s(A) ⊂ A, alors A est une partie inductive, donc N ⊂ A, par
définition de N . Si de plus A ⊂ N , alors A = N .
6. L’application s est injective (régularité de l’addition dans R), s(N ) = N \ {0}
(question 4) et l’axiome de récurrence est vérifié (question 5). Le triplet (0, N , s)
vérifie les 3 axiomes de Peano, c’est donc un triplet naturel.
52
3 Compléments
3.1 Every Texan kills a Texan
« Aucune découverte scientifique ne porte le nom de son inventeur ». Tel est l’énoncé
de la « Loi de Stigler ». . . qui n’a pas été découverte par Stigler ! Les axiomes de Peano
ne font pas exception à la règle. Peano n’a d’ailleurs jamais prétendu être le premier :
voici ce qu’on lit dans la préface de « Arithmetices Principia nova methodo exposita »,
daté de 1889.
In arithmeticae demonstrationibus usus sum libro : H. Grassmann, Lehr-
buch der Arithmetik, Berlin 1861.
Utilius quoque niibi fuit recens scriptum : R. Dedekind, Was sind und
was sollen die Zahlen ; Braunschweig, 1888, in quo quaestiones, quae ad
numerorum fundamenta pertinent, acute examinantur.
Effectivement Grassmann, près de trente ans auparavant, donnait déjà essentiellement
la caractérisation moderne de l’ensemble des entiers, ainsi qu’une définition inductive de
l’addition de de la multiplication. Mais il ne posait pas en axiome le fait que le premier
entier ne soit le successeur d’aucun autre, ni le fait que deux nombres ne puissent avoir
le même successeur, ce qui était considéré comme allant de soi 1 . La définition de N que
nous vous avons donnée est bien, à quelques détails près, celle de Dedekind, dans « Que
sont les nombres et que signifient-ils ». Voici comment il en décrivait l’idée, quelques
années auparavant.
Je vois l’ensemble de l’arithmétique comme une conséquence nécessaire, ou
au moins naturelle du plus simple des actes arithmétiques, celui de compter,
et compter n’est rien d’autre que la création successive de la suite infinie des
nombres entiers positifs dans laquelle chaque individu est défini en termes
de celui qui le précède.
Dans une lettre de février 1890, il va plus loin.
Parlant de l’arithmétique (algèbre, analyse) comme d’une partie de la lo-
gique, je veux dire que je considère le concept de nombre comme entièrement
indépendant de notions ou d’intuitions d’espace et de temps, et que je le
considère comme un résultat immédiat des lois de la pensée.
Quelque temps avant Dedekind, de l’autre côté de l’Atlantique, un philosophe avait lui
aussi réflechi aux fondements de la notion de nombre : Charles Sanders Peirce (1839–
1914) 2 . Son article se termine par l’énoncé selon lequel une application injective d’un
ensemble sur lui-même est bijective. Son illustration est plutôt vigoureuse.
From this we deduce the validity of the following mode of inference :
1. Hao Wang : The axiomatization of arithmetics, The Journal of Symbolic Logic, (22)2, p. 145–158
(1957)
2. C.S. Peirce : On the Logic of Number, American Journal of Mathematics, 4(1), pp. 85–95, 1881
53
Every Texan kills a Texan,

Nobody is killed by but one person,
Hence, every Texan is killed by a Texan,
supposing Texans to be a finite lot. For, by the first premise, every Texan
killed by a Texan is a Texan killer of a Texan. By the second premise,
the Texans killed by Texans are as many as the Texans killers of Texans.
Whence we conclude that every Texan killer of a Texan is a Texan killed
by a Texan, or, by the first premise, every Texan is killed by a Texan. This
mode of reasoning is frequent in the theory of numbers.
Peirce n’était pas texan, et n’est pas mort assassiné, même si son caractère difficile et
ses opinions peu orthodoxes ne lui valaient pas que des amis. Notez qu’il ne se prononce
pas sur la valeur de vérité de ses propositions.
3.2 Les démons de Cantor

Nous sommes en 1871, la grande vague de rigueur mathématique, initialisée par
Cauchy, et puissamment portée par l’École de Berlin, Weierstrass en tête, trouve en
Georg Cantor (1845–1918) un zélateur scrupuleux. Pour Cantor, il n’est pas question
de démontrer l’unicité du développement en série trigonométrique sans avoir défini
auparavant ce qu’est une « grandeur numérique ». Voici comment il commence son
article 3 .
Les nombres rationnels servent de fondement pour arriver à la notion plus
étendue d’une grandeur numérique ; je les désignerai sous le nom de système
A, en y comprenant zéro.
On rencontre une première généralisation de la notion de grandeur numé-
rique dans le cas où on a, obtenue par une loi, une série infinie de nombres
rationnels :
a1 , a 2 , . . . , a n , . . . , (1)
constituée de telle sorte que la différence an+m −an devient infiniment petite
à mesure que n croît, quel que soit le nombre positif m, ou, en d’autres
termes, qu’avec ε (positif rationnel) pris arbitrairement on a un nombre
entier n, tel que (an+m − an ) < ε, si n > n1 , et si m est un nombre entier
positif pris à volonté.
J’exprime ainsi cette propriété de la série (1) : « La série (1) a une limite
déterminée b ».
Ces mots ne servent donc qu’à énoncer cette propriété de la série, sans
exprimer d’abord autre chose, et de même que nous lions la série (1) avec
un signe particulier b, de même on doit aussi attacher différents signes b, b0 ,
b00 à diverses séries de même espèce.
3. G. Cantor, Extension d’un théoréme de la théorie des séries trigonométriques, traduction d’un
article paru aux Annales Mathématiques de Leipzich, Acta Mathematica 2(1), pp. 336–348 (1883)
54
Eh bien oui, Cantor construit les réels par les classes d’équivalence des suites de Cauchy
de rationnels, comme vous l’avez vu dans ce chapitre. Mais il ne s’arrête pas en si
bon chemin. Il définit par récurrence des systèmes de nombres d’ordre k en itérant le
procédé, pour plus tard les identifier par un axiome aux points de la droite géométrique.
Il exprime tout de même quelques scrupules par rapport au sujet de son article.
Dans une autre circonstance je reviendrai avec plus de détail sur tous ces
rapports. Ce n’est pas non plus ici le lieu d’expliquer comment les conven-
tions et les opérations dont j’ai parlé dans ce paragraphe peuvent servir à
l’analyse infinitésimale. Dans ce qui suit, en exposant le rapport des gran-
deurs numériques avec la géométrie de la ligne droite, je me bornerai presque
exclusivement aux théorèmes nécessaires, d’où l’on peut, si je ne me trompe,
déduire le reste au moyen d’une démonstration purement logique.
Ce seront encore les séries trigonométriques, et plus précisément leurs discontinuités,
qui l’amèneront à travailler sur les ensembles infinis, en commençant par donner un fon-
dement rigoureux à la notion d’ensemble. Sa réflexion sur les cardinaux infinis l’amène
à se demander s’il est si évident que cela qu’il y a plus de points dans un carré que
dans un segment. Voici ce qu’il écrit à son ami Dedekind, le 5 janvier 1874.
Est-ce qu’une surface (disons un carré incluant sa frontière) peut être ra-
menée de façon unique à une ligne (disons un segment de droite incluant
les extrémités) de sorte que pour chaque point sur la surface il y ait un
point correspondant sur la ligne et, réciproquement, pour chaque point sur
la ligne il y ait un point correspondant sur la surface ? Je crois qu’il ne
sera pas facile de répondre à cette question, malgré le fait que la réponse
semble si clairement être « non » qu’une démonstration apparaisse presque
superflue.
Quand il finit par répondre « oui » en 1877, il dit « Je le vois, mais je ne le crois pas ».
Ce résultat étonnant suscita le scepticisme de beaucoup de ses collègues, en particulier
Kronecker. Cantor était douloureusement conscient de l’opposition que ses travaux, en
particulier sur la théorie des ensembles et les cardinaux transfinis, suscitaient.
Je réalise qu’en entreprenant cela, je me place dans une certaine opposition
par rapport aux vues largement répandues sur l’infini mathématique, et
aux opinions fréquemment défendues sur la nature des nombres.
Querelles avec Kronecker, Mittag-Leffler et les autres ? Problèmes psychologiques liés
à son enfance ? À partir de 1884, Cantor connaît le premier d’une série d’épisodes de
dépression qui ne lui laissèrent que peu de répit jusqu’à son décès. Ses efforts pour
démontrer que Francis Bacon est le véritable auteur des pièces de Shakespeare ont été
moins reconnus par la postérité que sa théorie des ensembles que Hilbert considérait
comme « le plus beau produit du génie mathématique, et une des réalisations suprêmes
de l’activité humaine purement intellectuelle ».
55
3.3 Pourquoi pas douze ?

L’Encyclopedia Londinensis, publiée à Londres dans les premières décennies du
xixe siècle, vaut souvent son pesant de prégugés racistes, comme la plupart des écrits
européens de son temps. Voici ce qu’on y lit, à l’article « Numbers » 4 .
We are told that the Guaranis and the Lulos, two of the very lowest races of
savages which inhabit the boundless forests of South America, count only
by fours ; at least, they express five by four-and-one, six by four-and-two,
and so forth. We may gather from Aristotle, that a certain tribe of Thra-
cians were accustomed to use the quaternary scale of numeration ; for he
says that they proceeded no farther than four, which they would doubtless
continue to repeat. If such was the historical fact, those simple people must
have never advanced beyond the early practice of reckoning successively by
casts or warps. It seems probable that Pythagoras was acquainted with the
quaternary system, which he brought from Egypt and India. Hence perhaps
the mystical veneration which the followers of that philosopher professed
to entertain for the tetractys, or quaternion, the root of the scale, which
contains besides, within itself, the number denoting the elementary musical
proportions. Near the end of the seventeenth century, Weigelius seriously
proposed, in Germany, the adoption of the tetraetic or quaternary nume-
ration, which he explained, with copious detail, in a learned work, entitled
Aretologistica, printed at Nuremberg in 1687. This writer even goes so far
as to invent names for the several orders of his Tetractic system. They will
appear to have a sufficiently German air, though not harsher than the terms
we now use.
[. . . ]
Mr. Barlow and Mr. Lessie have scarcely noticed the octary scale of num-
bers ; but this system has been revived or rather newly-modelled, by a Mr
Richardson, of Churchill in Somersetshire ; an ingenious gentleman who, we
are sorry to say, has been for many years totally blind. The title of his pam-
phlet, which lies before us, is “Octary Arithmetic, or the Art of Doubling
and Halving by the Cypher ; containing a perfect system of measure and
weight, with specimens of the new logarithms” (Lond. 1817).
[. . . ]
Mr. Richardson’s idea is original and bold ; but his style is obscure, and
the new names and phrases that he introduces are not very harmonious.
Moreover, the complete revolution which the introduction (or indeed of any
other) would make in all books, rules, weights, measures, and systems of
education, makes us less sanguine than the author as to its ultimate success.
Des “ingenious gentlemen”, peu avares de propositions originales et hardies, il n’en a
jamais manqué pour prôner l’adoption généralisée d’autres bases que la base 10 à la fois
4. J. Wilkes : Encyclopedia Londinensis, Vol. xvii, London, 1820
56
pour l’arithmétique, pour les mesures et pour les monnaies. Il faut dire que selon les
domaines, certains comptes se sont toujours faits tantôt en base 60 (heures, minutes et
secondes ou bien mesures angulaires), tantôt en base 12 (œufs, huîtres, . . . ). Jusqu’au
“Decimal Day” (15 février 1971), une livre britannique se composait de 20 shillings,
eux-mêmes divisés en 12 pence. Il y a toujours 12 inches dans un foot et 3 feet dans
un yard. Pour nous qui sommes habitués à la simplicité du système métrique, il est
difficile d’imaginer le casse-tête pour convertir des inches cubiques en yards cubiques.
Pour autant, des tentatives pour imposer le système métrique en Grande-Bretagne ou
aux États-Unis échouent régulièrement.
Ce système, basé sur une division en puissances de dix de toutes les unités de mesure,
a été créé sous la Révolution. Son acte fondateur est un « Rapport fait à l’Académie
des Sciences le 27 octobre 1790 sur le titre des métaux monnayés & sur l’échelle de
division des poids, des mesures et des monnaies, par MM. Borda, Lagrange, Lavoisier,
Tillet & Condorcet ». Voici ce qu’on y lit.
L’adoption de l’échelle arithmétique pour toutes les divisions, diminuera
beaucoup les embarras qui doivent naître de l’établissement des nouvelles
mesures, & tous ceux qui sauront l’arithmétique simple, pourront en cal-
culer toutes les divisions, tandis que ceux qui savent calculer les anciennes
n’éprouveront aucun embarras, puisqu’ils pourront calculer les nouvelles
avec encore plus de facilité.
On aurait pu proposer de changer aussi l’échelle arithmétique, & de prendre
l’échelle duocécimale, c’est-à -dire, celle qui emploie onze chiffres, & qui suit
la progression des puissances de douze ; mais ce changement ajouté à tous
les autres, en ôtant à ceux qui ne sont pas accoutumés au calcul, une base à
laquelle ils puissent entendre les changements & s’y conformer, en rendroit
le succès presqu’impossible. Ajoutons que non-seulement il faudroit deux
chiffres nouveaux, mais que l’arithmétique parlée a pour base l’arithmétique
décimale, ce qui obligeroit à la changer encore, de manière que les effets de
tous ces changements réunis, incommodes aux personnes les plus habituées
à réfléchir, seroient insupportables à toutes les autres.
Nous conclurons donc que l’échelle décimale doit servir de base à toutes
les divisions, & que même le succès de l’opération générale sur les poids &
mesures tient en grande partie à l’adoption de cette échelle.
Cette décision de bon sens n’alla pas semble-t-il sans quelques débats houleux, les par-
tisants de la base 12 et du changement radical étant nombreux et passionnés. Quatre
ans plus tard, quand Pierre-Simon de Laplace (1749–1827) inaugure ses leçons de Ma-
thématiques à l’École Normale par un cours d’arithmétique, on y sent pointer quelques
regrets.
Vous concevez, par les principes métaphysiques sur lesquels est fondé notre
système de numération, que rien n’obligeait de s’en tenir à dix caractères ;
on pouvait en employer plus ou moins.
57
Il paraît très probable que le nombre des doigts est ce qui a déterminé
l’arithmétique décimale. Les hommes primitivement ont compté par leurs
doigts jusqu’à dix ; mais de ce que cette arithmétique était bonne dans
l’enfance des sociétés, est-elle maintenant la meilleure ? C’est ce que nous
allons examiner. [. . . ] De tous les systèmes de numération, le meilleur est
celui qui, n’employant pas un trop grand nombre de caractères, renferme
dans son échelle, le plus grand nombre de diviseurs ; et, à cet égard, le
système duodécimal me paraît mériter la préférence. Il eût suffi d’ajouter
deux caractères aux nôtres ; on aurait eu l’avantage d’exprimer le tiers et
le quart de l’unité principale, au moyen des divisions de ce système, ce qui
eût été très-commode. C’est pour cela que les divisions de presque toutes
nos mesures sont duodécimales ; ainsi le pied se divise en douze pouces, le
pouce en douze lignes, etc.
La commission des poids et mesures a balancé les avantages qu’offre le
système duodécimal, avec l’inconvénient de changer totalement, et l’arith-
métique écrite, et l’arithmétique parlée, et nos livres et nos tables formées
sur le système décimal. Elle a craint qu’en proposant le système duodécimal,
les obstacles qu’éprouverait l’introduction de ce système, ne se joignissent
à ceux que présenterait déjà l’institution du nouveau système de poids et
mesures. Elle a donc jugé à propos de conserver l’arithmétique décimale.
Il avait apparemment fallu toute l’autorité du « plus illustre géomètre du temps »,
Joseph-Louis Lagrange (1746–1813) pour emporter la décision. Jean-Baptiste Delambre
(1749–1822), qui avait durement payé de sa personne en triangulant un arc de méridien
depuis Barcelone pour établir la valeur du mètre, se souvient bien des années plus tard
de ces débats passionnés 5 .
La Révolution offrit aux savants l’occasion d’une grande et difficile innova-
tion : l’établissement d’un système métrique, fondé sur la nature, et par-
faitement analogue à notre échelle de numération. Lagrange fut un des
Commissaires que l’Académie chargea de ce travail ; il en fut un des ardents
promoteurs ; il voulait le système décimal dans toute sa pureté ; il ne par-
donnait pas à Borda l’idée qu’il avait eue de faire exécuter des quarts de
mètre. Il était peu frappé de l’objection que l’on tirait contre ce système du
petit nombre des diviseurs de sa base. Il regrettait presque qu’elle ne fût
pas un nombre premier, tel que 11, qui nécessairement eût donné un même
dénominateur à toutes les fractions. On regardera, si l’on veut, cette idée
comme une de ces exagérations qui échappent aux meilleurs esprits dans
le feu de la dispute ; mais il n’employait ce nombre 11 que pour écarter le
nombre 12, que des novateurs plus intrépides auraient voulu substituer à
celui de 10, qui fait partout la base de la numération.
5. J.B.J. Delambre : Mémoire sur la vie et les ouvrages de M. Le Comte J.-L. Lagrange in Oeuvres
de Lagrange, J.-A. Serret ed., Tome 1, Paris 1867
58
Si le cœur vous en dit, n’hésitez pas à reprendre le flambeau, vous ne serez pas seuls :
www.dozenal.org
3.4 Et après ?
À partir des entiers naturels, nous avons construit les entiers relatifs, puis les ra-
tionnels, les réels, les complexes, chaque nouvel ensemble ainsi construit incluant les
précédents. L’histoire ne s’arrête pas là. Le corps des complexes est en même temps un
espace vectoriel de dimension 2 sur R : on appelle cela une algèbre. Existe-t-il d’autres
algèbres commutatives sur R ? Non ! La réponse a été donnée par Weierstrass en 1863 :
toute algèbre commutative de dimension finie sur R est isomorphe à C. Nous vous
avons proposé en exercice plusieurs constructions du corps des quaternions, qui est à
la fois une algèbre de dimension 4 sur R, et de dimension 2 sur C. La multiplication
des quaternions a beau n’être pas commutative, H n’en est pas moins un corps. En
existe-t-il d’autres ? Non ! La réponse a été donnée par Frobenius en 1877 : toute al-
gèbre de dimension finie sur R est isomorphe à R, C ou H. Cela n’empêche toujours
pas de continuer : les octonions sont un espace vectoriel de dimension 8 sur R, 4 sur
C et 2 sur H. On y définit une « multiplication », qui n’est pas commutative, ni même
associative. Cette multiplication permet les calculs d’inverses, donc la division. On y
étend aussi la notion de module : le produit d’un octonion par son conjugué est un réel
positif, et la racine carrée de ce réel est une norme sur l’espace vectoriel des octonions
O. On appelle cela une « algèbre de division normée ». En existe-t-il d’autres ? Non !
La réponse a été donnée par Hurwitz en 1898 : toute algèbre de division normée sur R
est isomorphe à R, C, H ou O. Alors on arrête là ? Non, toujours pas : les sedenions
sont un espace vectoriel de dimension 16 sur R, 8 sur C, etc. etc.
Ces ensembles de nombres dits hypercomplexes, datent de la première moitié du
xixe siècle. Les quaternions ont une date de naissance précise, le 16 octobre 1843. Sir
William Rowan Hamilton (1805–1865) a donné plusieurs récits de son « étincelle ».
Celui qui figure dans la lettre qu’il écrit à un de ses fils le 15 octobre 1858 est particu-
lièrement émouvant.
If I may be allowed to speak of myself in connexion with the subject, I
might do so in a way which would bring you in, by referring to an ante-
quaternionic time, when you were a mere child, but had caught from me the
conception of a Vector, as represented by a Triplet : and indeed I happen to
be able to put the finger of memory upon the year and month – October,
1843 – when having recently returned from visits to Cork and Parsonstown,
connected with a meeting of the British Association, the desire to discover
the laws of the multiplication referred to regained with me a certain strength
and earnestness, which had for years been dormant, but was then on the
point of being gratified, and was occasionally talked of with you. Every
morning in the early part of the above-cited month, on my coming down
to breakfast, your (then) little brother William Edwin, and yourself, used
59
to ask me, “Well, Papa, can you multiply triplets” ? Whereto I was always
obliged to reply, with a sad shake of the head : “No, I can only add and
subtract them.”
But on the 16th day of the same month – which happened to be a Monday,
and a Council day of the Royal Irish Academy – I was walking in to attend
and preside, and your mother was walking with me, along the Royal Canal,
to which she had perhaps driven ; and although she talked with me now
and then, yet an under-current of thought was going on in my mind, which
gave at last a result, whereof it is not too much to say that I felt at once
the importance. An electric circuit seemed to close ; and a spark flashed
forth, the herald (as I foresaw, immediately) of many long years to come
of definitely directed thought and work, by myself if spared, and at all
events on the part of others, if I should even be allowed to live long enough
distinctly to communicate the discovery. Nor could I resist the impulse
– unphilosophical as it may have been – to cut with a knife on a stone
of Brougham Bridge, as we passed it, the fundamental formula with the
symbols, i, j, k ; namely,
i2 = j2 = k2 = ijk = −1 .
which contains the Solution of the Problem, but of course, as an inscription,

has long since mouldered away. A more durable notice remains, however, on
the Council Books of the Academy for that day (October 16th, 1843), which
records the fact, that I then asked for and obtained leave to read a Paper
on Quaternions, at the First General Meeting of the session : which reading
took place accordingly, on Monday the 13th of the November following.
Les travaux de Hamilton sur la multiplication des vecteurs avaient été inspirés par
ses discussions avec son ami John Thomas Graves (1806–1870), à qui il s’empressa
de faire part de sa découverte. Le 26 décembre 1843, la réponse de Graves contenait
une construction à base de couples de quaternions : les octonions. Deux ans plus tard,
Cayley publiait essentiellement la même contruction, et donnait le moyen de l’étendre
aux dimensions supérieures. Oui, vous avez bien suivi ces compléments, et il n’y a pas
d’erreur de date. Les octonions ont été définis avant les réels, et les réels avant les
entiers. Ainsi vont l’histoire et la pédagogie des mathématiques : il est rare que les
notions aient été découvertes dans l’ordre où elles vous sont présentées.
60
Systèmes linéaires
Bernard Ycart
Si vous savez déjà résoudre un système linéaire par la méthode de Gauss, vous
n’apprendrez pas grand chose de neuf dans ce chapitre. Il est essentiellement technique,
et ne présente aucune difficulté théorique. Il vous préparera aux chapitres suivants
d’algèbre linéaire, et vous devez l’avoir bien assimilé avant de continuer.
Table des matières

1 Cours 1
1.1 Intersection de droites et de plans . . . . . . . . . . . . . . . . . . . . . 1
1.2 Ensemble des solutions . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Transformations équivalentes . . . . . . . . . . . . . . . . . . . . . . . . 5
1.4 Forme échelonnée . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Forme résolue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2 Entraînement 12
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3 Compléments 27
3.1 Les formules de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.2 Tout blanc tout noir . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3 Les Neuf Chapitres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.4 Les grands systèmes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
8 novembre 2011
Maths en Ligne Systèmes linéaires UJF Grenoble
1 Cours
1.1 Intersection de droites et de plans
Une équation linéaire à deux inconnues, du type a1 x + a2 y = b, est l’équation
d’une droite dans le plan. Plus précisément, si a1 , a2 et b sont des réels fixés, tels que
a1 6= 0 ou a2 6= 0, l’ensemble des couples (x, y) vérifiant a1 x + a2 y = b est une droite
affine. Chercher les couples (x, y) qui vérifient plusieurs équations du même type, c’est
chercher les points communs à plusieurs droites affines. Voici trois exemples de systèmes
de 3 équations à 2 inconnues.
  

 x −y = −1 
 x −y = −1 
 x −y = −1
x +y = 1 x +y = 1 2x −2y = −2
−x +y =
  

y = 2 
y = 1 
1
Le premier n’a pas de solution. Le second a une solution unique : la solution de ses
deux premières équations vérifie la troisième. Le troisième système a une infinité de
solutions : ses trois équations sont équivalentes.
La figure 1 donne une interprétation géométrique des trois systèmes. Dans chacun
des trois graphiques, D1 , D2 , D3 sont les droites correspondant aux trois équations
du système. Résoudre un système de m équations à 2 inconnues, c’est déterminer
D3
j D3 j j
O i O i O i
D3
D2
D1 D2 D1 D2 D1
Figure 1 – Interprétations géométriques de 3 systèmes linéaires de 3 équations à 2

inconnues.
l’intersection de m droites dans le plan. Elle peut être vide, réduite à un point, ou
égale à une droite.
Une équation linéaire à trois inconnues x, y, z est l’équation d’un plan dans l’espace.
Voici trois systèmes de deux équations à trois inconnues.
( ( (
x +y +z = 1 x +y +z = 1 x +y +z = 1
−x −y −z = −1 −x −y −z = 1 x −y +z = −1
1
Les deux équations du premier système représentent le même plan. L’ensemble des
solutions du système est ce plan. Dans le second système, les équations sont celles de
deux plans parallèles : leur intersection est vide. Le troisième système est le cas général :
l’intersection des deux plans est une droite. Les trois cas sont illustrés par la figure 2.
P2
P2 P1
P1 P1
P2
Figure 2 – Interprétations géométriques de 3 systèmes linéaires de 2 équations à 3

inconnues.
Un système de 3 équations à 3 inconnues peut avoir une solution unique (l’inter-

section de trois plans « en position générale » est un point de l’espace). Mais il peut
se faire que deux des plans soient parallèles, auquel cas le système n’aura pas de solu-
tion, ou bien que l’un des plans contienne l’intersection des deux autres, auquel cas le
système aura une infinité de solutions.
Un système linéaire de m équations à n inconnues se présente sous la forme suivante.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = b1


.. .. .. ..



. . . .




(S) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = bi

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = bm

Une solution de (S) est un n-uplet de réels qui satisfont à la fois ses m équations.
Résoudre le système (S) c’est décrire l’ensemble des solutions. L’intuition géométrique
des dimensions 2 et 3 reste valable en dimension n : l’ensemble des n-uplets de réels
(x1 , . . . , xn ) qui vérifient une équation du type
ai,1 x1 + . . . + ai,n xn = bi ,
où les ai sont non tous nuls, est un sous-espace affine de dimension n − 1 dans Rn ,
que l’on appelle un hyperplan. Résoudre un système de m équations, c’est décrire
l’intersection de m hyperplans dans Rn . Cette intersection peut être vide, mais si
elle ne l’est pas, c’est un sous-espace affine de Rn . Nous le démontrerons à la section
suivante.
2
1.2 Ensemble des solutions

Nous nous limitons dans ce chapitre au cas réel, mais ce qui suit reste valable sur
C.
Considérons un système (S) de m équations à n inconnues.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = b1


.. .. .. ..



. . . .





 .. .. .. ..
. . . .






Les coefficients ai,j et bi sont des réels donnés. Les variables xi sont les inconnues. Il faut
comprendre (S) comme la conjonction (« et ») de m assertions portant sur les variables
(x1 , . . . , xn ). Une solution est un n-uplet de réels qui vérifie chacune des m équations.
L’ensemble des solutions est un sous-ensemble de Rn . Deux systèmes à n inconnues
sont équivalents si et seulement si leurs ensembles de solutions sont les mêmes.
Par convention, on regroupe les termes contenant les inconnues à gauche de l’égalité,
les termes constants à droite. La partie gauche s’appelle le premier membre, le m-uplet
des constantes à droite de l’égalité est le second membre. On dit d’un système qu’il
est homogène si tous les termes du second membre sont nuls. À un système (S), on
associe le système homogène (H) obtenu en conservant le premier membre de (S) et
en annulant le second membre.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = 0


.. .. .. ..



. . . .




(H) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = 0

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = 0

Nous commençons par l’ensemble des solutions d’un système homogème.

Théorème 1. Soit (H) un système homogène de m équations à n inconnues. L’en-
semble des solutions de (H) est un sous-espace vectoriel de Rn .
Démonstration : Observons que le n-uplet (0, . . . , 0) (vecteur nul de Rn ) est solution.

L’ensemble des solutions de (H) n’est donc jamais vide.
Pour montrer qu’un ensemble non vide est un sous-espace vectoriel de Rn , il suffit
de vérifier qu’il est stable par combinaison linéaire, c’est-à-dire que si deux éléments
appartiennent à l’ensemble, toutes leurs combinaisons linéaires restent dans le même
ensemble. Soient x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ) deux solutions de (H), λ et µ deux
réels quelconques. Nous devons vérifier que λx + µy est solution de (H). Considérons
la i-ième équation, vérifiée à la fois par x et y.
ai,1 x1 + . . . + ai,n xn = 0 et ai,1 y1 + . . . + ai,n yn = 0 .
3
En multipliant la première par λ, la seconde par µ et en ajoutant les deux, on obtient :
λ(ai,1 x1 + . . . + ai,n xn ) + µ(ai,1 x1 + . . . + ai,n xn ) = 0 ,
soit,
ai,1 (λx1 + µy1 ) + . . . + ai,n (λxn + µyn ) = 0 .
Le n-uplet (λx1 + µy1 , . . . , λxn + µyn ) est donc solution de (H).
Tout sous-espace vectoriel de Rn est de dimension finie, au plus égale à n. Soit
E l’espace vectoriel des solutions du système homogène (H). Il se peut que E soit
de dimension 0, si (0, . . . , 0) est la seule solution de (H). Nous verrons plus loin que
la dimension de E est au moins égale à n − m : un système homogène ayant moins
d’équations que d’inconnues a une infinité de solutions. Soit k la dimension de E, et
s1 , . . . , sk k solutions particulières, formant une base de E. Toute solution de (H) s’écrit
de façon unique comme combinaison linéaire de s1 , . . . , sk .
E = { λ1 s 1 + · · · + λk s k , λ 1 , . . . , λ k ∈ R } . (1)
Théorème 2. Soit (S) un système linéaire et (H) le système homogène associé. Notons
S l’ensemble des solutions de (S) et E l’espace vectoriel des solutions de (H). Alors,
• soit S est vide,
• soit S est un espace affine de direction E.
(0)
Démonstration : Supposons S non vide : soit s0 = (x1 , . . . , x(0) n ) une solution parti-
culière de (S). Nous allons démontrer que toute solution de (S) est la somme de s0 et
d’une solution de (H). Soit s = (x1 , . . . , xn ) une solution quelconque de (S). Pour tout
i = 1, . . . , m, les deux solutions satisfont la i-ième équation.
(0)
ai,1 x1 + . . . + ai,n x(0)
n = bi et ai,1 x1 + . . . + ai,n xn = bi .
Si on retranche la première équation de la seconde, on obtient :

(0)
ai,1 (x1 − x1 ) + . . . + ai,n (xn − x(0)
n ) = 0 .
Par conséquent, le n-uplet s − s0 est solution du système homogène associé (H).

Réciproquement, on vérifie de la même façon que tout n-uplet somme de s0 et d’une
solution de (H) est solution de (S).
En joignant le théorème 2 et (1), on peut écrire l’ensemble des solutions de (S)
comme suit.
S = { s 0 + λ1 s 1 + · · · + λk s k , λ 1 , . . . , λ k ∈ R } . (2)
Vous pouvez retenir ce résultat ainsi :
La solution générale d’un système linéaire est la somme
d’une solution particulière
et de la solution générale du système homogène associé.
4
On retrouve ce même principe dans des problèmes très différents : équations de récur-
rence, équations différentielles, etc.
Le reste de ce chapitre est consacré à la méthode du pivot de Gauss qui permet de
calculer explicitement des n uplets s0 , s1 , . . . , sk , tels que s0 soit une solution particulière
de (S) et (s1 , . . . , sk ) soit une base de l’espace vectoriel des solutions de (H).
1.3 Transformations équivalentes

L’idée de la méthode de Gauss est de transformer par étapes, le système à résoudre
en des systèmes plus simples, tous équivalents au système initial, jusqu’à un système
dit « résolu », sur lequel on lit directement la solution. Pour un système linéaire, « plus
simple » signifie « avec moins de termes », ou encore « plus de coefficients nuls » .
Pour annuler des termes, la méthode de Gauss combine les trois transformations de la
proposition suivante.
Proposition 1. Les transformations suivantes changent tout système en un système
équivalent :
1. échanger deux lignes,
2. multiplier une ligne par un réel non nul,
3. ajouter une ligne à une autre ligne.
Démonstration : Le résultat est évident pour la première transformation. Pour la

seconde, si (x1 , . . . , xn ) est solution de (S), contenant l’équation
ai,1 x1 + . . . + ai,n xn = bi , (3)
alors (x1 , . . . , xn ) vérifie encore
λ(ai,1 x1 + . . . + ai,n ) xn = λbi , (4)
pour tout λ. Réciproquement, si λ est non nul il suffit d’appliquer ce qui précède à 1/λ
pour s’assurer que tout n-uplet solution de (4) est aussi solution de (3).
Pour le point 3, considérons les deux lignes
(
ai,1 x1 + . . . + ai,n xn = bi
(5)
ak,1 x1 + . . . + ak,n xn = bk
Elles sont remplacées par

(
ai,1 x1 + . . . +ai,n xn = bi
(6)
(ai,1 + ak,1 ) x1 + . . . +(ai,n + ak,n ) xn = bi + bk
Si un n-uplet (x1 , . . . , xn ) vérifie (5), alors il vérifie aussi (6). Réciproquement, multi-
plions la première équation de (6) par −1 (ce qui ne change pas l’ensemble des solutions
5
d’après le point 2 ), puis ajoutons les deux équations. D’après ce qui précède, toute so-
lution de (6) est aussi solution de (5).
Ici, une mise en garde s’impose. Lorsqu’on remplace une ligne par une combinaison
linéaire des autres, toute solution du système initial est encore solution du nouveau
système. Mais l’ensemble des solutions du nouveau peut être strictement plus grand.
Dans la démonstration ci-dessus, nous avons pris soin de vérifier les réciproques : il est
essentiel que le système transformé soit bien équivalent au système initial.
La méthode de Gauss consiste à appliquer successivement les transformations de
la proposition 1. Dans les deux sections suivantes, nous allons décrire les deux étapes
principales.
1.4 Forme échelonnée

Nous dirons qu’un système est échelonné s’il se présente sous la forme suivante.
p1 y1 + c1,2 y2 + · · · + c1,j yj + · · ·


 + c1,n yn = d1
p2 y2 + · · · + c2,j yj + · · · + c2,n yn = d2




.. ..


 ...
. .




(SE ) pr y r + ··· +cr,n yn = dr



 0 = dr+1
..



.





0 = dm

Mettre un système (S) sous forme échelonnée, c’est passer de (S) à (SE ) par les trans-
formations de la proposition 1, et une permutation éventuelle des coordonnées, de sorte
que
1. les inconnues (y1 , . . . , yn ) de (SE ) sont celles de (S), mais dans un ordre qui peut
être différent,
2. les coefficients p1 , . . . pr sont tous non nuls.
Les coefficients p1 , . . . , pr , que l’on appelle les pivots, jouent un rôle important. Pour
arriver à la forme échelonnée avec des pivots non nuls on peut être amené au cours des
calculs, à
1. permuter des variables
2. permuter des équations (application du point 1 de la proposition 1).
Le principe général consiste à utiliser une équation à pivot non nul pour annuler les
termes au-dessous du pivot dans les équations suivantes du système. Décrire formel-
lement l’algorithme dans le cas général, conduirait à des notations compliquées. Le
mieux est de comprendre son fonctionnement sur des exemples. Dans ce qui suit nous
utilisons la notation algorithmique ←, pour « prend la valeur ». A part les permuta-
tions éventuelles de variables ou d’équations, les seules transformations utilisées sont
6
du type Li ← Li + λLk , soit « la ligne i est remplacée par la somme de la ligne i, et

de la ligne k multipliée par λ ». Cette transformation change le système en un système
équivalent, d’après la proposition 1.
Voici un premier système.
x +2y −z +t =


 1
x +3y +z −t = 2


(S1 )


 −x +y +7z +2t = 3
2x +y −8z +t = 4

⇐⇒
−z +t = 1


 x +2y
L2 ← L2 − L1 y +2z −2t = 1


L3 ← L3 + L1 

 3y +6z +3t = 4
L4 ← L4 − 2L1 −3y −6z −t = 2

⇐⇒
−z +t


 x +2y = 1
y +2z −2t = 1


L3 ← L3 − 3L2 

 +9t = 1
L4 ← L4 + 3L2 −7t = 5

⇐⇒
x +2y +t −z = 1



y −2t +2z = 1


z ←→ t


 9t = 1
−7t = 5

x +2y +t −z =


 1
(S1,E ) y −2t +2z = 1



 9t = 1
L4 ← L4 + 97 L3

0 = 52/9

Voici un deuxième système.
x +y −3z −4t = −1



2x +2y +2z −3t = 2


(S2 )


 3x +6y −2z +t = 8
2x +y +5z +t = 5

⇐⇒
−3z −4t = −1


 x +y
L2 ← L2 − 2L1 8z +5t = 4


L3 ← L3 − 3L1 

 3y +7z +13t = 11
L4 ← L4 − 2L1 −y +11z +9t = 7

7
⇐⇒
x +y −3z −4t −1


 =
L2 ← L4 −y +11z +9t = 7




 3y +7z +13t = 11
L4 ← L2 8z +5t = 4

⇐⇒
x +y −3z −4t −1


 =
−y +11z +9t = 7


L3 ← L3 + 3L2 

 40z +40t = 32
8z +5t = 4

⇐⇒
x +y −3z −4t −1


 =
(S2,E ) −y +11z +9t = 7



 40z +40t = 32
L4 ← L4 − 51 L3

−3t = −12/5

Voici un troisième système.
x −y +z +t


 = 3
5x +2y −z −3t = 5


(S3 ) 

 −3x −4y +3z +2t = 1
6x +y −2t = 8

⇐⇒
x −y


 +z +t = 3
L2 ← L2 − 5L1 7y −6z −8t = −10


L3 ← L3 + 3L1 

 −7y +6z +5t = 10
L4 ← L4 − 6L1 7y −6z −8t = −10

⇐⇒
x −y


 +z +t = 3
+7y −6z −8t = −10


L3 ← L3 + L2 

 −3t = 0
L4 ← L4 − L2 0 = 0

⇐⇒
x −y +t +z =


 3
+7y −8t −6z = −10


(S3,E )


 −3t = 0
0 = 0

Remarquez l’échange de z et t pour respecter la règle des pivots non nuls.

La forme échelonnée n’est pas tout à fait la fin de l’histoire, mais elle donne déjà
beaucoup de renseignements sur l’ensemble des solutions. Le système (SE ) peut contenir
8
deux types d’équations. Celles dont le premier membre est nul, s’il y en a, sont les
équations de compatibilité. Le système ne peut avoir de solution que si leur second
membre est aussi nul.
Nous admettrons le théorème suivant.
Théorème 3. S’il est non vide, l’ensemble des solutions du système échelonné (SE )
est un espace affine de dimension n−r.
Observons que l’entier r est nécessairement inférieur ou égal à m et à n.
r ≤ min{m, n} .
Il ne dépend que de la dimension de l’espace des solutions. D’après le théorème 2, la

dimension de l’espace des solutions ne dépend pas du second membre, mais seulement
du système homogène associé. Ceci justifie la définition générale suivante.
Définition 1. Soit (S) un système de m équations à n inconnues, et (SH ) le système

homogène associé. On appelle rang de (S) l’entier n − d, où d est la dimension de
l’espace vectoriel des solutions de (SH ).
1.5 Forme résolue

Une fois le système mis sous forme échelonnée, s’il y a des équations de compatibilité
et si l’un des seconds membres de ces équations est non nul, le système n’a pas de
solution (on dit qu’il est impossible). C’est le cas par exemple pour le système (S1 ) de
la section précédente.
S’il n’y a pas d’équations de compatibilité ou si leurs seconds membres sont nuls,
le système a des solutions et il faut les calculer. À partir du système échelonné (SH ),
les étapes successives sont les suivantes.
1. supprimer les équations de compatibilité s’il y en a,
2. diviser chacune des équations restantes par son pivot,
3. si r < n, passer les termes en yr+1 , . . . , yn dans le second membre,
4. calculer yr , yr−1 , . . . , y1 , par combinaisons de lignes, en annulant les termes au-
dessus de chaque pivot et en commençant par le dernier. Si r < n, yr+1 , . . . , yn sont
traités comme des paramètres, qui peuvent prendre des valeurs réelles arbitraires.
Nous reprenons comme exemples les systèmes (S2 ) et (S3 ) de la section précédente.
x +y −3z −4t −1


 =
−y +11z +9t = 7


(S2,E )


 40z +40t = 32
−3t = −12/5

⇐⇒
9
x +y −3z −4t = −1



L2 ← −L2 y −11z −9t = −7


L3 ← (1/40)L3 

 z +t = 4/5
L4 ← −(1/3)L4 t = 4/5

⇐⇒
L1 ← L1 + 4L4 x +y −3z


 = 11/5
L2 ← L2 + 9L4 y −11z = 1/5


L3 ← L3 − L4 

 z = 0
t = 4/5

⇐⇒
L1 ← L1 + 3L3


 x +y = 11/5
L2 ← L2 + 11L3 y = 1/5




 z = 0
t = 4/5

⇐⇒
L1 ← L1 − L2

 x
 = 2
y = 1/5




 z = 0
t = 4/5

Le système est maintenant sous forme résolue : (2, 1/5, 0, 4/5) est la seule solution.
−y +t +z =


 x 3
+7y −8t −6z = −10


(S3,E )


 −3t = 0
0 = 0

⇐⇒


 x −y +t +z = 3
L2 ← (1/7)L2 y −(8/7)t −(6/7)z = −10/7
L3 ← −(1/3)L3


t = 0
⇐⇒

 x −y
 +t = 3−z
y −(8/7)t = −(10/7) + (6/7)z


t = 0
⇐⇒

L1 ← L1 − L3  x −y
 = 3−z
L2 ← L2 + (8/7)L3 y = −(10/7) + (6/7)z


t = 0
⇐⇒
10

L1 ← L1 + L2 
 x = (11/7) − (1/7)z
y = −(10/7) + (6/7)z


t = 0
Le système est maintenant sous forme résolue. Il admet une infinité de solutions, dé-
pendant du paramètre z. L’ensemble S des solutions s’écrit
11 10 1 6

S= , − , 0, 0 + z − , , 1, 0 , z ∈ R .
7 7 7 7
C’est bien la forme prévue par le théorème 2 : S est une droite affine, passant par la
solution particulière (11/7, −10/7, 0, 0), de vecteur directeur (−1/7, 6/7, 1, 0). Evidem-
ment l’écriture de l’ensemble des solutions obtenue pas la méthode de Gauss, n’est pas
la seule possible. Dans l’exemple ci-dessus, S pourrait aussi s’écrire :
S = { (x, y, z, t) = (2, −4, −3, 0) + λ(1, −6, −7, 0) , λ ∈ R } .
11
2 Entraînement
2.1 Vrai ou faux
1. Si un système a plus d’inconnues que d’équations, alors il a une infinité de
solutions.
2. Si un système a plus d’équations que d’inconnues, alors il a au plus une solution.
3. Si le rang d’un système est égal au nombre d’équations, et strictement inférieur
au nombre d’inconnues, alors le système a une infinité de solutions.
4. Si un système a une solution unique, alors il a autant d’équations que d’incon-
nues.
5. Si un système a une solution unique, alors son rang est égal au nombre d’in-
connues.
6. Si un système n’a pas de solution, alors son second membre est non nul.
7. Si un système a un second membre nul et si son rang est égal au nombre
d’équations, alors sa solution est unique.
8. Si un système de deux équations à deux inconnues n’a pas de solution, alors
les deux équations sont celles de deux droites parallèles dans le plan.
9. Si un système de deux équations à trois inconnues n’a pas de solution, alors
les deux équations sont celles de deux droites parallèles dans l’espace.
Vrai-Faux 2. Soit (S) un système linéaire et (H) le système homogène associé. Parmi
les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. Si (S) n’a pas de solution alors (H) n’a pas de solution.
2. Si (S) n’a pas de solution alors (H) a une solution unique.
3. (S) a une solution unique si et seulement si (H) a une solution unique.
4. Si (S) a une solution unique alors (H) a une solution unique.
5. Si (S) a une infinité de solutions, alors (H) a une infinité de solutions.
6. Si s0 et s1 sont deux solutions de (S) alors s0 + s1 est solution de (H)
7. Si s0 et s1 sont deux solutions de (S) alors 2(s0 − s1 ) est solution de (H)
8. Si s0 et s1 sont deux solutions de (S) alors 2(s0 − s1 ) est solution de (S)
9. Si s0 et s1 sont deux solutions de (S) alors −s0 + 2s1 est solution de (S)
Vrai-Faux 3. Soit (S) un système, que l’on résout par la méthode de Gauss. On note
(SE ) le système sous forme échelonnée. Parmi les affirmations suivantes, lesquelles sont
12
1. Si au moins un des pivots est nul, le système est impossible.

2. Si (S) a une solution unique, alors dans (SE ), aucune équation n’a son premier
membre nul.
3. Si (S) a plus d’équations que d’inconnues, alors dans (SE ), au moins une
équation a son premier membre nul.
4. Si (S) a moins d’équations que d’inconnues, alors dans (SE ) aucune équation
n’a son premier membre nul.
5. Si dans (SE ) une équation a ses deux membres nuls, alors (S) a une infinité de
solutions.
6. Si (S) a moins d’équations que d’inconnues, et si dans (SE ) toute équation
dont le premier membre est nul a un second membre nul, alors le système a une
infinité de solutions
7. Si le système a une infinité de solutions alors il a moins d’équations que d’in-
connues, ou bien au moins une équation dans (SE ) a un premier membre nul.
8. Si le système est impossible alors dans (SE ) aucune équation n’a un second
membre nul.
Vrai-Faux 4. Soient a et b deux paramètres réels. On considère le système :

(
x −2y = a
(S)
−2x +4y = b .
Soit S l’ensemble des solutions de (S). Parmi les affirmations suivantes, lesquelles sont
1. Pour tout couple (a, b), S est un singleton.
2. Il existe (a, b) tel que S soit un singleton.
3. Si a = b alors S est l’ensemble vide.
4. Si b = −2a alors S est l’ensemble vide.
5. Si b = −2a alors S est une droite affine.

(
x +ay = 1
(S)
x +by = 0 .
1. Pour tout couple (a, b), S est un singleton.
2. Il existe (a, b) tel que S soit un singleton.
3. Si a = b alors S est l’ensemble vide.
13
4. Si b = 2a alors S est l’ensemble vide.

5. Si a 6= 0 et b = 2a alors S est un singleton.

(
x +ay = 1
(S)
2x +by = 2 .
1. Pour tout couple (a, b), S est une droite affine.
2. Il existe (a, b) tel que S soit une droite affine.
3. Il existe (a, b) tel que S soit l’ensemble vide.
4. Si b = 2a alors S est l’ensemble vide.
5. Si b = 2a alors S est une droite affine.



 x −y +z = 1
(S) −ax +ay −z = −1


bz = 1 .
Soit S l’ensemble des solutions de (S).

1. Pour tout a, S est non vide.
2. Si b 6= 0, alors pour tout a, S est un singleton.
3. Si (a, b) = (1, 1), alors S est une droite affine.
4. Si (a, b) 6= (1, 1), alors S a au plus un élément.
5. Si (0, 0, 1) ∈ S, alors b = 1.
2.2 Exercices
Exercice 1. Déterminer, selon les valeurs du paramètre réel a, l’ensemble des solutions
des systèmes suivants.
( (
x −2y = 2 ax +y = 2
x −ay = a x +ay = 2
( (
ax +(1 − a)y = 1 ax +(1 − a)y = a
(1 − a)x −ay = a ax +ay = a
14
Exercice 2. Résoudre les systèmes linéaires suivants.

 

 x −2y +3z = 5 
 x +2y −z = 5
2x −4y +z = 5 2x +y +z = 10
3x −5y +2z = 8
 
 
x +2z = 0
 

 x −y +3z = 2 
 2x +y −z = 3
−x +4y +z = −1 x −y +z = 2
3x −2y −3z =
 

4 
x +y +2z = 0
 

 −y +z = 1 
 +y −2z = 3
−5x +2y −z = −1 −2x −3y +z = 2
−2z = 3x +y −2z = 0
 

x 4 
 

 10x +9y +z = −50 
 10x +9y +z = −50
9x +10y +5z = 40 9x +10y +5z = 41
 

x +5y +9z = 180 
x +5y +9z = 180
 

 x −2y +3z = 0 
 x +2y −z = 0
2x −4y +z = 0 2x +y −2z = 0
3x −6y +2z = 0 −z = 0
 
 
x
 

 x −y +3z = 0 
 2x +y −z = 0
−x +4y +z = 3 x −y +z = 1
−3y −4z = −3 x +2y −3z = −2

 

 

 −y +z = 1 
 +y −2z = 3
3x +2y −z = 2 −2x −3y +z = −2
−2z = −1 3x +y −3z =
 

x 
1
x −y −z −t = 3 −y −t
 

 
 x +z = 1
2x −z +3t = 9 x +y −z −t = −1

 

 3x +3y +2z

 = 4 

 x +y +z −t = 0
−x −2y +z −t = 0 x −y −z +t = 2
 
 

 3x +4y +z +2t = 3 
 x −2y +z +t = −2
6x +8y +2z +5t = 7 2x −y −z −t = −1
x +y +z +t = −8
 

9x +12y +3z +10t = 13 
+2y −3z = 4
 

 x 
 y +z = 5
x +3y −z = 11 x +z = 4

 



 2x +5y −5z = 13 

 x +y +2z = 9
x +4y +z = 18 −x +y = 1
 
15
Exercice 5. Déterminer, selon les valeurs du paramètre réel a, l’ensemble des solutions
des systèmes linéaires suivants.
 

 2x +3y −2z = 5 
 x −y +az = a
x −2y +3z = 2 x +ay −z = −1
4x −y +4z = a
 
 
x +y +z = 2
 

 x +y +(2a−1)z = 1 
 3ax +(3a−7)y +(a− 5)z = a−1
ax +y +z = 1 (2a−1)x +(4a−1)y +2az = a+1
 

x +ay +z = 3(a+1) 
4ax +(5a−7)y +(2a−5)z = a−1

( x +2y −z +t = 1
2x +ay +4z = 0


x +3y +z −t = 1
x +y +2az = −3
2x +y −8z +t = a


x −2y +az = 1
 

 
 ax +y +z +t = 1
3x −ay +2z = 1 x +ay +z +t = −1

 

 ax

 +y −z = 0  x

 +y +az +t = 1
x −2y +z = a x +y +z +at = −1
 
Exercice 6. Déterminer, selon les valeurs des paramètres réels a et b, l’ensemble des
solutions des systèmes linéaires suivants.
 

 3x +y −z = 1 
 ax +(b − 1)y +2z = 1
5x +2y −2z = a ax +(2b − 3)y +3z = 1
4x +y −z = b ax +(b − 1)y +(b + 2)z = 2b − 3

 

2x +y −z
 

 = 2 
 ax +y +z +t = 1
x −y +z = 4 x +ay +z +t = b

 



 3x +3y −z = 4a  x

 +y +az +t = b2
(2 − a)x +2y −2z = −2b x +y +z +at = b3
 
Exercice 7. Résoudre les systèmes linéaires suivants dans C.

( (
x −iy = 1 ix −iy = 1 + i
ix −y = 1 ix +y = 1 − i
( (
(1 + 2i)x −iy = 1 (1 + i)x −iy = 1
ix −(1 + i)y = 1 + 3i ix +(1 − i)y = −1
( (
x −iy = 1 (1 + i)x (1 − i)y = i
ix +y = i (1 − i)x +(1 + i)y = 1 − i
16
2.3 QCM
rapporte 2 points.
Question 1.
A Si un système a 4 équations et 2 inconnues, alors il est impossible.
B Si un système a 1 équation et 3 inconnues, alors il a une infinité de solutions.
C Si un système a 3 équations, 2 inconnues, et un second membre nul, alors il a
au moins une solution.
D Si un système a 2 équations, 2 inconnues, et un second membre nul, alors il a
exactement une solution.
E Si un système a 3 équations et 2 inconnues, et un second membre nul, alors il
a une infinité de solutions.
Question 2. Soit (S) un système de 2 équations à 3 inconnues.

A Le système (S) a forcément une infinité de solutions.
B Si les deux équations ont le même premier membre, alors le système (S) a une
infinité de solutions.
C L’ensemble des solutions du système (S) est forcément une droite affine.
D Le système (S) est impossible si et seulement si les deux équations sont celles
de deux plans parallèles non confondus.
E Si le système (S) a une solution, alors il en a une infinité.
Question 3. Soit (S) un système linéaire et (H) le système homogène associé.

A Le système (H) a forcément au moins une solution.
B Si le système (S) est impossible, alors le système (H) a une infinité de solutions.
C Si le système (S) a une infinité de solutions, alors le système (H) a une infinité
de solutions.
D Si s0 et s1 sont deux solutions de (S), alors 3s0 − 2s1 est solution de (H).
E Si s0 et s1 sont deux solutions de (H), alors 3s0 − 2s1 est solution de (S).
Question 4. Soit (S) un système, que l’on résout par la méthode de Gauss. On note
(SE ) le système sous forme échelonnée.
A Si (S) a 2 équations et 3 inconnues, alors dans (SE ) aucune équation n’a son
premier membre nul.
B Si (S) a 3 équations et 2 inconnues, alors dans (SE ) au moins une équation a
son premier membre nul.
C Si (S) a 4 équations et 3 inconnues, alors dans (SE ) exactement une équation
a son premier membre nul.
17
D Si dans (SE ) toute équation dont le premier membre est nul a aussi un second
membre nul, alors le système (S) a au moins une solution.
E Si (S) a une solution unique, alors dans (SE ) aucune équation n’a son premier
membre nul.
Question 5. Soit (S) un système de 4 équations à 3 inconnues.
A Le rang de (S) est au moins égal à 3.
B Si (S) est de rang 3, alors (S) a une solution unique.
C Si (S) est de rang 2, alors soit (S) est impossible, soit l’ensemble des solutions
de (S) est une droite affine.
D Si (S) est de rang 1, alors l’ensemble des solutions de (S) est un plan affine.
E Si (S) est de rang 3 et si son second membre est nul, alors (0, 0, 0) est l’unique
solution de (S).
Question 6. Soient a et b deux paramètres réels. On considère le système :
(
4x −2y = a
(S)
−2x +y = b .

A Si a = b 6= 0 alors S est l’ensemble vide.
B Il existe un couple (a, b) tels que S soit un singleton.
C Pour tout couple (a, b) tel que a 6= b, le système (S) est impossible.
D Il existe un couple (a, b) tels que S soit un espace affine de dimension 2.
E Si a = −2b alors S est une droite affine.
(
x −ay = a
(S)
ax −ay = b .

A Si (a, b) = (1, 1), alors S est une droite affine.
B Si a = 0, alors pour tout b le système est impossible.
C Si (a, b) = (1, 2), alors S est un singleton.
D Si (a, b) = (2, 1), alors S est un singleton.
E Si a 6= b, alors S n’est pas vide.
(
x −ay = 1
(S)
−2x +by = −2 .
18
A Si le produit ab est nul, alors S est un singleton.

B Pour tout couple (a, b), le système (S) a au moins une solution.
C Pour tout couple (a, b), (1, 0) appartient à S.
D Il existe un couple (a, b) tel que (0, 0) appartienne à S.
E Si a = b, alors S est une droite affine.



 x −y +z = 1
(S) ay +z = 1


bz = 2a .

A Pour (a, b) = (1, 1) le système (S) est sous forme échelonnée.
B Si (a, b) = (0, 1), alors S est vide.
C Si (a, b) = (0, 0), alors S est un plan affine.
D Si b 6= 0, alors pour tout a, S est un singleton.
E Si a = 0, alors pour tout b, S est vide.



 x −y +z = 1
(S) −ax +ay −z = −1
−x +y +bz = b .



A Si a = 1, alors pour tout b, S est une droite affine.
B Pour tout (a, b), S est non vide.
C Il existe (a, b) tel que S soit un singleton.
D Pour (a, b) = (1, 0), (0, 0, 0) ∈ S.
E Pour (a, b) = (1, −1), S est un plan affine.
Réponses : 1–BC 2–DE 3–AC 4–BD 5–CE 6–AE 7–AD 8–BC 9–AB 10–BE
2.4 Devoir
répondu.
Questions de cours : On considère un système (S) de m équations à n inconnues.
1. Qu’appelle-t-on système homogène associé à (S) ?
19
2. Démontrer que l’ensemble des solutions du système homogène associé, noté (H),
est un sous-espace vectoriel de Rn .
3. En supposant que l’ensemble des solutions de (S) est non vide, démontrer que
c’est un espace affine, dont l’espace vectoriel associé est l’ensemble des solutions
de (H).
4. Qu’appelle-t-on forme échelonnée pour le système (S) ?
5. Qu’est ce que le rang du système (S) ? Comment détermine-t-on le rang à partir
de la forme échelonnée ?
Exercice 1 : Soient a et b deux paramètres réels. On considère le système :


 ay +az = ab
(S) bz = a


x +y +z = 1 .
1. Mettre le système (S) sous forme échelonnée, discuter son rang selon les valeurs
de a et b.
2. Si a et b sont tous les deux non nuls, montrer que le système a une solution
unique, et donner l’expression de cette solution en fonction de a et b.
3. Pour a = 0, donner des équations paramétriques de l’ensemble des solutions de
(S).
Exercice 2 : On considère un espace affine de dimension 3, muni d’un repère (O,~ı, ~, ~k).
Soit P le plan d’équation implicite x + y + z = 1. Soient a et b deux paramètres réels.
Soit A le point de coordonnées (1, 1, a) dans le repère (O,~ı, ~, ~k) et ~u le vecteur de
coordonnées (1, 0, b) dans la base (~ı, ~, ~k). Soit D la droite passant par A, de vecteur
directeur ~u. Le but de l’exercice est d’étudier l’intersection du plan P et de la droite
D.
1. Vérifier que le vecteur ~u appartient au plan vectoriel associé à P si et seulement
si b = −1.
2. Pour b 6= −1 montrer que l’intersection de P et D est réduite à un point.
3. Pour b = −1, montrer que l’intersection de P est vide si a 6= −1, égale à D si
a = −1.
4. Vérifier que D est l’intersection des deux plans d’équations implicites bx−z = b−a
et y = 1. Ecrire le système linéaire caractérisant l’intersection de D et P.
5. Mettre ce système sous forme échelonnée.
6. Discuter le rang du système et la dimension de l’ensemble des solutions selon les
valeurs de a et b (retrouver les résultats des questions 1, 2 et 3).
7. Pour b 6= −1 donner l’expression de la solution du système en fonction de a et b.
20
Exercice 3 : Soient a et b deux paramètres réels. On considère le système :



 2x +y +z +t = 0
−2x +z −t = 1


(S)


 4x +3y +(b + 4)z +(a + 1)t = 1
2x +3y +(b + 5)z +(a + 2b)t = a+1.

1. Mettre le système (S) sous forme échelonnée.

2. Discuter le rang du système selon les valeurs de a et b.
3. Pour b = 0, donner une condition nécessaire et suffisante sur a pour que le système
(S) ait des solutions.
4. Pour (a, b) = (0, 1), montrer que l’ensemble des solutions est un plan affine dont
on donnera des équations paramétriques.
5. Pour b 6= 0, montrer que le système a une solution unique, dont on donnera
l’expression en fonction de a et b.

1. Le système homogène est obtenu en annulant le second membre de (S). Si (S)
est le système suivant,
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = b1



.. .. .. ..



. . . .





 .. .. .. ..
. . . .






alors le système homogène associé est :
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = 0



.. .. .. ..



. . . .




(H) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = 0

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = 0

2. Le n-uplet (0, . . . , 0) (vecteur nul de Rn ) est solution. L’ensemble des solutions

de (H) n’est donc jamais vide.
Pour montrer qu’un ensemble non vide est un sous-espace vectoriel de Rn , il
suffit de vérifier qu’il est stable par combinaison linéaire, c’est-à-dire que si deux
21
éléments appartiennent à l’ensemble, toutes leurs combinaisons linéaires restent

dans le même ensemble. Soient x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ) deux solutions
de (H), λ et µ deux réels quelconques. Nous devons vérifier que λx + µy est
solution de (H). Considérons la i-ième équation, vérifiée à la fois par x et y.
ai,1 x1 + . . . + ai,n xn = 0 et ai,1 y1 + . . . + ai,n yn = 0 .
En multipliant la première par λ, la seconde par µ et en ajoutant les deux, on

obtient :
λ(ai,1 x1 + . . . + ai,n xn ) + µ(ai,1 x1 + . . . + ai,n xn ) = 0 ,
soit,
ai,1 (λx1 + µy1 ) + . . . + ai,n (λxn + µyn ) = 0 .
Le n-uplet (λx1 + µy1 , . . . , λxn + µyn ) est donc solution de (H).
(0)
3. Soit s0 = (x1 , . . . , x(0)
n ) une solution particulière de (S). Nous devons démontrer
que toute solution de (S) est la somme de s0 et d’une solution de (H). Soit
s = (x1 , . . . , xn ) une solution quelconque de (S). Pour tout i = 1, . . . , m, les deux
solutions satisfont la i-ième équation.
(0)
ai,1 x1 + . . . + ai,n x(0)
n = bi et ai,1 x1 + . . . + ai,n xn = bi .
Si on retranche la première équation de la seconde, on obtient :

(0)
ai,1 (x1 − x1 ) + . . . + ai,n (xn − x(0)
n ) = 0 .
Par conséquent, le n-uplet s − s0 est solution du système homogène associé (H).

Réciproquement, on vérifie de la même façon que tout n-uplet somme de s0 et
d’une solution de (H) est solution de (S).
4. On dit qu’un système est échelonné s’il se présente sous la forme suivante.
p1 y1 + c1,2 y2 + · · · + c1,j yj + · · ·


 + c1,n yn = d1
p2 y2 + · · · + c2,j yj + · · · + c2,n yn = d2




.. ..


 ...
. .




(SE ) pr yr + ··· +cr,n yn = dr



 0 = dr+1
..



.





0 = dm

Mettre un système (S) sous forme échelonnée, c’est passer de (S) à (SE ) par
des transformations équivalentes des lignes, et une permutation éventuelle des
coordonnées, de sorte que
22
(a) les inconnues (y1 , . . . , yn ) de (SE ) sont celles de (S), mais dans un ordre qui
peut être différent,
(b) les coefficients p1 , . . . pr sont tous non nuls.
5. Si n est le nombre d’inconnues, le rang du système est le complément à n de la
dimension de l’espace vectoriel des solutions du système homogène associé. Sur
la forme échelonnée, le rang est le nombre de pivots non nuls.
Exercice 1 :
1. Ce système est déjà sous forme échelonnée : il suffit de permuter les équations.


 x +y +z = 1
(S) ay +az = ab


bz = a .
• Si b = 0, a = 0, le système (S) est de rang 1,

• si b = 0, a 6= 0, le système (S) est de rang 2,
• si b 6= 0, a = 0, le système (S) est de rang 2,
• si b 6= 0, a 6= 0, le système (S) est de rang 3.
2. Si a et b sont tous les deux non nuls, le système (S) est de rang 3, donc il a une
solution unique. 
 x
 = 1−b
y = b − a/b


z = a/b .
3. Pour a = 0, la seconde équation s’annule.
(
x +y +z = 1
(S)
bz = 0 .
Si b = 0, l’ensemble des solutions est le plan d’équation implicite x + y + z = 1,

dont des équations paramétriques sont par exemple :


 x = 1−λ−µ
y = λ , λ, µ ∈ R .


z = µ
Si b 6= 0, l’ensemble des solutions est une droite affine, d’équations paramétriques :



 x = 1−λ
y = λ , λ∈R.


z = 0
Exercice 2 :
23
1. Un vecteur de coordonnées (x, y, z) appartient au plan vectoriel associé à P si et

seulement si x + y + z = 0. C’est le cas pour ~u si et seulement si 1 + b = 0, soit
b = −1.
2. Pour b 6= −1, la droite vectorielle associée à D n’est pas incluse dans le plan
vectoriel associé à P, d’après ce qui précède. Comme l’espace est de dimension
3, l’intersection de D et P est réduite à un point.
3. Pour b = −1, la droite vectorielle associée à D est incluse dans le plan vectoriel
associé à P. Deux cas sont possibles : soit D ⊂ P, soit D ∩P = ∅. Pour distinguer
les deux cas, il suffit de vérifier si le point A appartient à P ou non. Si a = −1,
1 + 1 + a = 1, donc D ∩ P = D, si a 6= −1, D ∩ P = ∅.
4. La droite D a pour équations paramétriques :


 x = 1+λ

y = 1 , λ∈R.

z = a + λb
En multipliant la première équation par b, et en lui retranchant la troisième, on

obtient bx − z = b − a. Donc D est incluse dans l’intersection des deux plans
d’équations bx − z = b − a et y = 1. Réciproquement l’intersection de ces deux
plans est une droite (car ayant des vecteurs normaux indépendants, ils ne peuvent
être ni confondus ni parallèles). D’où le résultat. L’intersection de D et P est donc
l’ensemble des points de (x, y, z) solutions de :


 x +y +z = 1
y = 1
−z = b − a .


bx
5. Pour mettre ce système sous forme échelonnée, il faut retrancher la première ligne
multipliée par b de la troisième :


 x +y +z = 1
y = 1
−by −(1 + b)z = −a ,


puis ajouter la seconde ligne multipliée par b à la troisième :



 x +y +z = 1
y = 1
−(1 + b)z = b − a .


6. Si b = −1, le rang du système est 2, sinon il est égal à 3. Si b 6= −1, le système a

une solution unique, si b = −1, alors soit a 6= b et le système n’a pas de solution,
soit a = b et l’ensemble des solutions du système est une droite.
24
7. Pour b 6= −1, on trouve :
= b−a


 x 1+b
y = 1
z = a−b


1+b
.
Exercice 3 :
1. Voici les étapes de la mise sous forme échelonnée.


 2x +y +z +t = 0
L2 ← L2 + L1 y +2z = 1


L3 ← L3 − 2L1 

 y +(b + 2)z +(a − 1)t = 1
L4 ← L4 − L1 2y +(b + 4)z +(a + 2b − 1)t = a+1

⇐⇒

2x +y +z

 +t = 0
y +2z = 1


L3 ← L3 − L2 

 bz +(a − 1)t = 0
L4 ← L4 − 2L2 bz +(a + 2b − 1)t = a−1

⇐⇒


 2x +y +z +t = 0
y +2z = 1




 bz +(a − 1)t = 0
L4 ← L4 − L3 2bt = a−1

2. • Si b = 0, a = 1, le système (S) est de rang 2,

• si b = 0, a 6= 1, le système (S) est de rang 3,
• si b =
6 0, le système (S) est de rang 4.
3. Pour b = 0, a = 1 est la condition nécessaire et suffisante pour que le système ait
des solutions.
4. Pour (a, b) = (0, 1), les deux dernières équations s’annulent. On peut résoudre les
deux précédentes en fonction de z et t :
(
x = − 21 + 21 z − 12 t
y = 1 − 2z
L’ensemble des solutions est de dimension 2, c’est donc un plan, dont un système
d’équations paramétriques est :
− 12 + 12 λ − 12 µ


 x =
y = 1 − 2λ


, λ, µ ∈ R .


 z = λ
t = µ

25
5. Pour b 6= 0, le système est de rang 4, il a donc une solution unique. On obtient :

(a−1)2

a−1


 x = − 12 − 4b2
− 4b


(a−1)2

y = 1+


b2

2
z = − (a−1)





 2b2

a−1

t = .

2b
26
3 Compléments
3.1 Les formules de Cramer
Quand un système linéaire de n équations à n inconnues est de rang n, il a une
solution unique. Il existe une formule explicite qui relie la solution (x1 , . . . , xn ) aux
coefficients. Elle est connue, au moins pour les faibles valeurs de n, depuis très long-
temps, même si elle est attribuée traditionnellement au mathématicien genevois Gabriel
Cramer (1704-1752).
Commençons par le cas n = 2.
(
a1,1 x1 + a1,2 x2 = b1
a2,1 x1 + a2,2 x2 = b2
Ce système a une solution unique si et seulement si son déterminant est non nul.

a a
∆ = 1,1 1,2

= a1,1 a2,2 − a2,1 a1,2 6= 0 .
a2,1 a2,2

Si c’est le cas, les coordonnées de la solution s’écrivent comme des rapports de déter-
minants.

b a1,2 a1,1 b1
1
b1 a2,2 − b2 a1,2 b2 a2,2 b2 a1,1 − b1 a2,1 a2,1 b2

x1 = = x2 = = .
∆ ∆ ∆ ∆
Une formule analogue permet de calculer la solution d’un système 3 × 3.


 a1,1 x1 + a1,2 x2 + a1,3 x3 = b1
a x + a2,2 x2 + a2,3 x3 = b2
 2,1 1

a3,1 x1 + a3,2 x2 + a3,3 x3 = b3
Ce système a une solution unique si et seulement si son déterminant est non nul.

a1,1 a1,2 a1,3

∆ = a2,1 a2,2 a2,3

6= 0 .

a3,1 a3,2 a3,3

Si c’est le cas les coordonnées de la solution s’écrivent encore comme des rapports de
déterminants.

b a1,2 a1,3 a1,1 b1 a1,3 a1,1 a1,2 b1
1
b2 a2,2 a2,3 a2,1 b2 a2,3 a2,1 a2,2 b2

b3 a3,2 a3,3 a3,1 b3 a3,3 a3,1 a3,2 b3
x1 = x2 = x3 = .
∆ ∆ ∆
La notion de déterminant s’étend à des tableaux carrés de nombres n × n pour n
quelconque. On peut en donner la définition récursive suivante.
27
Définition 2. Soit (ai,j ) , i, j = 1, . . . , n un tableau carré de n × n réels.

1. Si n = 1, on appelle déterminant d’un tableau contenant un seul réel ce réel
lui-même.
2. si n > 1, pour i = 1, . . . , n notons ∆i le déterminant du tableau carré (n−1)×(n−1)
obtenu en supprimant la première colonne et la i-ième ligne du tableau initial.
On appelle déterminant du tableau n × n la quantité
n
(−1)i+1 ai,1 ∆i .
X
∆=
i=1
Vous pouvez vérifier que l’application de cette définition à un déterminant 2 × 2 ou

3 × 3 donne bien le calcul que vous savez effectuer.
Les formules de Cramer expriment les coordonnées de la solution d’un système de
n équations à n inconnues comme des rapports de déterminants.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = b1


.. .. .. ..



. . . .




(S) ai,1 x1 + · · · ai,j xj + ··· +ai,n xn = bi

 .. .. .. ..
. . . .





an,1 x1 + · · · +an,j xj + · · · +an,n xn = bn

Le déterminant de ce système est celui du tableau des coefficients du premier membre.

a1,1 · · · a1,j · · · a1,n

.. .. ..

. . .

∆=

ai,1 · · · ai,j ··· ai,n .

.. .. ..
. . .

an,1 · · · an,j · · · an,n

Théorème 4. Le système (S) a une solution unique si et seulement si son déterminant

∆ est non nul. Pour j = 1, . . . , n, notons ∆j le déterminant obtenu en remplaçant la
j-ième colonne de ∆ par le second membre. Si ∆ 6= 0, l’unique solution du système (S)
est telle que :
∆j
∀j = 1, . . . , n , xj = .
∆
Pour séduisantes qu’elles soient, les formules de Cramer sont parfaitement ineffi-
caces. Le problème vient du calcul du déterminant. Si on applique la définition récursive
2, elle implique n calculs de déterminants de taille (n−1) × (n−1), suivis de n multi-
plications et (n−1) additions. Pour chacun des déterminants de taille (n−1) × (n−1),
il faudra recommencer avec n−1 déterminants de taille (n−2) × (n−2). Au total, si
on programme avec un algorithme récursif la définition 2, le calcul d’un déterminant
n × n prendra de l’ordre de n(n!) opérations.
28
Il se trouve que le bon moyen algorithmique de calculer un déterminant est . . . la

méthode du pivot de Gauss. On montre en effet qu’un déterminant n’est pas modifié si
on ajoute à une ligne une combinaison linéaire des autres. Il est changé en son opposé
si deux lignes ou deux colonnes sont permutées. Si on applique la méthode du pivot
de Gauss au système (S), on arrive à un système échelonné (SE ). Le déterminant de
(SE ) est celui d’un tableau de nombres triangulaire : ses coefficients au-dessous de la
diagonale sont nuls. Le déterminant de (SE ), qui est égal ou opposé à celui de (S),
est tout simplement le produit des pivots. Le nombre d’opérations pour calculer un
déterminant n × n par la méthode du pivot de Gauss est de l’ordre de 32 n3 , soit très
inférieur à ce que requiert la définition 2.
Donc pour utiliser les formules de Cramer, il faudrait appliquer la méthode du pivot
de Gauss à (n + 1) systèmes, avant d’effectuer les quotients des déterminants obtenus :
mieux vaut ne l’appliquer qu’à un seul !
3.2 Tout blanc tout noir

La figure 3 représente un graphe : cinq sommets numérotés de 1 à 5 et des arêtes
entre eux (les arêtes ne sont pas orientées et il n’y a pas de boucle sur un même
sommet).
2 3
5 4
Figure 3 – Graphe à 5 sommets et 6 arêtes.
Imaginez que sur chaque sommet se trouve une ampoule, et un interrupteur qui
commande non seulement l’ampoule du même sommet, mais aussi celles des sommets
voisins. Par exemple appuyer sur l’interrupteur du sommet 2 bascule l’état des am-
poules 1, 2, 3 et 5, de « éteinte » à « allumée », ou bien le contraire. La première
observation, est que l’ordre dans lequel les interrupteurs sont actionnés, n’a pas d’in-
fluence sur le résultat. Si tout est éteint et que vous actionnez l’interrupteur 1, les
ampoules 1, 2 et 5 s’allument. Si ensuite vous actionnez 2, les ampoules 1, 2 et 5
s’éteignent, et 3 s’allume. Le résultat est le même si l’interrupteur 2 est actionné avant
le 1. On peut donc parler de l’effet d’un ensemble d’interrupteurs, sans considération
de l’ordre dans lequel ils sont actionnés.
Si toutes les ampoules sont éteintes, quel ensemble d’interrupteurs faut-il actionner
pour les allumer toutes ? Ou de manière plus condensée, comment passer de « tout
noir » à « tout blanc ». De manière assez surprenante, ce problème a toujours au moins
29
une solution quel que soit le graphe, et on peut le résoudre à l’aide de la méthode du
pivot de Gauss 1 .
Attention, les calculs ne seront pas ceux dont vous avez l’habitude : nous abandon-
nons les réels pour un ensemble de nombres beaucoup plus petit. Pour jouer le rôle
des réels, tout ensemble de nombres doit contenir au moins les éléments neutres pour
l’addition et la multiplication : 0 et 1. Le plus petit ensemble possible, celui des entiers
modulo 2, ne contient que 0 et 1. On le note Z/2Z. Voici les tables d’addition et de
multiplication.
+ 0 1 × 0 1
0 0 1 0 0 0
1 1 0 1 0 1
Sur l’ensemble des n-uplets de 0 ou de 1, les opérations de Z/2Z agissent composante
par composante. Par exemple pour n = 4 :
(0, 1, 0, 1) + (1, 0, 0, 1) = (1, 1, 0, 0) .
Cet ensemble, noté (Z/2Z)n , est un espace vectoriel sur Z/2Z, tout comme Rn est un
espace vectoriel sur R. La méthode de résolution des systèmes linéaires dans Rn , reste
valable dans Z/2Z, en n’oubliant pas que 1 + 1 = 0.
Etant donné le problème « tout blanc – tout noir » sur un graphe à n sommets,
nous allons lui associer un système linéaire de n équations à n inconnues.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = 1


.. .. .. ..



. . . .




(S) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = 1

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = 1

Il faut comprendre un n-uplet (x1 , . . . , xn ) de 0 et de 1 comme une description de

l’ensemble des interrupteurs qui seront actionnés : xj vaut 1 si l’interrupteur j est ac-
tionné, 0 sinon. Les coefficients ai,j décrivent l’effet des interrupteurs sur les ampoules :
ai,j vaut 1 si l’interrupteur j actionne l’ampoule i, 0 sinon. Le premier membre de la
ligne i décrit l’effet de la combinaison d’interrupteurs (x1 , . . . , xn ) sur l’ampoule i :
ai,1 x1 + · · · + ai,n xn vaut 1 si l’ampoule i est finalement allumée, 0 si elle est éteinte.
Tous les termes du second membre sont égaux à 1, car on souhaite que toutes les
ampoules soient allumées à la fin.
Voici le système correspondant à la figure 3.




x1 +x2 +x5 = 1
x1 +x2 +x3 +x5 = 1




x2 +x3 +x4 = 1 (7)




 x3 +x4 +x5 = 1
x1 +x2 +x4 +x5 = 1


1. Je dois cet exemple à Michel Burlet.
30
Vous pouvez vérifier que x = (1, 1, 0, 0, 1) est solution (dans Z/2Z) : actionner les
interrupteurs 1, 2 et 5 allume bien toutes les ampoules dans la figure 3.
Si le graphe est trop compliqué pour deviner la solution, comment la calculer ?
Par la méthode du pivot de Gauss bien sûr ! Ce qui a été exposé pour les matrices
à coefficients réels, vaut pour Z/2Z. Si on applique la méthode du pivot de Gauss
au système (7), on vérifie qu’il est de rang 5, donc (1, 1, 0, 0, 1) est l’unique solution.
Dans ce cas particulier, le système a une solution unique pour tout second membre.
Donc quelle que soit la configuration d’ampoules allumées et éteintes que l’on souhaite
atteindre, il y a un ensemble d’interrupteurs et un seul que l’on doit actionner pour
atteindre la configuration souhaitée.
Ce n’est pas toujours le cas. Le graphe complet à n sommets est tel que deux som-
mets quelconques sont toujours reliés par une arête. Sur un graphe complet, basculer
un interrupteur quelconque allume ou éteint toutes les ampoules à la fois. Si on com-
mence au début par toutes les ampoules éteintes, la seule autre configuration que l’on
puisse atteindre est celle où tout est allumé. Dans ce cas, tous les coefficients ai,j du
système sont égaux à 1, son rang est 1, et le système n’a de solution que si tous les
coefficients du second membre sont égaux.
Le miracle est que si tous les coefficients du second membre sont égaux à 1, le
système a toujours au moins une solution : quel que soit le graphe, il y a toujours un
ensemble d’interrupteurs à actionner pour allumer toutes les ampoules.
Théorème 5. Pour tout graphe à n sommets, le système (S) a au moins une solution.
Démonstration : Appliquons la méthode du pivot de Gauss au système (S). On le

transforme en prenant des combinaisons linéaires des lignes, jusqu’à le mettre sous
forme échelonnée. Si le rang du système est n, il n’y aura pas d’équation de compa-
tibilité : le système se résout, et on trouve une solution unique. Mais si le rang est
inférieur à n, la méthode du pivot de Gauss fait apparaître une combinaison linéaire
des équations dont le premier membre est nul. Or nous sommes dans (Z/2Z)n : les co-
efficients d’une combinaison linéaire ne peuvent être que 0 ou 1. Donc une combinaison
linéaire est forcément une somme. Que se passe-t-il quand une somme de lignes, disons
Li1 + · · · + Lik a un premier membre nul ? Cela implique en particulier que chacun des
sommets i1 , . . . , ik a un nombre impair de voisins parmi les autres sommets du même
ensemble i1 , . . . , ik . Si on restreint le graphe à ces sommets, on obtient un sous-graphe,
tel que le nombre de voisins de chaque sommet est impair. Or dans un graphe ayant
un nombre impair de sommets, il y a toujours un sommet dont le nombre de voisins
est pair (ce n’est pas facile à démontrer : réflechissez !). Si tous les sommets parmi
i1 , . . . , ik ont un nombre impair de voisins, alors k est pair. Donc si Li1 + · · · + Lik a
un premier membre nul, alors nécessairement k est un entier pair. Pour appliquer la
méthode du pivot de Gauss, on doit effectuer les mêmes transformations à la fois sur le
premier membre et sur le second. Or le second ne contient que des 1. La somme dans
Z/2Z d’un nombre pair de 1 donne 0. Ceci entraîne que si la forme échelonnée contient
31
une équation dont le premier membre est nul, alors le second membre de cette même
équation est nul également. Donc le système a une solution.
Le théorème 2 entraîne que l’ensemble des solutions est en bijection avec un sous-
espace vectoriel de (Z/2Z)n . Un sous-espace vectoriel de dimension k dans (Z/2Z)n a
2k éléments. Le nombre de solutions est donc nécessairement une puissance de 2. Pour
le graphe de la figure 4, vous pouvez calculer les solutions par la méthode du pivot de
Gauss, et vérifier qu’il y en a 2.
2 5
1 4
3 6
Figure 4 – Graphe à 6 sommets et 9 arêtes.
3.3 Les Neuf Chapitres

La méthode du pivot de Gauss. . . est née en Chine ! Sa plus ancienne utilisation
se trouve dans les « Neuf Chapitres sur l’Art du Calcul » (figure 5). L’auteur de ce
recueil de 246 problèmes est inconnu, tout comme la date à laquelle il a été écrit, que
certains auteurs placent en 152 avant J.-C., d’autres au premier siècle après J.-C.
Voici le contenu des neuf chapitres.
1. Champs rectangulaires pour traiter les territoires des terres cultivées : calcul frac-
tionnaire, calculs d’aires.
2. Petit mil et grains décortiqués pour traiter les échanges et les transformations :
proportionnalité, règle de trois.
3. Parts pondérées en fonction des degrés pour traiter le cher et le bon marché,
les distributions de grains et les impôts : partages proportionnels et inversement
proportionnels.
4. Petite largeur pour traiter les nombres-produits et les aires, du carré et du cercle :
connaissant une aire ou un volume, trouver un élément de la figure concernée
(côté du carré, côté du cube, circonférence du cercle, diamètre de la sphère). On
y trouve en particulier des algorithmes d’extraction de racines carrées et cubiques.
La valeur utilisée pour π est 3.
5. Discuter des travaux pour traiter les règles concernant les travaux de terrassement
et les volumes : volumes de prismes, de cônes et de troncs de cônes, de pyramides
et de troncs de pyramide, de tétraèdres.
32
Figure 5 – La première page des « Neuf Chapitres sur l’Art du Calcul ».
6. Paiement de l’impôt de manière égalitaire en fonction du transport pour traiter

travaux et dépenses selon la distance : partages proportionnels, calculs de dis-
tances, progressions arithmétiques.
7. Excédent et déficit pour traiter de comment les choses cachées et mêlées se font
apparaître mutuellement : méthode de fausse position (construction d’intervalles
emboîtés pour approcher un zéro d’une fonction).
8. Disposition rectangulaire pour traiter ce qui est mélangé ainsi que le positif et
le négatif : résolution de systèmes linéaires par la méthode du pivot de Gauss.
Parmi les problèmes on trouve des systèmes de 6 équations à 6 inconnues.
9. Base et hauteur pour traiter le haut et le profond, le large et le lointain : calculs
de distances utilisant le théorème de Pythagore.
Les « Neuf Chapitres » furent ignorés des occidentaux jusqu’à une date récente. Des
résolutions de systèmes linéaires apparaissent sur les tablettes d’argile babyloniennes,
et ils se retrouvent dans toute la littérature mathématique depuis l’antiquité. C’est bien
Carl Friedrich Gauss (1777-1855) qui a pour la première fois formalisé la méthode du
pivot en toute généralité, dans un mémoire de 1810 sur l’orbite de l’astéroïde Pallas.
Quittant l’astronomie pour la géodésie, il se trouva plus tard confronté à un problème
de triangulation de la région de Hanovre, qui impliquait 26 triangles : même Gauss
ne pouvait pas résoudre à la main des systèmes de plusieurs dizaines d’équations. Il
mit alors au point un algorithme de calcul approché, qui fut redécouvert par Philipp
33
Ludwig von Seidel (1821-1896) en 1874 (ce dernier avait un système de 72 équations
à résoudre). L’algorithme de Gauss-Seidel est utilisé de nos jours pour de très grands
systèmes.
3.4 Les grands systèmes

Même si aucun des systèmes résolus dans le cours ne dépassait 4 inconnues, on
demande couramment aux ordinateurs de résoudre des systèmes à plusieurs millions
d’inconnues. D’où viennent-ils ?
La physique fournit toute une famille d’équations différentielles ou d’équations aux
dérivées partielles qui décrivent avec une précision étonnante les phénomènes aux-
quels elles s’appliquent : équation de Maxwell, de Schrödinger, d’Euler, de Navier-
Stokes. . . À titre d’exemple, voici la plus célèbre des équations aux dérivées par-
tielles, l’équation de la chaleur. Considérons un corps homogène dans l’espace, et notons
f (t, x, y, z) la température au temps t du point de coordonnées (x, y, z). L’application
f est solution de l’équation aux dérivées partielles suivante :
!
∂f λ ∂f 2 ∂ 2 f ∂ 2f
= + + .
∂t ρCp ∂x2 ∂y 2 ∂z 2
où λ est la conductivité thermique, ρ la masse volumique et Cp la chaleur spécifique.
L’application suivante porte le nom de « noyau de la chaleur » car elle est solution de
l’équation de la chaleur, ce qui se vérifie facilement.
1 c

f (t, x, y, z) = √ exp − (x2 + y 2 + z 2 ) ,
t t t
où c = ρC 4λ
p
.
Il est extrêmement rare qu’une équation différentielle admette une solution explicite
comme celle-ci, et quand c’est le cas, la solution trouvée correspond à des conditions
qui ne sont pas physiquement réalistes. Il n’y a en général pas d’autre recours que de
résoudre l’équation de manière approchée par un algorithme de discrétisation. L’idée
consiste à approcher les dérivées de la fonction inconnue par ses accroissements sur un
pas de discrétisation, choisi suffisamment petit.
Pour être plus précis, nous allons prendre comme exemple l’équation de la chaleur
en dimension 1. Considérons une tige homogène, et notons f (t, x) sa température à
l’instant t et à l’abscisse x.
∂f λ ∂ 2f
= .
∂t ρCp ∂x2
Choisissons un pas de temps δt et un pas d’espace δx (petits). À l’instant t, nous
approchons la dérivée partielle en temps par le taux d’accroissement sur un intervalle
de longueur δt :
∂f 1

' f (t + δt, x) − f (t, x) .
∂t δt
34
De même la dérivée partielle seconde en espace est approchée par une différence d’ac-
croissements, soit :
∂f 2 1

2
' (f (t, x + δx) − 2f (t, x) + f (t, x − δx) .
∂x (δx)2
On ne conserve que les instants et les abscisses qui sont des multiples entiers de δt et
δx. Posons donc, pour tout couple d’entiers i, j,
fi,j = f (iδt, jδx) .
L’équation de la chaleur est remplacée par un système linéaire d’équations reliant entre
elles les inconnues fi,j :
1 λ 1

fi+1,j − fi,j = fi+1,j − 2fi,j + fi−1,j .
δt ρCp (δx)2
Pour arriver à un système lisible, simplifions encore. Prenons une barre en équilibre
thermique, dont la température est fixée à a à l’abscisse 0 et b à l’abscisse (n + 1)δx,
Calculons sa température à l’abscisse iδx, pour i = 1, . . . , n. Puisque l’équilibre ther-
mique est atteint, nous cherchons une fonction constante en temps, c’est-à-dire telle
que ∂f /∂t = 0. Notons fi la valeur approchée de la température au point iδx de la
barre. Le système dont les fi sont solution est le suivant.
2f1 − f2 = a


..



.




−fi−1 + 2fi − fi+1 = 0

 ..
.





−fn−1 + 2fn = b

Nous laissons au lecteur le soin de vérifier que ce système admet une solution unique,
définie pour i = 1, . . . , n par
i
fi = a + (b − a) .
n+1
Ceci correspond bien au fait qu’une fonction telle que f 00 (x) = 0 est un polynôme de
degré 1 : f (x) = αx + β.
Chacune des équations du système ci-dessus contient relativement peu de termes
non nuls : on dit que le système est creux. C’est le cas en général pour les systèmes
obtenus après discrétisation d’un problème différentiel. Ceci facilite le stockage en mé-
moire, et accélère la résolution, grâce à la mise au point d’algorithmes adaptés. Il reste
ensuite à démontrer que la solution du système linéaire approche bien la solution du
problème différentiel, en un sens qu’il faudrait préciser. Ceci fait l’objet de théorèmes
de convergence que nous n’aborderons pas.
35
Figure 6 – Exemple de maillage.
L’équilibre thermique d’une barre n’a évidemment que peu d’intérêt pratique. Pour
un bâtiment en construction, prévoir la puissance de la chaufferie et calculer la consom-
mation d’énergie sont des problèmes nettement plus concrets. Or les volumes à chauffer
ont 3 dimensions. Pour peu qu’on souhaite 100 pas de discrétisation dans chacune des
trois dimensions, on arrive à un système certes linéaire, mais qui a déjà un million
d’inconnues. Des moyens de découper l’espace plus astucieusement que par des petits
cubes ont été inventés. On les appelle des maillages. Vous en voyez parfois dans les
« making of » des films d’animation, où ils sont utilisés pour rendre les mouvements
plus réalistes. Vous les voyez aussi sur des présentations de voitures ou d’avions : ils sont
utilisés pour calculer par l’équation de Navier-Stokes l’écoulement de l’air autour de la
carrosserie, et donc prédire la portance de l’avion ou la consommation de la voiture.
36
Dimension finie
Bernard Ycart
Ce chapitre est fondamental : les espaces vectoriels vous accompagneront tout au

long de vos études mathématiques, et il est indispensable d’avoir compris les espaces
de dimension finie avant d’aller plus loin. Même si les espaces vectoriels vous sont
présentés ici sous forme assez générale, l’objectif principal est de comprendre le cas de
Rn , l’espace vectoriel des n-uplets de réels. N’hésitez pas à vous reporter à l’intuition
géométrique que vous avez des vecteurs en dimension 2 et 3.
Table des matières

1 Cours 1
1.1 Espaces et sous-espaces . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Combinaisons linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Morphismes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Images et noyaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Ecriture matricielle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.7 Détermination pratique de l’image et du noyau . . . . . . . . . . . . . . 23
2 Entraînement 27
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3 Compléments 43
3.1 La vérité est éternelle et divine . . . . . . . . . . . . . . . . . . . . . . 43
3.2 Application linéaire tangente . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3 Dualité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4 Codes de Hamming . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
8 novembre 2011
Maths en Ligne Dimension finie UJF Grenoble
1 Cours
1.1 Espaces et sous-espaces
Nous reprenons dans ce chapitre, de manière plus détaillée, la théorie des espaces
vectoriels de dimension finie. Dans la mesure où il ne sera question que de vecteurs,
abandonner les flèches au-dessus de leurs écritures ne devrait pas introduire de confu-
sion.
Un espace vectoriel est un ensemble sur lequel sont définies
• une addition interne (on peut ajouter entre eux deux éléments de l’ensemble) ;
• une multiplication externe (on peut multiplier un élément de l’ensemble par un
nombre réel).
Ces deux opérations doivent vérifier certaines propriétés de compatibilité qui sont listées
dans la définition 1.
Définition 1. On dit que E est un espace vectoriel sur R si E est muni d’une addition
et d’une multiplication
( externe vérifiant les propriétés suivantes.
E × E −→ E
• Addition :
(v, w) 7−→ v + w
1. Associativité : ∀u, v, w ∈ E , u + (v + w) = (u + v) + w
2. Elément neutre : ∃e ∈ E , ∀v ∈ E , v + e = e + v = v
3. Opposé : ∀v ∈ E , ∃v 0 ∈ E , v + v 0 = v 0 + v = e
4. Commutativité : ∀v, w ∈ E , v + w = w + v
Ces propriétés font de (E, +) un groupe commutatif.
(
R × E −→ E
• Multiplication externe :
(λ, v) 7−→ λ v
5. Associativité : ∀λ, µ ∈ R , ∀v ∈ E , λ(µ v) = (λµ) v
6. Elément neutre : ∀v ∈ E , 1 v = v
7. Distributivité (1) : ∀λ, µ ∈ R , ∀v ∈ E , (λ + µ) v = λ v + µ v
8. Distributivité (2) : ∀λ ∈ R , ∀v, w ∈ E , λ (v + w) = λ v + λ w
La proposition suivante nous autorisera à noter 0 l’élément neutre pour l’addition
(nous l’appellerons « vecteur nul ») et −v l’opposé de v.
Proposition 1. Soit E un espace vectoriel.
1. Le produit par le réel 0 d’un vecteur v quelconque est l’élément neutre pour l’ad-
dition :
∀v ∈ E , 0 v = e .
2. Le produit par le réel −1 d’un vecteur v quelconque est son opposé pour l’addition :
∀v ∈ E , v + (−1) v = e .
1
Démonstration : Notons (provisoirement) v 0 l’opposé de v pour l’addition : v + v 0 = e.

En utilisant les propriétés de la définition 1 :
0v = 0v + e par 2.
= 0 v + (v + v 0 ) par 3.
= 0 v + (1 v + v 0 ) par 6.
= (0 v + 1 v) + v 0 par 1.
= (0 + 1) v + v 0 par 7.
= 1 v + v0 = v + v0 = e par 6.
Ceci démontre le premier point. Pour le second, il suffit d’écrire
v + (−1) v = 1 v + (−1) v = (1 + (−1)) v = 0 v = e .

L’exemple fondamental est l’ensemble des n-uplets de réels :
Rn = {(x1 , . . . , xn ) , x1 , . . . , xn ∈ R}
L’ensemble des n-uplets de réels (couples pour n = 2, triplets pour n = 3, . . . ), est

muni de l’addition et de la multiplication par un réel, coordonnée par coordonnée.
• Addition : (1, 2, 3, 4) + (3, −1, −2, 2) = (4, 1, 1, 6)
• Multiplication externe : (−2)(3, −1, −2, 2) = (−6, 2, 4, −4)
Le singleton contenant seulement le vecteur nul est un espace vectoriel particulier.
L’associativité de l’addition permet d’écrire (sans parenthèses) des combinaisons
linéaires de vecteurs.
Définition 2. Soient v1 , . . . , vn n vecteurs d’un espace vectoriel E. On appelle combi-
naison linéaire de v1 , . . . , vn , tout vecteur s’écrivant :
n
X
λ1 v1 + · · · + λn vn = λi vi ,
i=1
où λ1 , . . . , λn sont des réels.
Il est inutile de s’inquiéter de la quantité de propriétés à vérifier dans la définition

1. Dans tous les exemples que l’on rencontrera, les opérations sont parfaitement natu-
relles et leurs propriétés évidentes. On ne vérifie d’ailleurs jamais les 8 propriétés de
la définition 1. La raison pour laquelle c’est inutile est que tous les espaces vectoriels
que l’on utilise sont des sous-espaces d’un espace vectoriel, c’est-à-dire qu’ils sont des
sous-ensembles, sur lesquels on applique localement les opérations de l’espace entier.
Définition 3. Soit E un espace vectoriel et F un sous-ensemble non vide de E. On
dit que F est un sous-espace vectoriel de E s’il est un espace vectoriel pour l’addition
et la multiplication externe de E.
2
Observons que tout sous-espace vectoriel de E contient au moins le vecteur nul. La

notion prend tout son intérêt grâce au théorème suivant.
Théorème 1. Soit E un espace vectoriel et F ⊂ E un sous-ensemble non vide de E.
L’ensemble F est un sous-espace vectoriel de E si et seulement si :
∀v, w ∈ F v+w ∈F ;
(1)
∀v ∈ F , ∀λ ∈ R λv ∈ F .
Démonstration : Parmi les 8 propriétés de la définition 1, celles qui ne font intervenir

que le quantificateur ∀ (associativités, commutativité, distributivités), puisqu’elles sont
vraies dans E, restent vraies dans F à cause de (1). Il suffit donc de vérifier les 2
propriétés impliquant une existence (élément neutre et opposé). Nous devons démontrer
que F contient le vecteur nul, ainsi que l’opposé de tout vecteur de F . D’après le premier
point de la proposition 1, le vecteur nul s’écrit 0 v pour tout vecteur v de E, donc pour
tout vecteur de F . Comme F est non vide, le vecteur nul est donc dans F . De même
si v est un vecteur de F , alors son opposé, qui s’écrit (−1) v d’après le second point de
la proposition 1, est aussi dans F .

Les trois affirmations suivantes sont équivalentes.
1. F est un sous-espace vectoriel de E.
2. F contient toutes les combinaisons linéaires de 2 de ses vecteurs.
∀v, w ∈ F , ∀λ, µ ∈ R , λv + µw ∈ F .
3. pour tout n > 1, F contient toutes les combinaisons linéaires de n de ses vecteurs.
n
X
∀v1 , . . . , vn ∈ F , ∀λ1 , . . . , λn ∈ R , λi vi ∈ F .
i=1
Démonstration : Rappelons que F est un sous-espace vectoriel de E si et seulement

si il vérifie (1). L’équivalence entre (1) et 2 est un exercice facile, laissé au lecteur.
L’implication 3 =⇒ 2 est évidente. Nous allons démontrer la réciproque 2 =⇒ 3, par
récurrence sur n. Notons H(n) l’hypothèse de récurrence :
n
X
H(n) : ∀v1 , . . . , vn ∈ F , ∀λ1 , . . . , λn ∈ R , λi vi ∈ F .
i=1
Le point 2 est H(2), et il implique H(1) (cas particulier µ = 0). Supposons que H(n)
soit vrai. Soient v1 , . . . , vn+1 n + 1 vecteurs de F et λ1 , . . . , λn+1 n + 1 réels. Ecrivons
n+1
X
λi vi = v + λn+1 vn+1 ,
i=1
3
avec n
X
v= λi vi
i=1
Le vecteur v appartient à F , par H(n). La combinaison linéaire v +λn+1 vn+1 appartient

à F d’après H(2), d’où le résultat.
Comme conséquence directe des théorèmes 1 ou bien 2, on vérifie facilement le résultat

suivant.
Proposition 2. L’intersection de deux sous-espaces vectoriels est un sous-espace vec-

toriel.
La réunion de deux sous-espaces vectoriels n’est pas un espace vectoriel en général

(pensez à deux droites distinctes).
1.2 Combinaisons linéaires

D’après le théorème 2, un sous-espace vectoriel contient toutes les combinaisons
linéaires d’un nombre quelconque de vecteurs : pour tout entier n, pour tous vecteurs
v1 , . . . , vn de E, et pour tous réels λ1 , . . . , λn ,
n
X
λ1 v1 + · · · + λn vn = λi v i ∈ E .
i=1
Une des manières de fabriquer un sous-espace vectoriel est de partir d’un ensemble
quelconque d’éléments, puis de lui ajouter toutes les combinaisons linéaires de ces
éléments.
Définition 4. Soit E un espace vectoriel et V un ensemble non vide (fini ou non)

de vecteurs de E. On appelle sous-espace engendré par V l’ensemble des combinaisons
linéaires d’un nombre fini quelconque d’éléments de V.
L’ensemble des combinaisons linéaires d’éléments de V est un espace vectoriel,

d’après le théorème 2. Le même théorème implique aussi que tout espace vectoriel
contenant V doit contenir toutes les combinaisons linéaires de ses éléments. Donc le
sous-espace engendré par V est inclus dans tout sous-espace contenant V.
Une famille finie de vecteurs est un n-uplet de vecteurs.
F = (v1 , . . . , vn )
L’espace vectoriel engendré par F est l’ensemble des combinaisons linéaires de

v1 , . . . , vn .
n
( )
X
λi vi , ∀i = 1, . . . , n λi ∈ R .
i=1
4
À cause de la commutativité de l’addition, changer l’ordre dans lequel on écrit les

vecteurs de la famille, ne modifie pas l’espace engendré.
Pour n = 1, l’espace engendré par un seul vecteur v (non nul) est une droite
vectorielle :
{λv, λ ∈ R} .
Pour n = 2, l’espace engendré par deux vecteurs v et w (non proportionnels) est un
plan vectoriel :
{ λ v + µ w , λ, µ ∈ R } .
L’espace vectoriel Rn est engendré par les n vecteurs
(1, 0, . . . , 0) , (0, 1, . . . , 0) , . . . , (0, 0, . . . , 1) .
En effet, on peut écrire tout vecteur (x1 , x2 , . . . , xn ) de Rn , comme la combinaison

linéaire :
x1 (1, 0, . . . , 0) + x2 (0, 1, . . . , 0) + · · · + xn (0, 0, . . . , 1) .
Deux familles de vecteurs différentes peuvent engendrer le même espace vectoriel.

Par exemple R2 est engendré par

F= (1, 0) , (0, 1) ,
mais aussi par

G= (1, 1) , (1, −1) .
En effet, tout vecteur (x, y) s’écrit :

x+y x−y
(x, y) = (1, 1) + (1, −1) .
2 2
Définition 5. Soit E un espace vectoriel et F une famille d’éléments de E. On dit
que F est une famille génératrice si l’espace engendré par F est égal à E.
Par exemple F = ((1, 0), (0, 1)) et G = ((1, 1), (1, −1)) sont deux familles généra-
trices de R2 . Par contre ((0, 1), (0, 2)) n’est pas une famille génératrice de R2 .
Les familles suivantes sont aussi des familles génératrices de R2 .

(1, 0), (0, 1), (1, 1) ; (1, 1), (1, −1), (0, 1) ; (1, 0), (0, 1), (1, 1), (1, −1)
Par rapport à F et G, elles contiennent des vecteurs superflus. Si dans une famille de
vecteurs, un vecteur est combinaison linéaire des autres, on peut l’enlever de la famille
sans changer l’espace engendré. Une famille de laquelle on ne peut rien enlever sans
changer l’espace engendré est une famille libre.
5
Définition 6. Soit F = (v1 , . . . , vn ) une famille finie de vecteurs. On dit que F est
une famille libre si pour tous λ1 , . . . , λn ∈ R,
n
X
λi vi = 0 =⇒ (∀i = 1, . . . , n , λi = 0) .
i=1
Elle est dite liée dans le cas contraire.
On dit aussi que les vecteurs v1 , . . . , vn sont linéairement indépendants quand leur
famille est libre.
Comme cas particuliers, une famille contenant le vecteur nul est liée ; une famille conte-
nant un seul vecteur non nul est libre. On utilise souvent la caractérisation suivante :
Proposition 3. Soit n un entier au moins égal à 2. Une famille de n vecteurs est liée
si et seulement si l’un des vecteurs est combinaison linéaire des autres.
Démonstration : Soit (v1 , . . . , vn ) une famille liée. Par définition, il existe une combi-
naison linéaire nulle, dont les coefficients ne sont pas tous nuls.
n
X
λi vi = 0 ,
i=1
et au moins un des λi est non nul. Observons que la propriété pour une famille d’être
libre ou liée ne dépend pas de l’ordre dans lequel on écrit les vecteurs. Sans perte de
généralité nous pouvons supposer que λn est non nul. On en déduit alors :
!
λ1 λn−1
vn = − v1 + · · · + vn−1
λn λn
Réciproquement, supposons que vn soit combinaison linéaire de v1 , . . . , vn−1 :
vn = λ1 v1 + · · · + λn−1 vn−1
Alors :
λ1 v1 + · · · + λn−1 vn−1 − vn = 0 ,
Donc la famille (v1 , . . . , vn ) est liée.
Dans R2 , la famille ((0, 1), (0, 2)) est liée. A l’inverse, les familles F = ((1, 0), (0, 1))
et G = ((1, 1), (1, −1)) sont deux familles libres de R2 .
Dans Rn ,
(1, 0, . . . , 0) , (0, 1, . . . , 0) , . . . , (0, 0, . . . , 1)
est une famille libre.
6
1.3 Bases
Ce chapitre ne traite que des espaces finiment engendrés.
Définition 7. On dit qu’un espace vectoriel est finiment engendré s’il est engendré par
un nombre fini de vecteurs.
Voici deux observations symétriques.

1. Si on ajoute un vecteur à une famille génératrice, alors elle ne peut plus être libre.
En effet, tout vecteur ajouté est forcément combinaison linéaire des précédents,
ce qui n’est pas possible dans une famille libre.
2. Si on enlève un vecteur à une famille libre, alors elle ne peut plus être génératrice.
En effet, le vecteur que l’on vient d’enlever n’est pas combinaison linéaire des
autres, donc il n’est pas dans l’espace engendré par les autres.
Définition 8. On appelle base toute famille à la fois génératrice et libre.
Nous avons déjà rencontré plusieurs bases. Les familles ((1, 0), (0, 1)) et ((1, 1), (1, −1))
sont deux bases de R2 . Dans Rn ,

(1, 0, . . . , 0) , (0, 1, . . . , 0) , . . . , (0, 0, . . . , 1)
est une base, que l’on appelle la base canonique. La proposition suivante nous permettra
de parler de bases en étant assurés de leur existence. Sa démonstration montrera aussi
qu’on peut extraire une base de toute famille génératrice.
Proposition 4. Dans un espace vectoriel, différent de {0} et finiment engendré, il
existe une base.
Démonstration : Soit (v1 , . . . , vn ) une famille génératrice de l’espace. Puisque cet espace
est différent de {0}, au moins un des vi est non nul. Si vi 6= 0, (vi ) est une famille
libre. Parmi les sous-familles, extraites de (v1 , . . . , vn ), considérons celles qui sont des
familles libres, et choisissons parmi elles une famille libre ayant le plus grand nombre
d’éléments. Notons m ce nombre d’éléments maximal. On peut renuméroter les vi de
sorte que (v1 , . . . , vm ) soit une famille libre. Puisque le nombre m est maximal, les
vecteurs vm+1 , . . . , vn sont des combinaisons linéaires de v1 , . . . , vm . Donc tout vecteur
est combinaison linéaire de v1 , . . . , vm . Donc (v1 , . . . , vm ) est à la fois génératrice et
libre : c’est une base.
Le résultat principal de cette section est le suivant.
Théorème 3. Dans un espace vectoriel, différent de {0} et finiment engendré, toutes
les bases ont le même nombre d’éléments.
Démonstration : La partie difficile de la démonstration réside dans le lemme suivant.
7
Lemme 1. Si un espace possède une famille génératrice à n éléments, alors toute

famille de n + 1 éléments est liée.
Admettons ce lemme pour l’instant. Si deux bases B1 et B2 ont pour cardinaux n1
et n2 , alors n2 6 n1 d’après le lemme, car B1 est génératrice et B2 est libre. De façon
symétrique, puisque B2 est génératrice et B1 est libre, n1 6 n2 . Donc n1 = n2 , et le
théorème est démontré.
La démonstration du lemme se fait par récurrence sur le cardinal de la famille
génératrice. Supposons que l’espace admette une famille génératrice à un seul élément
v. Soit l’espace est une droite vectorielle soit il ne contient que le vecteur nul : tous les
vecteurs sont proportionnel à v. Deux vecteurs quelconques s’écrivent λ v et µ v, pour
un certain couple de réels (λ, µ), et ils sont liés car, soit au moins l’un des deux est nul,
soit chacun est proportionnel à l’autre (cf. proposition 3).
Supposons maintenant que le résultat du lemme soit vrai pour une famille généra-
trice de n vecteurs. Nous voulons passer au rang n + 1. Considérons un espace engendré
par les vecteurs v1 , . . . , vn+1 et une famille de n+2 vecteurs (w1 , . . . , wn+2 ). Nous devons
montrer qu’elle est liée.
Chacun des wi est combinaison linéaire des vi . Dans ces combinaisons linéaires,
isolons la partie concernant vn+1 .
∀i = 1, . . . , n + 2 , wi = wi0 + λi vn+1 ,
où wi0 appartient au sous-espace engendré par (v1 , . . . , vn ). Si tous les λi sont nuls,
cela signifie que les n + 2 vecteurs wi sont tous dans le sous-espace engendré par
(v1 , . . . , vn ). La famille est donc liée, par application de l’hypothèse de récurrence.
Supposons maintenant que l’un des λi est non nul. Quitte à changer l’ordre des vecteurs,
nous pouvons supposer λn+2 6= 0. Alors vn+1 s’écrit :
1 0
vn+1 = (wn+2 − wn+2 ).
λn+2
Donc,
λi
∀i = 1, . . . , n + 1 , wi = wi0 + 0
(wn+2 − wn+2 ),
λn+2
soit,
λi λi 0
∀i = 1, . . . , n + 1 , wi − wn+2 = wi0 − w .
λn+2 λn+2 n+2
λi
Les n + 1 vecteurs wi0 − λn+2 0
wn+2 , qui appartiennent à l’espace engendré par v1 , . . . , vn ,
sont liés, d’après l’hypothèse de récurrence. Donc il existe α1 , . . . , αn+1 non tous nuls,
tels que
n+1
!
X λi
αi w i − wn+2 = 0 .
i=1 λn+2
Ceci entraîne que w1 , . . . , wn+2 sont liés, ce qui achève la démonstration du lemme.
Le théorème 3 permet de définir rigoureusement la notion de dimension.
8
Définition 9. Soit E un espace vectoriel, différent de {0} et finiment engendré. On

appelle dimension de E le nombre d’éléments commun à toute base de E.
On étend la définition à un espace vectoriel contenant seulement le vecteur nul,
en convenant que sa dimension est 0. Les espaces de dimension 1 sont les droites
vectorielles, ceux de dimension 2 sont les plans vectoriels. L’espace Rn est de dimension
n. Les sous-espaces de dimension n − 1 dans Rn s’appellent les hyperplans de Rn .
Si on connaît la dimension de l’espace, il est facile de vérifier si une famille de
vecteurs est ou non une base, grâce au théorème suivant.
Théorème 4. Dans un espace vectoriel de dimension n :
1. toute famille libre a au plus n éléments,
2. toute famille libre de n éléments est une base,
3. toute famille génératrice a au moins n éléments,
4. toute famille génératrice de n éléments est une base.
Démonstration : Le premier point découle directement du lemme 1 : toute famille

ayant au moins n + 1 vecteurs est liée.
Pour le second point, soit (v1 , . . . , vn ) une famille libre, et v un vecteur quelconque
de l’espace. D’après le premier point, (v1 , . . . , vn , v) est forcément liée : il existe une
combinaison linéaire nulle, dont les coefficients ne sont pas tous nuls. Le coefficient de
v dans cette combinaison linéaire ne peut pas être nul, car (v1 , . . . , vn ) est libre. Donc
v est combinaison linéaire de v1 , . . . , vn . Donc (v1 , . . . , vn ) est génératrice : c’est une
base.
Pour le troisième point si une famille génératrice avait n − 1 éléments, alors par le
lemme 1 toute famille de n éléments serait liée, et donc aucune base ne pourrait avoir
n éléments.
Le quatrième point découle de la démonstration de la proposition 4. Si une famille
est génératrice, une de ses sous-familles est une base. Si la famille génératrice a n
éléments, la base extraite ne peut être que la famille elle-même.
Comme il est naturel, tout sous-espace vectoriel d’une espace vectoriel de dimension
finie est lui-même de dimension finie.
Proposition 5. Soit E un espace vectoriel de dimension n. Tout sous-espace vectoriel
de E est de dimension finie, inférieure ou égale à n.
Démonstration : Soit F un sous-espace vectoriel de E. Toute famille libre d’éléments

de F est aussi une famille libre dans E, elle a donc moins de n éléments d’après
le point 1 du théorème 4. Considérons une famille libre d’éléments de F , de longueur
maximale. Soit (v1 , . . . , vm ) cette famille. Soit v un vecteur quelconque de F . La famille
(v1 , . . . , vm , v) ne peut pas être libre. Elle est donc liée, donc v est combinaison linéaire
de (v1 , . . . , vm ). La famille (v1 , . . . , vm ) est donc génératrice : c’est une base de F .
9
La dimension de l’espace engendré par une famille de vecteurs est le rang de cette
famille.
Définition 10. On appelle rang d’une famille de vecteurs la dimension de l’espace

vectoriel qu’elle engendre.
Les observations suivantes sont des conséquences faciles du théorème 4 :

• le rang d’une famille de n vecteurs est au plus n
• le rang d’une famille de n vecteurs est n si et seulement si cette famille est libre
• le rang d’une famille de n vecteurs est n si et seulement si cette famille est une
base de l’espace vectoriel qu’elle engendre.
Nous verrons plus loin un moyen systématique pour déterminer le rang d’une famille
de vecteurs, et en extraire une base de l’espace engendré.
L’intérêt des bases est qu’elles permettent d’identifier tout espace de dimension finie
à Rn , grâce à la notion de coordonnées.
Théorème 5. Soit E un espace de dimension n et (b1 , . . . , bn ) une base de E. Pour

tout vecteur v ∈ E il existe un n-uplet de réels (x1 , . . . , xn ) unique tel que :
n
X
v= x i bi .
i=1
Démonstration : Comme la famille (b1 , . . . , bn ) est génératrice, v s’exprime comme

combinaison linéaire de b1 , . . . , bn , d’où l’existence. Pour l’unicité, supposons que deux
combinaisons linéaires soient égales.
n
X n
X
x i bi = yi bi
i=1 i=1
Ceci implique
n
X
(xi − yi ) bi = 0 ,
i=1
donc xi = yi , pour tout i = 1, . . . , n, puisque (b1 , . . . , bn ) est une famille libre.

Les réels x1 , . . . , xn sont les coordonnées de v dans la base (b1 , . . . , bn ).
Par exemple, les coordonnées de (2, 3) dans la base ((1, 0), (0, 1)) sont 2, 3. Dans la
base ((1, 1), (1, −1)), ses coordonnées sont 25 , − 12 . Les coordonnées de (x1 , . . . , xn ) dans
la base canonique de Rn sont x1 , . . . , xn .
Le théorème suivant, dit « théorème de la base incomplète » montre qu’on peut
fabriquer une base en complétant une famille libre par des éléments d’une famille
génératrice.
10
Théorème 6. Soient l, n, m trois entiers tels que 1 6 l < n 6 m. Soit E un espace

vectoriel de dimension n, (v1 , . . . , vl ) une famille libre, et (w1 , . . . , wm ) une famille
génératrice. Alors il existe n − l indices i1 , . . . , in−l ∈ {1, . . . , m} tels que
(v1 , . . . , vl , wi1 , . . . , win−l ) ,
soit une base de E.
Démonstration : Appelons « famille complétée », soit la famille (v1 , . . . , vl ), soit une

famille du type
(v1 , . . . , vl , wi1 , . . . , wik ) ,
avec {i1 , . . . , ik } ⊂ {1, . . . , m}. On considère l’ensemble (fini et non vide) de toutes
les familles complétées libres. Dans cet ensemble, on choisit une famille ayant le plus
grand nombre possible d’éléments. Soit l + k ce nombre maximal d’éléments. On peut
renuméroter les wi de sorte que
(v1 , . . . , vl , w1 , . . . , wk )
soit une famille libre. Puisque k est maximal, pour j = k + 1, . . . , m,
(v1 , . . . , vl , w1 , . . . , wk , wj )
est liée. Il s’ensuit que wj est combinaison linéaire de v1 , . . . , vl , w1 , . . . , wk .

Mais comme (w1 , . . . , wm ) est génératrice, tout vecteur de l’espace est combinaison
linéaire de v1 , . . . , vl , w1 , . . . , wk . Donc (v1 , . . . , vl , w1 , . . . , wk ) est une base.
On utilise le théorème 6 le plus souvent sous la forme affaiblie suivante.
Corollaire 1. Soit E un espace vectoriel de dimension finie n > 2. Soit l un entier

tel que 1 6 l < n et (v1 , . . . , vl ) une famille libre dans E. Il existe n − l vecteurs
w1 , . . . , wn−l tels que :
(v1 , . . . , vl , w1 , . . . , wn−l )
soit une base de E.
1.4 Morphismes
Une application entre deux espaces vectoriels est dite linéaire si elle envoie une
combinaison linéaire de vecteurs sur la même combinaison linéaire de leurs images.
Définition 11. Soient E et F deux espaces vectoriels et f une application de E dans

F . On dit que f est une application linéaire si
∀v, w ∈ E f (v + w) = f (v) + f (w)

(2)
∀v ∈ E , ∀λ ∈ R f (λv) = λ f (v) .
11
Une application linéaire f de E dans F envoie nécessairement le vecteur nul de E

sur le vecteur nul de F . Elle envoie l’opposé de v sur l’opposé de f (v). La proposition
suivante se démontre facilement, dans le style du théorème 2.
Proposition 6. Soient E et F deux espaces vectoriels, et f une application de E dans
F . Les trois affirmations suivantes sont équivalentes.
1. f est une application linéaire.
2.
∀v, w ∈ E , ∀λ, µ ∈ R , f (λ v + µ w) = λ f (v) + µ f (w) .
3. Pour tout n > 1,
n n
!
X X
∀v1 , . . . , vn ∈ E , ∀λ1 , . . . , λn ∈ R , f λi v i = λi f (vi ) .
i=1 i=1
Voici quelques exemples d’applications linéaires.

• de R2 dans R2 : (x, y) 7→ (x + y, 2x + 3y)
• de R2 dans R3 : (x, y) 7→ (y, x, x + y)
• de R3 dans R2 : (x, y, z) 7→ (y − x, 2z + y)
Une application linéaire respecte la structure d’espace vectoriel : l’image d’une somme
est la somme des images, l’image du produit par un réel est le produit de l’image par le
même réel. D’une application entre deux structures algébriques (groupes, corps, etc. . . )
qui respecte la structure, on dit qu’elle est un morphisme. Le vocabulaire classique est
le suivant.
Définition 12. Une application linéaire de E dans F est un
• endomorphisme si E = F ,
• isomorphisme si elle est bijective,
• automorphisme si E = F et l’application est bijective.
La composée de deux applications linéaires est une application linéaire.
Théorème 7. Soient E, F, G trois espaces vectoriels, f une application linéaire de E
dans F et g une application linéaire de F dans G. La composée g ◦f est une application
linéaire de E dans G.
f g
E −→ F −→ G
u 7−→ f (u) 7−→ g ◦ f (u) = g(f (u)) .
Démonstration : On utilise successivement la linéarité de f et celle de g.

g ◦ f (λ v + µ w) = g(f (λ v + µ w))
= g(λ f (v) + µ f (w))
= λ g(f (v)) + µ g(f (w))
= λ g ◦ f (v) + µ g ◦ f (w) .
12

Si une application f est un isomorphisme, son application réciproque, que nous
noterons f −1 est aussi une application linéaire.
Théorème 8. Soit f un isomorphisme de E dans F . Sa réciproque f −1 est un isomor-

phisme de F dans E.
Démonstration : Nous devons vérifier que pour tous w, w0 ∈ F , et pour tous λ, µ ∈ R,

f −1 (λ w + µ w0 ) = λ f −1 (w) + µ f −1 (w0 ). Puisque f est bijective, il existe v, v 0 ∈ E tels
que f (v) = w et f (v 0 ) = w0 . Utilisons la linéarité de f pour écrire :
f −1 (λ w + µ w0 ) = f −1 (λ f (v) + µ f (v 0 ))
= f −1 (f (λ v + µ v 0 ))
= λ v + µ v0
= λ f −1 (w) + µ f −1 (w0 ) .

La composée de f par f −1 est l’application identique, ou identité, de E dans lui-
même. C’est un automorphisme particulier, que nous noterons IE .
IE : E −→ E , v 7−→ IE (v) = v .
Une combinaison linéaire d’applications linéaires est encore une application linéaire.
Théorème 9. Soient E et F deux espaces vectoriels. Soient f et g deux applications li-

néaires de E dans F et λ, µ deux réels. L’application λ f +µ g est encore une application
linéaire.
Démonstration : L’application λ f + µ g est celle qui à v associe λ f (v) + µ g(v). Sa

linéarité se déduit facilement de celles de f et g.
Nous terminons la section par des interprétations géométriques d’applications li-
néaires de R2 dans R2 . Considérons un plan vectoriel muni d’une base orthonormée
(~ı, ~). A tout couple de réels (x, y) est associé le vecteur x~ı + y~. Une application li-
néaire de R2 dans lui-même est associée à une transformation géométrique du plan, qui
à un vecteur associe un autre vecteur. En voici trois (cf. figure 1) :
• rotation d’angle π/2
(x, y) 7→ (−y, x)
• symétrie par rapport à la première bissectrice
(x, y) 7→ (y, x)
• projection sur la première bissectrice
(x, y) 7→ ((x + y)/2, (x + y)/2)
13
Rotation Symétrie Projection

(y,x)
(−y,x)
(x+y,x+y) /2
(x,y)
j j j
(x,y) (x,y)
O i O i O i
Figure 1 – Interprétations géométriques de trois applications linéaires de R2 dans R2 :

rotation d’angle π/2, symétrie par rapport à la première bissectrice, projection sur la
première bissectrice.
Les rotations et les symétries sont des automorphismes du plan vectoriel. Les projec-
tions sont des endomorphismes, mais elles ne sont pas bijectives. Observons que les
translations, par exemple (x, y) 7→ (x + 2, y − 1), ne sont pas linéaires. Ce sont des
bijections, mais pas des automorphismes du plan vectoriel.
1.5 Images et noyaux

Qu’une application linéaire respecte les combinaisons linéaires entraîne qu’elle res-
pecte aussi les sous-espaces vectoriels, au sens suivant.
Théorème 10. Soient E, F deux espaces vectoriels, et f une application linéaire de
E dans F .
1. Soit A un sous-espace vectoriel de E. Alors
f (A) = { f (v) , v ∈ A } ,
est un sous-espace vectoriel de F .

2. Soit B un sous-espace vectoriel de F . Alors
f −1 (B) = { v ∈ E , f (v) ∈ B } ,
est un sous-espace vectoriel de E.

L’ensemble des images par une application linéaire des éléments d’un espace vecto-
riel est un sous-espace vectoriel de l’espace d’arrivée (point 1). L’ensemble des éléments
de l’espace de départ dont l’image par une application linéaire est dans un sous-espace
de l’espace d’arrivée, est un sous-espace de l’espace de départ (point 2). Attention à la
notation f −1 (B) : elle a un sens même si l’application f n’est pas bijective et donc si
l’application réciproque f −1 n’existe pas.
14
Démonstration : Pour montrer qu’un sous-ensemble est un sous-espace vectoriel, il

suffit de vérifier qu’il est non vide, et que toute combinaison linéaire de deux de ses
vecteurs reste dans l’ensemble (théorème 2). Rappelons que tout sous-espace vectoriel
contient au moins le vecteur nul, et que si f est linéaire alors f (0) = 0. Donc le vecteur
nul de F appartient à f (A) et celui de E appartient à f −1 (B). Les deux ensembles
f (A) et f −1 (B) sont donc non vides.
1. Deux vecteurs quelconques de f (A) s’écrivent f (v), f (v 0 ), où v, v 0 ∈ A. Etant
donnés deux réels λ et µ, λ f (v) + µ f (v 0 ) est l’image par f de λ v + µ v 0 qui est
un vecteur de A.
2. Si v et v 0 sont tels que f (v) et f (v 0 ) appartiennent à B, alors f (λ v + µ v 0 ) =
λ f (v) + µ f (v 0 ) ∈ B. Donc λ v + µ v 0 ∈ f −1 (B).

Parmi les cas particuliers du théorème 10, l’image et le noyau jouent un rôle im-
portant.
Définition 13. Soient E et F deux espaces vectoriels et f une application linéaire de

E dans F . On appelle :
1. image de f et on note Im(f ) le sous-espace vectoriel de F :
Im(f ) = f (E) = { f (v) , v ∈ E } .
2. noyau de f et on note Ker(f ) le sous-espace vectoriel de E :
Ker(f ) = f −1 ({0}) = { v ∈ E , f (v) = 0 } .
La notation Ker vient de l’allemand, où noyau se dit « Kern ».

Considérons par exemple l’application f de R2 dans R3 définie par :
f : (x, y) 7−→ (x + y, x + y, x + y) .
Son image est la droite vectorielle de R3 engendrée par le vecteur (1, 1, 1). Son noyau
est l’ensemble des vecteurs (x, y) de R2 tels que x + y = 0 : c’est la droite vectorielle
de R2 engendrée par le vecteur (1, −1).
Im(f ) = { λ (1, 1, 1) , λ ∈ R } et Ker(f ) = { λ (1, −1) , λ ∈ R } .
Proposition 7. Soient E et F deux espaces vectoriels et f une application linéaire de

E dans F . L’application f est :
1. surjective si et seulement si Im(f ) = F ,
2. injective si et seulement si Ker(f ) = {0}.
15
Démonstration : La caractérisation de la surjectivité est une simple traduction des

définitions. Celle de l’injectivité utilise la linéarité. Soient v et w deux éléments de E.
f (v) = f (w) ⇐⇒ f (v − w) = 0 ⇐⇒ (v − w) ∈ Ker(f )
Par définition, f est injective si et seulement si f (v) = f (w) implique v = w, donc si
et seulement si (v − w) ∈ Ker(f ) implique v − w = 0, d’où le résultat.
Le rang d’une application linéaire est la dimension de son image.
Définition 14. Soient E et F deux espaces vectoriels de dimension finie et f une
application linéaire de E dans F . On appelle rang de f la dimension de Im(f ).
rang(f ) = dim(Im(f )) .
Supposons que E soit de dimension n et choisissons une base (b1 , . . . , bn ). L’image
par f de tout vecteur de E est une combinaison linéaire des vecteurs f (b1 ), . . . , f (bn ).
Donc Im(f ) est le sous-espace vectoriel de E engendré par (f (b1 ), . . . , f (bn )). Le rang
de f est la dimension de ce sous-espace ; c’est donc le rang de la famille de vecteurs
(f (b1 ), . . . , f (bn )) (cf. définition 10). Observons que le rang est inférieur ou égal aux
deux dimensions des espaces vectoriels de départ et d’arrivée.
rang(f ) 6 min{ dim(E) , dim(F ) } .
Théorème 11. Soit E et F deux espaces vectoriels de dimension finie. Soit f une
application linéaire de E dans F . L’application f est :
1. surjective si et seulement si l’image de toute famille génératrice dans E est une
famille génératrice dans F ,
2. injective si et seulement si l’image de toute famille libre dans E est une famille
libre dans F ,
3. bijective si et seulement si l’image de toute base de E est une base de F .
Démonstration : Démontrons d’abord que si f est surjective alors l’image d’une famille
génératrice dans E est génératrice dans F . Soit (v1 , . . . , vm ) une famille génératrice dans
E. Pour tout élément w de F , il existe v ∈ E tel que f (v) = w. Le vecteur v s’écrit :
v = λ1 v1 + · · · + λm vm .
Donc :
w = f (λ1 v1 + · · · + λm vm ) = λ1 f (v1 ) + · · · + λm f (vm ) .
Tout vecteur w de F est combinaison linéaire de la famille (f (v1 ), . . . , f (vm )), qui est
donc génératrice.
Voici la réciproque. Si (f (v1 ), . . . , f (vm )) est génératrice, alors un vecteur w de F
quelconque s’écrit
w = λ1 f (v1 ) + · · · + λm f (vm ) = f (λ1 v1 + · · · + λm vm ) .
16
Donc w est l’image par f d’un vecteur de E : f est bien surjective.

Démontrons maintenant que si f est injective alors l’image d’une famille libre dans
E est une famille libre dans F . Soit (v1 , . . . , vl ) une famille libre dans E. Supposons
que
λ1 f (v1 ) + · · · + λn f (vl ) = 0 .
Par la linéarité de f ,
λ1 f (v1 ) + · · · + λl f (vl ) = f (λ1 v1 + · · · + λl vl ) = 0 .
Si f est injective, alors le seul vecteur d’image nulle est le vecteur nul, donc λ1 b1 +
· · · + λn bn = 0. Mais (v1 , . . . , vl ) est une famille libre. Donc λ1 = · · · = λn = 0.
Montrons la réciproque. Si l’image de toute famille libre est une famille libre, alors
l’image d’un vecteur non nul est un vecteur non nul. Donc Ker(f ) = {0} et f est
injective, par la proposition 7.
Pour terminer la démonstration, il suffit d’observer qu’une application est bijective
si et seulement si elle est à la fois injective et surjective ; d’autre part une famille est
une base si et seulement si elle est à la fois libre et génératrice. Le point 3 du théorème
est donc conséquence des deux précédents.
La conjonction des théorèmes 11 et 4 implique les relations suivantes entre les
dimensions des espaces de départ et d’arrivée.
Corollaire 2. Soient E et F deux espaces vectoriels de dimension finie et f une

application linéaire de E dans F .
1. Si f est surjective alors dim(E) > dim(F ).
2. Si f est injective alors dim(E) 6 dim(F ).
3. Si f est bijective alors dim(E) = dim(F ).
La dimension est donc une forte contrainte sur la nature des applications linéaires.
On peut aussi voir cette contrainte comme suit.
Corollaire 3. Soient E et F deux espaces vectoriels de même dimension. Une applica-

tion linéaire de E dans F est bijective si et seulement si elle est injective ou surjective.
Il ne peut exister un isomorphisme entre deux espaces vectoriels que s’ils ont la
même dimension. Réciproquement, si deux espaces ont la même dimension, on peut
toujours construire un isomorphisme entre eux, en envoyant une base de l’un sur une
base de l’autre. En particulier, tous les espaces vectoriels de dimension n sont iso-
morphes à Rn . Si E est de dimension n, avec une base (b1 , . . . , bn ), tous les vecteurs de
E ont une décomposition unique
n
X
v= xi b i ,
i=1
17
où les xi sont les coordonnées de v (théorème 5). L’application de E dans Rn qui à v

associe le n-uplet de ses coordonnées (x1 , . . . , xn ) est un isomorphisme de E dans Rn .
La somme des dimensions de l’image et du noyau est la dimension de l’espace de
départ : le théorème 12 ci-dessous, est le théorème du rang.
Théorème 12. Soient E et F deux espaces vectoriels de dimension finie et f une

application linéaire de E dans F .
dim(Im(f )) + dim(Ker(f )) = dim(E) .
Démonstration : Soient k et l les dimensions respectives de Ker(f ) et Im(f ). Soit

(b1 , . . . , bk ) une base de Ker(f ) et (c1 , . . . , cl ) une base de Im(f ). Pour j = 1, . . . , l, soit
vj un vecteur de E tel que f (vj ) = cj . Nous allons démontrer que
B = (b1 , . . . , bk , v1 , . . . , vl )
est une base de E, ce qui entraîne que dim(E) = k + l.

Montrons d’abord que c’est une famille libre. Soient λ1 , . . . , λk et µ1 , . . . , µl , k + l réels.
Posons
k
X l
X
v= λ i bi et w = µj v j
i=1 j=1
Puisque v ∈ Ker(f ), l’image par f du vecteur v + w est

l
X l
X
f (v + w) = f (w) = µj f (vj ) = µ j cj
j=1 j=1
Si v + w = 0, alors f (v + w) = 0, ce qui entraîne la nullité des µj , car (c1 , . . . , cl ) est

une famille libre. Alors v = 0, ce qui entraîne la nullité des λi , car (b1 , . . . , bk ) est une
famille libre. Donc B est une famille libre.
Il reste à montrer que B est une famille génératrice. Soit v un vecteur de E. Comme
le vecteur f (v) appartient à Im(f ), il est combinaison linéaire de c1 , . . . , cl :
l
X
f (v) = µ j cj
j=1
Donc :  
l
X l
X
f (v) = µj f (vj ) = f  µj vj 
j=1 j=1
Ceci entraîne :  
l
X
f v − µj v j  = 0 ,
j=1
18
donc  
l
X
v − µj vj  ∈ Ker(f ) .
j=1
Donc il existe λ1 , . . . , λk tels que

 
l
X k
X
v − µj vj  = λi bi ,
j=1 i=1
soit
k
X l
X
v= λi bi + µj vj .
i=1 j=1
1.6 Ecriture matricielle

Les espaces vectoriels considérés sont tous de dimension finie > 1. Observons
d’abord qu’une application linéaire est déterminée par l’image qu’elle donne d’une
base de l’espace de départ.
Proposition 8. Soient E et F deux espaces vectoriels de dimension finie.

Soit (b1 , . . . , bn ) une base de E. Soit (w1 , . . . , wn ) un n-uplet de vecteurs de F . Il existe
une application linéaire unique f telle que pour tout i = 1, . . . , n, f (bi ) = wi .
Démonstration : Tout vecteur v de E s’écrit de façon unique sous la forme

n
X
v= x i bi ,
i=1
où les xi sont les coordonnées de v dans la base (b1 , . . . , bn ). Puisque f doit être linéaire,
l’image de v ne peut être que
n
X n
X
f (v) = xi f (bi ) = xi w i .
i=1 i=1

Si on choisit une base dans l’espace d’arrivée, alors les images des vecteurs de la base
de départ ont des coordonnées dans cette base. S’il y a n vecteurs de base au départ
et m à l’arrivée, l’application linéaire est déterminée par m × n réels : m coordonnées
pour chacun des n vecteurs de base. Une matrice est la représentation sous forme de
tableau de ces m × n réels.
19
Notons (b1 , . . . , bn ) une base de l’espace de départ, et (c1 , . . . , cm ) une base de l’espace
d’arrivée. Soit ai,j la i-ième coordonnée de f (bj ) :
m
X
∀j = 1, . . . , n , f (bj ) = a1,j c1 + · · · + ai,j ci + · · · + am,j cm = ai,j ci .
i=1
Les coordonnées des vecteurs images f (b1 ), . . . , f (bn ) sont conventionnellement notées
en colonnes. L’indice i (des vecteurs de la base d’arrivée) est l’indice de ligne, l’indice
j (des vecteurs de la base de départ) est l’indice de colonne.
départ
f (b1 ) · · · f (bj ) · · · f (bn )

a1,1 · · · a1,j · · · a1,n c1
.. .. .. ..
. . . .
ai,1 ··· ai,j ··· ai,n ci arrivée
.. .. .. ..
. . . .
am,1 ··· am,j ··· am,n cm
Le plus souvent, on se ramènera au cas où l’espace de départ est Rn et l’espace d’ar-

rivée Rm , les deux étant munis de leurs bases canoniques. Comme premier exemple,
considérons l’application de R2 dans R3 :
f : (x, y) 7−→ (x + y, 2x + 3y, x − y) .
La base canonique de R2 est ((1, 0), (0, 1)). L’image de ces deux vecteurs est
f ((1, 0)) = (1, 2, 1) et f ((0, 1)) = (1, 3, −1) .
La matrice de f est donc la suivante (attention à l’écriture des vecteurs de l’espace

d’arrivée en colonnes).  
1 1
 2 3 


1 −1
Munissons maintenant R2 de la base ((1, 1), (1, −1)) au départ, et R3 de la base
((1, 0, 0), (1, 1, 0), (1, 1, 1)) à l’arrivée. Les images des vecteurs de la base de départ
sont
f ((1, 1)) = (2, 5, 0) = −3 (1, 0, 0) + 5 (1, 1, 0) + 0 (1, 1, 1)
f ((1, −1)) = (0, −1, 2) = 1 (1, 0, 0) − 3 (1, 1, 0) + 2 (1, 1, 1) .
D’où la matrice,  
−3 1
 5 −3 
 
0 2
20
Quand l’espace d’arrivée et l’espace de départ sont les mêmes (l’application est un
endomorphisme), on choisit la même base au départ et à l’arrivée. La matrice d’un
endomorphisme a autant de lignes que de colonnes : on dit qu’elle est carrée. Voici les
matrices de trois endomorphismes de R2 , dans la base canonique.
• Rotation d’angle π/2 : (x, y) 7→ (−y, x)
!
0 −1
1 0
• Symétrie par rapport à la première bissectrice : (x, y) 7→ (y, x)

!
0 1
1 0
• Projection sur la première bissectrice : (x, y) 7→ ((x + y)/2, (x + y)/2)

!
1 1
2 2
1 1
2 2
Dans un espace de dimension n, la matrice de l’application identique est la matrice

carrée n × n qui a des 1 sur la diagonale (termes d’indices (i, i)) et des 0 en dehors
(termes d’indices (i, j) avec i 6= j). On l’appelle matrice identité d’ordre n et on la note
In .
1 0 ··· ··· 0
 

 0 ... .. 
 1 . 

 . . . . .
. . . . .

In =  .
 . . . . 
 .
 . .. 
 . . 1 0  
0 ··· ··· 0 1
La représentation matricielle présente l’avantage d’automatiser de nombreux cal-

culs. Nous consacrerons le chapitre suivant au calcul matriciel. Pour l’instant nous
allons voir comment la matrice d’une application linéaire permet de calculer l’image
d’un vecteur dont on se donne les coordonnées dans la base de départ. Reprenons la
situation générale : (b1 , . . . , bn ) est une base de l’espace de départ, et (c1 , . . . , cm ) une
base de l’espace d’arrivée. Le coefficient d’indice (i, j) de la matrice de f , noté ai,j , est
la i-ième coordonnée de f (bj ) :
m
X
∀j = 1, . . . , n , f (bj ) = a1,j c1 + · · · + ai,j ci · · · + am,j cm = ai,j ci .
i=1
Considérons maintenant un vecteur v de l’espace de départ, dont les coordonnées dans

la base (b1 , . . . , bn ) sont (x1 , . . . , xn ).
v = x 1 b1 + · · · + x n bn .
21
L’image de v par f est :

f (v) = x1 f (b1 ) + · · · + xn f (bn )
n
X
= xj f (bj )
j=1
n
X m
X
= xj ai,j ci
j=1 i=1
 
m
X n
X
=  ai,j xj  ci .
i=1 j=1
Donc le vecteur f (v) se décompose dans la base (c1 , . . . , cm ) en f (v) = y1 c1 +· · ·+ym cm ,

avec : n X
∀i = 1, . . . , m , yi = ai,j xj .
j=1
On dit que le vecteur (yi )i=1,...,m est le produit de la matrice (ai,j ) par le vecteur
(xj )j=1,...,n . Observez que ce produit n’a de sens que si le nombre de coordonnées du
vecteur est égal au nombre de colonnes de la matrice.
Il est commode, pour calculer le produit d’une matrice par un vecteur, de représenter
les xi en colonne, au-dessus et à droite de la matrice (ai,j ) (voir figure 2).
x1
 
 . 
 .. 
 

 xj 


.. 
.
 
 
xn
a1,1 ··· a1,j ··· a1,n y1
   
 . .. ..   . 
 .. . .   . 
   . 

 ai,1 ··· ai,j ··· ai,n   yi 
 


.. .. .. 
  .. 
 
. . .   . 


am,1 · · · am,j · · · am,n ym
Reprenons l’exemple de l’application de R2 dans R3 :

f : (x, y) 7−→ (x + y, 2x + 3y, x − y) .
Les bases respectives de R2 et R3 étant les bases canoniques, la matrice de f est :
 
1 1
 2 3 


1 −1
22
a’
b’
c’
d’
* * * *
a b c d aa’+bb’+cc’+dd’
* * * *
Figure 2 – Comment présenter le produit d’une matrice par un vecteur colonne.
Pour vérifier la cohérence de la notation matricielle, calculons le produit de cette ma-

trice par un vecteur de R2 quelconque (x, y).
!
x
y
   
1 1 x+y
 2   2x + 3y 
3 
  
1 −1 x−y
1.7 Détermination pratique de l’image et du noyau

Nous reprenons les notations de la section précédente : E et F sont deux espaces
vectoriels, munis respectivement des bases (b1 , . . . , bn ) et (c1 , . . . , cm ). La matrice de
l’application linéaire f relative à ces deux bases est (ai,j ). Le noyau de f est l’ensemble
des vecteurs de E dont l’image par f est le vecteur nul. Soit v un vecteur de E et
x = (x1 , . . . , xn ) le n-uplet de ses coordonnées dans la base (b1 , . . . , bn ). La condition
nécessaire et suffisante sur x pour que f (v) soit nul est que toutes les coordonnées de
f (v), c’est-à-dire toutes les lignes du produit Ax, soient nulles.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = 0


.. .. .. ..



. . . .




(H) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = 0

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = 0

Le système linéaire (H) est homogène : l’ensemble de ses solutions est un sous-espace
vectoriel de Rn . La méthode du pivot de Gauss permet de déterminer une base de
l’ensemble des solutions de (H), donc une base de Ker(f ). Nous allons voir qu’elle
permet aussi au passage de déterminer le rang de f , et même une base de Im(f ).
23
D’après la proposition 8, à toute famille de n vecteurs de Rm correspond une ap-

plication linéaire de Rn dans Rm . Nous avons vu que le rang de cette application est le
rang de la famille de vecteurs (définitions 10 et 14). La technique décrite ici s’applique
indifféremment à une famille de vecteurs ou à une application linéaire.
La première étape de la méthode de Gauss consiste à mettre le système (H) sous forme
échelonnée.
p1 y1 + a01,2 y2 + · · · + a01,j yj + · · · + a01,n yn = 0



p2 y2 + · · · + a02,j yj + · · · + a02,n yn = 0




.. ..


 ...
. .




(H 0 ) pr y r + ··· 0
+ar,n yn = 0




 0 = 0

 ..
.





0 = 0

Mettre le système (H) sous forme échelonnée, c’est passer de (H) à (H 0 ) par des
transformations de lignes consistant à ajouter à une ligne le produit d’une autre par
une constante, échanger deux lignes, permuter éventuellement des coordonnées, de sorte
que
1. les systèmes (H) et (H 0 ) sont équivalents,
2. les inconnues (y1 , . . . , yn ) de (H 0 ) sont celles de (H), mais dans un ordre qui peut
être différent,
3. les pivots p1 , . . . pr sont tous non nuls.
Au système (H 0 ) on peut associer la matrice suivante.
p1 a01,2 · · · a01,j ··· a01,n

 

 0 p2 · · · a02,j ··· a02,n

 .. . . .. .. 

 . . . .


A0 = 0
 

 0 0 pr ··· ar,n 


 0 ··· ··· 0  

.. .. 
. . 
 

0 ··· ··· 0
Cette matrice est celle d’une autre application linéaire f 0 , de E vers F .
Théorème 13. Les applications f et f 0 sont de rang r.

• (f 0 (b1 ), . . . , f 0 (br )) est une base de Im(f 0 )
• Soient i1 , . . . , ir les indices tels que (xi1 , . . . , xir ) = (y1 , . . . , yr ).
(f (bi1 ), . . . , f (bir )) est une base de Im(f ).
24
Démonstration : La famille (f 0 (b1 ), . . . , f 0 (bn )) engendre Im(f ), car (b1 , . . . , bn ) en-

gendre E. Or tous ces vecteurs appartiennent au sous-espace de F , engendré par
(c1 , . . . , cr ). Donc Im(f 0 ) est de dimension au plus r. Pour montrer que le rang de f 0
est r et que (f 0 (b1 , . . . , f 0 (br )) est une base de Im(f ), il suffit de vérifier que c’est une
famille libre. Nous devons montrer
r
xi f 0 (bi ) = 0 =⇒ ( ∀i = 1, . . . , r , xi = 0 ) .
X
i=1
Utilisant les coordonnées dans la base (c1 , . . . , cm ), les xi doivent vérifier le système :
p1 x1 +a01,2 x2 + · · · + a01,r xr = 0



p2 x2 + · · · + a02,r xr = 0



(Hr0 ) .. ..


 . .

p r xr = 0

Nous devons montrer que ce système a pour unique solution x1 = · · · = xr = 0. C’est

une récurrence facile sur r. Si r = 1, le système se réduit à l’équation p1 x1 = 0, qui
a pour seule solution x1 = 0, car le pivot p1 est non nul. Supposons le résultat vrai
pour tout système du même type, de taille r − 1, et considérons la dernière équation
du système de taille r. Si elle est satisfaite, alors xr = 0, car le pivot pr est non nul.
En reportant xr = 0 dans les équations précédentes, on obtient un système du même
type, mais de taille r − 1 : la seule solution est x1 = · · · = xr−1 = 0, par l’hypothèse de
récurrence.
Les deux systèmes (H) et (H 0 ) ayant le même ensemble de solutions, les applications
f et f 0 ont le même noyau, et donc le même rang, d’après le théorème du rang 12. La
dimension de Im(f ) est donc r. Pour montrer qu’un ensemble de r vecteurs est une base,
il suffit de vérifier que c’est une famille libre. Inutile d’écrire le système en xi1 , . . . , xir
qui exprime que xi1 f (bi1 ) + · · · + xir f (bir ) = 0 : il se déduit de (H) en annulant les
variables autres que xi1 , . . . , xir . La chaîne de tranformations qui conduit de (H) à
(H 0 ) conduit forcément de ce nouveau système, au système (Hr0 ) ci-dessus. Les deux
systèmes ont le même ensemble de solutions, d’où le résultat.
La technique est beaucoup plus facile à appliquer qu’il n’y paraît. Considérons
l’application suivante, de R4 dans R3 :
f : (x, y, z, t) 7−→ (x + 2y + z + t, 2x + 4y + 3z + t, x + 2y + 2z) .
Sa matrice, relative aux bases canoniques de R4 au départ, et R3 à l’arrivée est :

 
1 2 1 1
A= 2 4 3 1 
 
1 2 2 0
25
Le système homogène permettant de déterminer Ker(f ) est :



 x +2y +z +t = 0
(H) 2x +4y +3z +t = 0


x +2y +2z = 0
⇐⇒


 x +2y +z +t = 0
L2 ← L2 − 2L1 z −t = 0
L3 ← L3 − L1 −t = 0


z
⇐⇒

 x +z +2y
 +t = 0
z −t = 0
y↔z
−t = 0


z
⇐⇒

 x +z +2y
 +t = 0
z −t = 0
L3 ← L3 − L2


0 = 0
Le système est de rang 2, il en est de même de l’application f . La mise sous forme
échelonnée montre que les colonnes de A correspondant aux variables x et z, à savoir
la première et la troisième, forment une famille libre, donc une base de Im(f ).
     

 1 1 

Im(f ) = λ  2  + µ  3 
  
 , λ, µ ∈ R .
 

1 2 
Nous avons écrit les vecteurs en colonnes, pour souligner le fait qu’il s’agit nécessaire-
ment de vecteurs colonnes de la matrice A.
Pour trouver une base de Ker(f ), il faut continuer la résolution.
(
x +z = −2y −t
(H) ⇐⇒
z = t
⇐⇒
(
x = −2y −2t
L1 ← L1 − L2
z = t.
L’ensemble des solutions est l’ensemble des quadruplets (−2y − 2t, y, t, t), où y et t sont
deux réels quelconques. Donc :
Ker(f ) = { y (−2, 1, 0, 0) + t (−2, 0, 1, 1) , y, t ∈ R } .
C’est un sous-espace de dimension 2 dans R4 .
26
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Parmi les sous-ensembles suivants de R3 , lesquels sont des sous-espaces
vectoriels, lesquels ne le sont pas et pourquoi ?
1. { (x, y, z) ∈ R3 , x = 0 }
2. { (x, y, z) ∈ R3 , x + y = 1 }
3. { (x, y, z) ∈ R3 , x = 0 et x + y + z = 0 }
4. { (x, y, z) ∈ R3 , x = 0 et x + y + z = 1 }
5. { (x, y, z) ∈ R3 , sin(x) = 0 }
6. { (x, y, z) ∈ R3 , x = y = z }
7. { (x, y, z) ∈ R3 , |x| = |y| = |z| }
8. { (x, y, z) ∈ R3 , x2 + y 2 + z 2 = 1 }
9. { (x, y, z) ∈ R3 , x2 + y 2 + z 2 = 0 }
1. L’intersection de deux sous-espaces vectoriels peut être vide.
2. Si un ensemble contient toutes les droites vectorielles engendrées par ses vec-
teurs, alors c’est un espace vectoriel.
3. Si un ensemble contient tous les plans vectoriels engendrés par deux de ses
vecteurs, alors c’est un espace vectoriel.
4. Si un ensemble contient toutes les combinaisons linéaires de 3 quelconques de
ses vecteurs, alors c’est un espace vectoriel.
5. Si un ensemble contient la somme de deux quelconques de ses vecteurs, c’est
un espace vectoriel.
Vrai-Faux 3. Parmi les familles suivantes de vecteurs de R3 , lesquelles sont génératrices,

lesquelles ne le sont pas, et pourquoi ?
1. ((1, 1, 0), (0, 1, 1))
2. ((0, 0, 1), (0, 1, 1), (1, 1, 1))
3. ((0, 1, −1), (1, 0, −1), (1, −1, 0))
4. ((1, 2, 3), (4, 5, 6), (7, 8, 9))
5. ((0, 0, 1), (0, 1, 1), (1, 1, 1), (1, 2, 1))
Vrai-Faux 4. Parmi les familles suivantes de vecteurs de R4 , lesquelles sont génératrices,

27
1. ((0, 1, −2, 1), (1, −1, 0, 3), (−2, 7, −10, −1))

2. ((0, 0, 0, 1), (0, 0, 1, 1), (0, 1, 1, 1), (1, 1, 1, 1))
3. ((1, 2, 3, 4), (5, 6, 7, 0), (8, 9, 0, 0), (1, 0, 0, 0))
4. ((0, 1, −1, 0), (1, 0, −1, 0), (1, −1, 0, 0), (0, 0, 0, 1))
5. ((1, 1, 1, 2), (1, 1, 2, 1), (1, 2, 1, 1), (2, 1, 1, 1))
Vrai-Faux 5. Parmi les familles suivantes de vecteurs de R3 , lesquelles sont libres,

1. ((1, 1, 0), (0, 1, 1))
2. ((1, 1, 0), (−1, −1, 0))
3. ((0, 0, 1), (0, 1, 1), (1, 1, 1))
4. ((0, 1, −1), (1, 0, −1), (1, −1, 0))
5. ((0, 0, 1), (0, 1, 1), (1, 1, 1), (1, 2, 1))
Vrai-Faux 6. Parmi les familles suivantes de vecteurs de R4 , lesquelles sont libres,

1. ((0, 1, −2, 1), (1, −1, 0, 3), (−2, 7, −10, −1))
2. ((0, 1, −2, 1), (1, −1, 0, 3), (−1, 4, −6, 0))
3. ((0, 0, 0, 1), (0, 0, 1, 1), (0, 1, 1, 1), (1, 1, 1, 1))
4. ((0, 1, −1, 0), (1, 0, −1, 0), (1, −1, 0, 0), (0, 0, 0, 1))
5. ((1, 1, 1, 2), (1, 1, 2, 1), (1, 2, 1, 1), (2, 1, 1, 1))
Vrai-Faux 7. Parmi les applications suivantes de R2 dans R2 , lesquelles sont des ap-
plications linéaires, lesquelles ne le sont pas et pourquoi ?
1. (x, y) 7→ (x, 0)
2. (x, y) 7→ (x, 1)
3. (x, y) 7→ (|x|, 0)
4. (x, y) 7→ (x + y, x − y)
5. (x, y) 7→ (y, x)
Vrai-Faux 8. Parmi les applications suivantes de R3 dans R3 , lesquelles sont des ap-
plications linéaires, lesquelles ne le sont pas et pourquoi ?
1. (x, y, z) 7→ (x, y, z − 1)
2. (x, y, z) 7→ (x + y, y + z, xz)
3. (x, y, z) 7→ (z, x, y)
4. (x, y, z) 7→ (0, 0, 0)
5. (x, y, z) 7→ (0, 0, 1)
28
Vrai-Faux 9. Soient E et F deux espaces vectoriels de dimension finie, et f une ap-

plication linéaire de E dans F . Parmi les affirmations suivantes, lesquelles sont vraies,
lesquelles sont fausses et pourquoi ?
1. L’image par f du vecteur nul de E est le vecteur nul de F .
2. L’image par f de E est un sous-espace vectoriel de F .
3. L’image par f d’une famille libre dans E est toujours une famille libre dans F .
4. L’image par f d’une famille liée dans E est toujours une famille liée dans F .
5. L’image par f d’une famille génératrice dans E est toujours une famille géné-
ratrice dans F .
6. Si dim(E) > dim(F ) alors Ker(f ) 6= {0}.
7. Si dim(E) > dim(F ) alors f est surjective.
8. Si dim(E) < dim(F ) alors f est injective.
9. Si f est bijective, alors dim(E) = dim(F )
Vrai-Faux 10. Soient E un espace vectoriel de dimension n, F un espace vectoriel de
dimension m et f une application linéaire de E dans F . On choisit une base (b1 , . . . , bn )
dans E, une base (c1 , . . . , cm ) dans F , et on note A la matrice de f relative à ces
bases. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses et
pourquoi ?
1. La matrice A est carrée si et seulement si m = n.
2. Les lignes de A sont les images des vecteurs c1 , . . . , cm .
3. Si toutes les colonnes de A sont non nulles, alors l’application f est injective.
4. Si toutes les colonnes de A sont proportionnelles au même vecteur de Rm , alors
le rang de f est 0 ou 1.
5. La j-ième colonne de A est nulle si et seulement si le vecteur bj appartient au
noyau de f .
6. Si une ligne de A est nulle, alors f n’est pas injective.
7. Si une ligne de A est nulle, alors le rang de f est strictement inférieur à m.
8. Si les colonnes de A forment une famille libre dans Rm , alors f est injective.
9. Si les lignes de A forment une famille génératrice de Rn , alors f est surjective.
10. Si les colonnes de A forment une famille génératrice de Rm , alors f est surjec-
tive.
2.2 Exercices
Exercice 1. Parmi les sous-ensembles suivants de R3 , lesquels sont des sous-espaces
vectoriels, lesquels n’en sont pas et pourquoi ?
a) {(x, y, z) ∈ R3 , |x| = |y| = |z|}
29
b) {(x, y, z) ∈ R3 , x = 0 ou y = 0}
c) {(x, y, z) ∈ R3 , x − 2y + 3z = 0}
d) {(x, y, z) ∈ R3 , x + y + z = 1}
e) {(x, y, z) ∈ R3 , x 6 y 6 z}
f) {(x, y, z), x = α + 2β + 3γ, y = 4α + 5β + 6γ, z = 7α + 8β + 9γ, où (α, β, γ) ∈ R3 }
Exercice 2. Donner une condition nécessaire et suffisante portant sur les paramètres
réels a et b pour que les familles suivantes soient des bases de R3 .
1. ((1, 1, 1), (0, a, 1), (0, 0, b))
2. ((1, 0, 1), (a, b, 1), (b, a, 1))
3. ((1, a, b), (a, 1, a), (b, b, 1))
4. ((a, a, b), (a, b, a), (b, a, a))
5. ((0, a, b), (a, 0, b), (a, b, 0))
Exercice 3. On considère les espaces vectoriels suivants.
E = {(x, y) ∈ R2 , x + y = 0} , E = {(x, y) ∈ R2 , x = y}
E = {(x, y, z) ∈ R3 , x + y + z = 0} , E = {(x, y, z) ∈ R3 , x = y = z}
1. Déterminer la dimension de E.
2. Donner une base de E.
Exercice 4. Compléter les familles suivantes de vecteurs de R3 en une base de R3 .
1. ((1, 1, 1))
2. ((1, 1, 0))
3. ((1, 1, 1), (1, −1, −1))
4. ((1, 1, 0), (1, −1, 0))
5. ((1, 1, 0), (1, 1, 1))
6. ((1, 1, 0), (1, −1, 1))
Exercice 5. On considère les applications suivantes de R2 dans R2 .
f : (x, y) 7→ (−x, −y) f : (x, y) 7→ (2x, 2y)

f : (x, y) 7→ (x, 0) f : (x, y) 7→ (x, x)
f : (x, y) 7→ (y, 0) f : (x, y) 7→ (y, y)
f : (x, y) 7→ (x + y, x − y) f : (x, y) 7→ (x − y, x + y)
Pour chacune de ces applications :

1. Vérifier que f est une application linéaire.
2. Donner une interprétation géométrique de f comme transformation du plan vec-
toriel, muni d’une base orthonormée (~ı, ~).
30
3. Déterminer Ker(f ) et Im(f ). L’application est-elle un automorphisme de R2 ?

4. Reprendre les deux questions précédentes pour l’application f − I, où f est l’ap-
plication considérée et I désigne l’application identique de R2 .
Exercice 6. On considère les applications linéaires suivantes.
f : R3 −→ R2
(x, y, z) 7−→ (2x − y, y − z)
g : R2 −→ R3
(x, y) 7−→ (x + y, x − y, 2x + 3y)
1. L’application f est elle injective ? surjective ?
2. L’application g est elle injective ? surjective ?
3. Déterminer g ◦ f . Est-elle injective ? surjective ?
4. Déterminer f ◦ g. Est-elle injective ? surjective ?
Exercice 7. Soient E, F et G des espaces vectoriels sur R. Soit f une application
linéaire de E dans F et g une application linéaire de F dans G.
1. Montrer que Ker(f ) ⊂ Ker(g ◦ f ).
2. Montrer que Im(g ◦ f ) ⊂ Im(g).
3. Montrer que g ◦ f est l’application nulle si et seulement si Im(f ) ⊂ Ker(g).
4. Montrer que g◦f est injective si et seulement si f est injective et Im(f )∩Ker(g) =
{0}.
5. Montrer que g ◦ f est surjective si et seulement si g(Im(f )) = G.
Exercice 8. Soit E un espace vectoriel de dimension n, et f un endomorphisme de E.
1. On suppose que f ◦ f est l’application nulle. Montrer que Im(f ) ⊂ Ker(f ).
2. On suppose que Ker(f ) = Im(f ). Montrer que n est nécessairement pair.
3. On suppose que f n’est pas l’application nulle et qu’il existe un entier k tel que
f ◦k (composée de f avec elle-même k fois) est l’application nulle (on dit que f
est nilpotente). Soit k0 le plus petit entier tel que f ◦k0 est l’application nulle.
Montrer qu’il existe un vecteur v ∈ E tel que f ◦(k0 −1) (v) 6= 0. Montrer que si
f ◦(k0 −1) (v) 6= 0, alors la famille de vecteurs (v, f (v), . . . , f ◦(k0 −1) ) est libre.
4. En déduire que si f est nilpotente, alors f ◦n est l’application nulle.
Exercice 9. Soit E un espace vectoriel de dimension finie n, muni d’une base
(b1 , . . . , bn ). Pour tout i = 1, . . . , n, on définit la i-ième application coordonnée Li
comme l’application de E dans R qui à v ∈ E associe le réel xi qui est la i-ième
coordonnée de v sur la base (b1 , . . . , bn ).
v = x 1 b1 + · · · + x i bi + · · · + x n bn
= L1 (v) b1 + · · · + Li (v) bi + · · · + Ln (v) bn .
31
1. Montrer que les Li sont des applications linéaires.

2. Montrer que le noyau de Li est un sous-espace vectoriel de dimension n − 1 de E
(hyperplan).
3. On prend E = R3 et :
b1 = (1, 0, −1) , b2 = (0, 2, 3) , b3 = (0, 0, 1) .
Montrer que (b1 , b2 , b3 ) est une base de E. Pour i = 1, 2, 3, déterminer l’image

par Li d’un vecteur v = (x, y, z) quelconque de R3 .
Exercice 10. Soient V et W deux sous-espaces vectoriels de R4 tels que V ∩ W = {0}.
1. On note V + W = {u ∈ R4 , u = v + w, v ∈ V, w ∈ W }. Montrez que V + W est
un sous-espace vectoriel de R4 .
2. Soit v un vecteur non nul de V , et {w1 , w2 } une famille libre de vecteurs de W .
a. Qu’implique l’existence de ces deux familles libres sur les dimensions de V et
W?
b. Montrez que la famille {v, w1 , w2 } est libre dans R4 .
3. On considère maintenant une famille libre de deux vecteurs {v1 , v2 } de V . Montrez
que {v1 , v2 , w1 , w2 } est une base de R4 .
Exercice 11. On considère les applications suivantes de R2 dans R2 .
f : (x, y) 7→ (−x, −y) f : (x, y) 7→ (2x, 2y)

f : (x, y) 7→ (x, 0) f : (x, y) 7→ (x, x)
f : (x, y) 7→ (y, 0) f : (x, y) 7→ (y, y)
f : (x, y) 7→ (x + y, x − y) f : (x, y) 7→ (x − y, x + y)
Déterminer la matrice de chacune de ces applications dans les bases suivantes de R2 .

1. ((1, 0), (0, 1)).
2. ((0, 1), (1, 0)).
3. ((0, 2), (−3, 0)).
4. ((0, 1), (1, 1)).
5. ((1, 1), (1, −1)).
Exercice 12. Pour tout entier n, on munit Rn de sa base canonique. Donner la matrice
de chacune des applications f suivantes. Déterminer une base de Im(f ) et une base de
Ker(f ).
1. f : R2 −→ R3 , (x, y) 7−→ f (x, y) = (x + y, x − y, 2x).
3 3
2. f : R −→ R , (x, y, z) 7−→ f (x, y, z) = (0, y − z, z − x).
3. f : R3 −→ R3 , (x, y, z) 7−→ f (x, y, z) = (x − y, y − z, z − x).
4 2
4. f : R −→ R , (x, y, z, t) 7−→ f (x, y, z, t) = (x + y + 2z − t, 2x + y + z + t).
32
5. f : R4 −→ R , (x, y, z, t) 7−→ f (x, y, z, t) = x − y + 2z + 3t.
Exercice 13. Pour chacune des familles de vecteurs suivantes, déterminer son rang et
donner une base de l’espace vectoriel qu’elle engendre.
1. ((1, 0, 1), (−1, 0, −1), (2, 0, 2))
2. ((1, 0, 1), (−1, 0, −1), (2, 0, 2), (0, 1, 0), (1, 1, 1), (1, −2, 1))
3. ((1, 0, 1), (−1, 0, −1), (2, 0, 2), (0, 1, 0), (1, 1, 1), (1, −2, −1))
4. ((1, 0, 1, 0), (−1, 0, −1, 0), (1, 1, 1, 1), (0, 1, 0, 1), (1, 2, 1, 2))
5. ((1, 0, 1, 0), (−1, 0, −1, 0), (1, 1, 1, 1), (0, 1, 0, 1), (1, 2, 1, 0))
6. ((1, 0, 1, 0), (−1, 0, −1, 0), (1, 1, 1, 0), (0, 1, 0, 1), (1, 2, 1, 0))
Exercice 14. On considère les matrices suivantes.

! ! !
1 0 0 1 2 −1 −1 2 3
0 1 0 2 −1 1 2 1 −3
     
1 0 0 1 0 0 −2 3 −4
 0 1 0   0 −1 0   3 1 −3 
   
 
0 0 1 0 0 2 1 −2 0
0 0 1 1 2 3 −1 −2 0
     

 0 1 0 


 3 2 1 


 2 1 0 

1 0 0 2 1 3 −2 0 1
     
     
1 1 1 1 3 2 0 −1 2
On considère les vecteurs suivants.
           
0 1 −1 2 −2 3
 1 
 
 1 
 
 0 
  
 −1 
  3 
  
 −1 

0 1 1 0 1 2
Calculer le produit de chacune des matrices par chacun des vecteurs.
2.3 QCM
rapporte 2 points.
Question 1. Soit E un espace vectoriel.

A Si un sous-ensemble de E contient la somme d’une famille finie quelconque de
ses éléments, alors c’est un espace vectoriel.
33
B Si un sous-ensemble de E est un espace vectoriel, alors il contient l’opposé de

tout vecteur de E.
C L’intersection de deux sous-espaces vectoriels de E est toujours un sous-espace
vectoriel de E.
D Si un sous-ensemble de E contient tous les plans vectoriels engendrés par deux
quelconques de ses vecteurs, alors c’est un sous-espace vectoriel de E.
E La réunion de deux sous-espaces vectoriels de E est toujours un sous-espace
vectoriel de E.
Question 2.
A L’ensemble { (x, y, z) , x2 + y 2 = 1 } est un sous-espace vectoriel de R3 .
B L’ensemble { (x, y, z) , x2 + y 2 = 0 } est un sous-espace vectoriel de R3 .
C L’ensemble { (x, y, z) , x2 = y 2 } est un sous-espace vectoriel de R3 .
D L’ensemble { (x, y, z) , x = y } est un sous-espace vectoriel de R3 .
E L’ensemble { (x, y, z) , x = y = 1 } est un sous-espace vectoriel de R3 .
Question 3. Dans R3 :
A ((0, 0, 1), (0, 1, 1), (1, 1, 1), (1, 2, 1)) est une famille génératrice.
B ((1, 1, 1), (0, 1, 1), (1, 0, 0), (1, 2, 2)) est une famille génératrice.
C ((1, 0, 1), (1, −1, 1), (2, 1, 2), (1, 2, 1)) est une famille génératrice.
D ((1, 0, 1), (1, −1, 1), (2, 1, 2), (1, 2, 0)) est une famille génératrice.
E ((0, 3, −2), (1, −1, 2), (2, 1, 2), (1, 2, 0)) est une famille génératrice.
A ((1, 0, 1), (1, −1, 1), (0, 1, 0)) est une famille libre.
B ((1, 0, 1), (1, −1, 1), (2, 1, 0)) est une famille libre.
C ((1, 0, 1), (1, −1, 1), (2, 1, 2)) est une famille libre.
D ((0, 3, −2), (1, −1, 1), (2, 1, 0)) est une famille libre.
E ((0, 3, −2), (1, −1, 1), (2, 1, 2)) est une famille libre.
A Toute famille libre de 4 vecteurs est une base.
B Si on ajoute un vecteur quelconque à une base, on obtient une famille généra-
trice.
C Si on ajoute un vecteur quelconque à une famille libre de trois vecteurs, on
obtient une base.
D Si une famille de vecteurs contient le vecteur nul, elle n’est pas génératrice.
E Toute famille de trois vecteurs non nuls est libre.
A Si une famille de 4 vecteurs est de rang 3, alors 2 au moins des vecteurs de la
famille sont colinéaires.
B Si une famille de 3 vecteurs est de rang 3, alors elle est libre.
34
C Si une famille de 3 vecteurs est de rang 1, alors tous ses vecteurs sont colinéaires
à un même vecteur.
D Si une famille de 5 vecteurs est de rang 4, alors toute sous-famille de 4 vecteurs
est une base.
E Si une famille de 3 vecteurs est de rang 2, alors on peut la compléter par un
vecteur de manière à obtenir une base.
Question 7.
A L’application de R3 dans R, qui à (x, y, z) associe |x + y + z| est linéaire.
B L’application de R3 dans R2 , qui à (x, y, z) associe (x, (y + z)2 ) est linéaire.
C L’application de R3 dans R, qui à (x, y, z) associe x + y + z est linéaire.
D L’application de R3 dans R2 , qui à (x, y, z) associe (x, y + z) est linéaire.
E L’application de R3 dans R2 , qui à (x, y, z) associe (x + y, (y + z)/(x + z)) est
linéaire.
Question 8. On considère l’application f , de R3 dans R2 , qui à (x, y, z) associe (x +
y, y + z).
A L’application f est injective.
B Le noyau de f est un plan vectoriel de R3 .
C L’application f est surjective.
D L’image de f est la droite vectorielle engendrée par le vecteur (1, 1).
E Le noyau de f est la droite vectorielle engendrée par le vecteur (1, −1, 1).
Question 9. Soit f une application linéaire de R3 dans R4 .
A Si le noyau de f est une droite vectorielle, alors l’image de f est un plan
vectoriel.
B Si le noyau de f est un plan vectoriel, alors l’image de f est un plan vectoriel.
C Si le noyau de f est réduit à {0}, alors f est surjective.
D Si f est injective, alors l’image de f est un sous-espace de dimension 3 dans
R4 .
E Si l’image de f est réduite à {0}, alors f est injective.
Question 10. Soit f l’application de R4 dans R3 dont la matrice relative aux bases
canoniques de R4 et R3 est la matrice A suivante.
 
1 2 1 0
A= 0 0 1 1  .
 
1 2 1 0
A L’application f est injective.

B L’image de f est engendrée par les vecteurs (1, 0, 1) et (1, 1, 1).
C Le noyau de f est un plan vectoriel.
D L’image de f est engendrée par les vecteurs (1, 0, 1) et (2, 0, 2).
35
E Le noyau de f est engendré par les vecteurs (−2, 0, 1, 0) et (1, 0, 1, 1).

Réponses : 1–CD 2–BD 3–AD 4–BE 5–AB 6–BC 7–CD 8–CE 9–AD 10–BC
2.4 Devoir
répondu.
Questions de cours : Soient E et F deux espaces vectoriels et f une application de
E dans F . Soit n un entier strictement positif, et (v1 , . . . , vn ) une famille de vecteurs
de E.
1. On suppose que (v1 , . . . , vn ) est génératrice. Soit v un vecteur quelconque de E.
Montrer que la famille (v1 , . . . , vn , v) est génératrice.
2. On suppose que (v1 , . . . , vn ) est libre. Montrer que la famille (v1 , . . . , vn−1 ) est
libre.
3. On suppose que f est surjective et que (v1 , . . . , vn ) est génératrice dans E. Montrer
que (f (v1 ), . . . , f (vn )) est génératrice dans F .
4. On suppose que f est injective et que (v1 , . . . , vn ) est libre dans E. Montrer que
(f (v1 ), . . . , f (vn )) est libre dans F .
5. On suppose que f est bijective. Montrer que (f (v1 ), . . . , f (vn )) est une base de
F si et seulement si (v1 , . . . , vn ) est une base de E.
Exercice : Soient a et b deux réels. On considère les trois vecteurs de R3 suivants.
v1 = (1, 0, a) , v2 = (a, 0, a) , v3 = (a, b, 1) .
On note :
• (e1 , e2 , e3 ) la base canonique de R3 : e1 = (1, 0, 0), e2 = (0, 1, 0), e3 = (0, 0, 1).
• f l’application linéaire de R3 dans R3 qui à e1 associe v1 , à e2 associe v2 et à e3
associe v3 .
1. Montrer que (v1 , v2 , v3 ) est une base de R3 si et seulement si ab(a − 1) 6= 0.
2. Écrire en fonction de a et b la matrice de f dans la base canonique (e1 , e2 , e3 ).
3. Pour a = 0, montrer que les deux vecteurs v1 et v3 forment une famille libre.
4. Pour a = 0, montrer que le noyau de f est la droite vectorielle engendrée par e2 .
5. Pour a = 0, donner une base de Im(f ).
6. Pour a = 0, vérifier que f ◦ f = f .
7. Pour a = 0, montrer que (e2 , v1 , v3 ) est une base de R3 . Écrire la matrice de f
dans la base (e2 , v1 , v3 ).
36
8. Pour a 6= 1 et b = 0, montrer que Ker(f ) est une droite vectorielle, dont on

donnera un vecteur directeur fonction de a.
9. Pour a2 6= 1 et b = 0, montrer que Im(f ) est le plan vectoriel engendré par v1 et
v3 .
10. Pour a = 1 et b = 0, donner une base de Im(f ) et une base de Ker(f ).
11. Pour a = 1 et b = 0, vérifier que la réunion des deux bases de la question
précédente forme une base de R3 et donner la matrice de f dans cette nouvelle
base.
12. Pour a = −1, b = 1, montrer que l’application f est bijective.
13. On considère l’application g qui à e1 associe e1 − e2 , à e2 associe 2(e1 + e3 ), et à
e3 associe −e1 − e2 . Ecrire la matrice de g dans la base (e1 , e2 , e3 ).
14. Pour a = −1, b = 1, écrire la matrice de l’application g ◦ f . En déduire la matrice
de l’application réciproque f −1 dans la base (e1 , e2 , e3 ).
15. Pour a = −1, b = 1, donner la matrice de l’application f dans la base (v1 , v2 , v3 ).

1. Si (v1 , . . . , vn ) est génératrice, alors tout vecteur w de E est combinaison linéaire
des vi :
∀w ∈ E , ∃λ1 , . . . , λn ∈ R , w = λ1 v1 + · · · + λn vn .
Soit v un vecteur donné de E. Le vecteur w s’écrit :
w = λ1 v1 + · · · + λn vn + 0v .
La famille (v1 , . . . , vn , v) est donc génératrice.

2. Soient λ1 , . . . , λn−1 des réels tels que :
λ1 v1 + · · · + λn−1 vn−1 = 0 .
Alors :
λ1 v1 + · · · + λn−1 vn−1 + 0vn = 0 .
Si la famille (v1 , . . . , vn ) est libre, cela implique :
λ1 = . . . = λn−1 = 0 .
Donc la famille (v1 , . . . , vn−1 ) est aussi libre.
37
3. Soit w un vecteur quelconque de F . Puisque f est surjective, il existe v ∈ E tel

que w = f (v). Si la famille (v1 , . . . , vn ) est génératrice, il existe n réels λ1 , . . . , λn
tels que :
v = λ1 v1 + · · · + λn vn .
Comme f est linéaire, on peut écrire :
w = f (v) = λ1 f (v1 ) + · · · + λn f (vn ) .
Donc (f (v1 ), . . . , f (vn )) est génératrice dans F .

4. Soient λ1 , . . . , λn des réels tels que :
λ1 f (v1 ) + · · · + λn f (vn ) = 0 .
Puisque f est linéaire :
f (λ1 v1 + · · · + λn vn ) = 0 .
Si f est injective, le seul vecteur d’image nulle est le vecteur nul. Donc :
λ1 v1 + · · · + λn vn = 0 .
Puisque la famille (v1 , . . . , vn ) est libre, ceci entraîne :
λ1 = · · · = λn = 0 .
Donc la famille (f (v1 ), . . . , f (vn )) est libre.

5. Si f est bijective, elle est à la fois injective et surjective. Si (v1 , . . . , vn ) est une base
de E, elle est à la fois génératrice et libre. Donc (f (v1 , . . . , f (vn )) est génératrice
et libre, par application des deux questions précédentes : c’est une base de F .
Montrons maintenant la réciproque. Si f est bijective, l’application réciproque
f −1 est elle aussi linéaire et bijective. Si (f (v1 ), . . . , f (vn )) est une base de F , alors
(f −1 (f (v1 )), . . . , f −1 (f (vn ))) = (v1 , . . . , vn ) est une base de E, en appliquant ce
qui précède à f −1 .
Exercice :
1. Dans R3 une famille de trois vecteurs est une base si et seulement si c’est une
famille libre. Soient α, β, γ trois réels. Supposons αv1 + βv2 + γv3 = 0. Dans la
base (e1 , e2 , e3 ), ce vecteur s’écrit :

α + aβ + aγ , bγ , aα + aβ + γ = (0, 0, 0) .
Donc α, β, γ sont solution du système linéaire :



 α +aβ +aγ = 0
bγ = 0


aα +aβ +γ = 0 .
38
La famille (v1 , v2 , v3 ) est une base de R3 si et seulement si ce système a pour

solution unique (0, 0, 0). Échangeons les équations 2 et 3, puis soustrayons la
première équation multipliée par a de la seconde. Le système est équivalent à :


 α +aβ +aγ = 0
a(a − 1)β +(1 − a2 )γ = 0


bγ = 0 .
Ce système a pour solution unique (0, 0, 0) si et seulement si il est de rang 3.

C’est le cas si les 3 pivots sont non nuls : a(a − 1) 6= 0 et b 6= 0, soit ab(a − 1) 6= 0.
Réciproquement, si b = 0 la troisième équation s’annule, si a = 1 la seconde
équation s’annule, et si a = 0, les équations 2 et 3 sont proportionnelles : dans
les 3 cas, le système est de rang au plus 2.
2. La matrice de f dans la base canonique est :
 
1 a a
 0 0 b  .
 
a a 1
3. Soient α et β deux réels tels que αv1 + βv3 = 0. Pour a = 0, ce vecteur s’écrit
(α, bβ, β). Il est nul si et seulement si α = β = 0 Donc (v1 , v3 ) est une famille
libre.
4. Pour a = 0, f (e2 ) = v2 = 0. Donc tout vecteur multiple de e2 appartient au
noyau de f . La droite vectorielle engendrée par e2 est donc incluse dans le noyau
de f . Pour montrer qu’elle est égale, il suffit de montrer que le noyau de f est de
dimension 1. Pour cela, considérons les vecteurs v1 et v3 . Par définition, ce sont
deux vecteurs de l’image de f . Or ils forment une famille libre d’après la question
précédente. L’image de f contient deux vecteurs linéairement indépendants, donc
elle est de dimension au moins 2. Par le théorème du rang, la dimension du noyau
est au plus 3 − 2 = 1. Comme le noyau contient la droite engendrée par e2 , il est
de dimension 1.
5. Puisque le noyau est de dimension 1, l’image est de dimension 2, par le théorème
du rang. Les vecteurs v1 et v3 forment une famille libre, donc (v1 , v3 ) est une base
de Im(f ).
6. Puisque f est linéaire, il suffit de vérifier la relation demandée sur les éléments
d’une base, par exemple la base canonique. Pour e1 et e2 , c’est évident puisque
f (e1 ) = e1 et f (e2 ) = 0. Pour e3 :
f (f (e3 )) = f (be2 + e3 ) = bf (e2 ) + f (e3 ) = f (e3 ) .
7. Il suffit de montrer que c’est une famille libre. Soient α, β, γ trois réels tels que
αe2 + βv1 + γv3 = 0. Dans la base canonique de R3 , les coordonnées de ce
vecteur sont (β, α + bγ, γ). Les trois coordonnées sont nulles si et seulement si
39
α = β = γ = 0. Donc la famille (e2 , v1 , v3 ) est une base de R3 . On sait que :

f (e2 ) = 0, f (v1 ) = f ◦ f (e1 ) = f (e1 ) = v1 et f (v3 ) = f ◦ f (e3 ) = f (e3 ) = v3 . La
matrice de f dans la base (e2 , v1 , v3 ) est donc la suivante.
 
0 0 0
 0 1 0  .
 
0 0 1
8. Soit v un vecteur de Ker(f ) : ses coordonnées (x, y, z) sont solution du système :

(
x +ay +az = 0
ax +ay +z = 0 .
Ce système équivaut au suivant.

(
x +ay +az = 0
(a − a )y +(1 − a2 )z = 0 .
2
Pour a = 0, l’ensemble des solutions est la droite vectorielle engendrée par e2

(question 4). Pour a différent de 0 et 1, le système se résout en fonction de z :
(
x = z
y = − 1+a
a
z.
L’ensemble de solutions est le suivant.

1+a

z, − z, z , z ∈ R .
a

Le vecteur 1, − 1+a
a
, 1 est donc une base de Ker(f ).
9. Pour a 6= 1 et b = 0, nous avons vu que Ker(f ) est une droite vectorielle. D’après
le théorème du rang, Im(f ) est de dimension 2 : c’est un plan vectoriel. Par défi-
nition de f , v1 et v3 appartiennent à Im(f ). Pour montrer que ces deux vecteurs
forment une base de Im(f ), il suffit de vérifier que (v1 , v3 ) est une famille libre.
Soient α et β deux réels tels que αv1 + βv3 = 0. Les coordonnées de ce vecteur
sont : (α + aβ, 0, aα + β). Elles s’annulent si et seulement si :
(
α +aβ = 0
aα +β = 0 .
Sous forme échelonnée :

(
α +aβ = 0
(1 − a2 )β = 0 .
Pour a2 6= 1, ce système est de rang 2 : il a pour seule solution α = β = 0. D’où

le résultat.
40
10. Pour a = 1 et b = 0, v1 = v2 = v3 = (1, 0, 1). Donc pour tout vecteur v =

xe1 + ye2 + ze3 de R3 , f (v) = (x + y + z)v1 . Donc Im(f ) est la droite vectorielle
engendrée par le vecteur v1 = (1, 0, 1). La même expression montre que Ker(f )
est le plan vectoriel d’équation x + y + z = 0, à savoir :

(−y − z, y, z) , y, z ∈ R .
Une base de Ker(f ) est donc :

(−1, 1, 0), (−1, 0, 1) .
11. Notons w2 = (−1, 1, 0) et w3 = (−1, 0, 1). Pour montrer que (v1 , w2 , w3 ) est une
base de R2 , il suffit de montrer que c’est une famille libre. Soient α, β, γ trois
réels tels que αv1 + βw2 + γw3 = 0. Ces trois réels sont solution du système :


 α −β −γ = 0
β = 0


α +γ = 0 .
On vérifie immédiatement que ce système est de rang 3 : il a pour seule solution

α = β = γ = 0.
La matrice de f dans la base (v1 , w2 , w3 ) est la suivante.
 
2 0 0
 0 0 0  .
 
0 0 0
12. Pour montrer que l’application f est bijective, il suffit de vérifier que l’image par
f de la base canonique est une base, c’est-à-dire que les trois vecteurs (v1 , v2 , v3 )
forment une base de R3 . Pour cela, il suffit de montrer que c’est une famille libre.
Soient α, β, γ trois réels tels que αv1 +βv2 +γv3 = 0 : ils sont solution du système :


 α −β −γ = 0
γ = 0
−α −β +γ = 0 .


On vérifie immédiatement que ce système est de rang 3 : il a pour seule solution

α = β = γ = 0.
13. La matrice de g dans la base (e1 , e2 , e3 ) est la suivante.
 
1 2 −1
 −1 0 −1  .
 
0 2 0
41
14. Pour écrire la matrice de l’application g ◦ f , on peut soit calculer les coordonnées
des trois vecteurs g(v1 ), g(v2 ), g(v3 ), ce qui revient à effectuer le produit de la
matrice de g par chacune des colonnes de la matrice de f .
 
1 −1 −1

 0 0 1 

  
−1 −1 1
1 2 −1 2 0 0

 −1 0 −1  
  0 2 0 

0 2 0 0 0 2
On constate que g ◦ f est le double de l’application identique. La matrice de

l’application réciproque f −1 dans la base (e1 , e2 , e3 ) est donc le produit par 1/2
de la matrice de g.  
1/2 1 −1/2
 −1/2 0 −1/2  .
 
0 1 0
15. Nous devons calculer f (v1 ), f (v2 ) et f (v3 ) en fonction de v1 , v2 et v3 . Or pour
i = 1, 2, 3, f (vi ) = f (f (ei )) = f (f (f −1 (vi ))). Notons A la matrice de f et A−1
celle de f −1 (calculée à la question précédente). Ce qui précède montre que la
matrice de f dans la base (v1 , v2 , v3 ) est le produit matriciel (colonnes par colonne)
de A par le produit de A par A−1 . Or A(AA−1 ) = A. Donc la matrice de f dans
la base (v1 , v2 , v3 ) est la même que dans la base (e1 , e2 , e3 ).
42
3 Compléments
3.1 La vérité est éternelle et divine
Je reste parfaitement confiant dans le fait que le travail que j’ai investi
dans la science présentée ici, et qui a pris une partie significative de ma
vie autant que l’application la plus acharnée de mes capacités, ne sera pas
perdu. Il est vrai que je suis conscient que la forme que j’ai donnée à cette
science est imparfaite et ne peut que l’être. Mais je sais, et je me sens obligé
d’affirmer (au risque de paraître arrogant) que même si ce travail devait
encore rester inutilisé pour encore 17 ans ou même plus, sans entrer dans le
véritable développement de la science, viendra tout de même un jour où il
sera tiré de la poussière de l’oubli, et où des idées actuellement en sommeil
porteront leurs fruits. Je sais aussi que je n’ai pas (comme je l’ai désiré
jusqu’ici en vain) attiré autour de moi un cercle de disciples, à qui j’aurais
pu transmettre ces idées, et que je pourrais stimuler pour les développer et
les enrichir encore ; pourtant viendra un jour où ces idées, peut-être dans
une forme nouvelle, renaîtront et entreront dans une communication vivante
avec les développements contemporains. Car la vérité est éternelle et divine.
Qui donc est à la fois si amer et si sûr de sa postérité ? Hermann Grassmann (1809–
1877) 1 . Et cette « vérité éternelle et divine » ? Rien moins que l’algèbre linéaire, dont
les fondements vous ont été présentés dans ce chapitre, et qui accompagnera encore
longtemps vos études de mathématiques ! Quand il écrit cela en 1862, plus de 17 ans
se sont effectivement écoulés depuis une première publication de sa « théorie de l’ex-
tension » (Ausdehnunglehre). Elle n’a pas vraiment été vraiment comprise, ni même
examinée à fond, par ses contemporains. Pourtant, on trouve dans le mémoire de 1862
les combinaisons linéaires, l’indépendance, les sous-espaces engendrés, la démonstra-
tion du fait que la dimension est indépendante de la base, les sommes de sous-espaces
vectoriels, bref, l’essentiel de ce chapitre.
Tout au long de sa carrière, Grassmann aura manqué de réussite ; il n’obtiendra jamais
de poste universitaire, et malgré ses nombreuses contributions en mathématiques et
en physique, il ne sera reconnu comme docteur que par ses études en langues. Comble
de malchance, même son travail pionnier sur les espaces vectoriels sera obscurci par
une querelle de priorité. En 1845, un an après Grassmann, Adhémar Jean Claude
Barré de Saint-Venant publie indépendamment un article sur le calcul vectoriel, dont
le contenu est proche de celui de Grassmann. Grassmann en ayant pris connaissance
en 1847, il écrit un courrier en joignant son propre article. Mais n’ayant pas l’adresse
de Saint-Venant, il adresse le courrier à Cauchy, en lui demandant de transmettre,
ce que Cauchy se garde bien de faire. Six ans ans plus tard, Cauchy publie dans les
Comptes Rendus de l’Académie de Sciences « Sur les clefs algébriques ». Grassmann
1. D. Fearnley-Sander : Hermann Grassmann and the creation of linear algebra American Mathe-
matical Monthly 86, p. 809–817 (1979)
43
réagit : « Je réalisai immédiatement que les principes qui y étaient établis et les résultats
qui étaient démontrés étaient exactement les mêmes que ceux que j’avais publiés en
1844, et desquels j’avais donné en même temps de nombreuses applications à l’analysie
algébrique, la géométrie, la mécanique et d’autres branches de la physique ». Un comité
de trois membres de l’Académie des Sciences fut chargé de trancher la question de
priorité, mais ne publia jamais ses conclusions. Vous l’avez deviné : Cauchy était l’un
des trois.
3.2 Application linéaire tangente

La tangente au graphe d’une fonction en un point est une droite passant par ce
point, dont la pente est la dérivée. Pour une application dérivable en a, on peut écrire :
f (a + h) = f (a) + f 0 (a) h + o(h) , (3)
où o(h) désigne une fonction telle que o(h)/h tend vers 0 quand h tend vers 0. Imaginons
que l’on souhaite approcher f au voisinage de a (pour une valeur de h petite), sans
savoir calculer f (a + h). On peut remplacer f (a + h) − f (a) par f 0 (a) h, et l’erreur
commise est négligeable devant h. Dans (3), une application linéaire de R dans R
apparaît : l’application h 7→ f 0 (a) h.
Ceci se généralise à des applications de Rn dans Rm , avec n et m quelconques.
L’application h 7→ f (a) h devient une application linéaire de Rn dans Rm : l’application
linéaire tangente. Pour ne pas compliquer les notations, nous prendrons l’exemple d’une
application de R3 dans R2
R3 −→ R2
(x, y, z) 7−→ (f (x, y, z), g(x, y, z))
Ce pourrait être par exemple l’application qui aux trois dimensions d’un parallélépipède
associe sa surface et son volume.
R3 −→ R2
(x, y, z) 7−→ (2xy + 2xz + 2yz, xyz)
Les applications f et g, de R3 dans R, sont les applications coordonnées. Si on fixe un

point (a, b, c) dans l’espace de départ, on définit 6 applications partielles.
x 7→ f (x, b, c)
y 7 → f (a, y, c)
z 7 → f (a, b, z)
x 7 → g(x, b, c)
y 7 → g(a, y, c)
z 7 → g(a, b, z)
44
Nous commençons par une application f , de R3 dans R. Si les applications partielles

sont dérivables, leurs dérivées s’appellent les dérivées partielles en (a, b, c).
∂f df (x, b, c)
(a, b, c) = (a)
∂x dx
∂f df (a, y, c)
(a, b, c) = (b)
∂y dy
∂f df (a, b, z)
(a, b, c) = (c)
∂z dz
Pour calculer la dérivée partielle de f par rapport à x, il suffit de dériver en x l’expres-
sion de f , en traitant les autres variables comme des constantes paramétriques.
Supposons par exemple que f soit l’application qui à (x, y, z) associe la surface du
parallélépipède dont les longueurs d’arêtes sont x, y, z.
R3 −→ R
(x, y, z) 7−→ 2(xy + yz + xz)
Voici ses trois dérivées partielles.

∂f
(a, b, c) = 2(b + c)
∂x
∂f
(a, b, c) = 2(a + c)
∂y
∂f
(a, b, c) = 2(a + b)
∂z
Si elles sont continues, les dérivées partielles permettent d’approcher la fonction par
une application linéaire au voisinage d’un point. Le résultat qui suit est l’analogue pour
les fonctions de plusieurs variables du théorème des accroissements finis.
Théorème 14. Soit, f : (x, y, z) 7→ f (x, y, z) une application continûment différen-

tiable de R3 dans R et (a, b, c) un point de R3 . Notons o(x, y, z) la fonction définie
par :
∂f ∂f ∂f
f (x, y, z) = f (a, b, c)+(x−a) (a, b, c)+(y−b) (a, b, c)+(z−c) (a, b, c)+o(x, y, z) .
∂x ∂y ∂z
Alors :
o(x, y, z)
lim =0.
(x,y,z)→(a,b,c) max{|x − a|, |y − b|, |z − c|}
Ce théorème dit que les variations de la fonction f autour du point (a, b, c) peuvent
être approchées par une application linéaire, la différentielle de f .
45
Définition 15. On appelle différentielle de f au point (a, b, c) l’application linéaire de

R3 dans R qui à (hx , hy , hz ) associe :
∂f ∂f ∂f
hx (a, b, c) + hy (a, b, c) + hz (a, b, c) .
∂x ∂y ∂z
En physique, on interprète hx , hy et hz comme des petites variations des variables
x, y, et z, et on les note plutôt dx, dy et dz. Si on note df la différentielle de f , ceci
justifie l’écriture abrégée suivante.
∂f ∂f ∂f
df = dx + dy + dz .
∂x ∂y ∂z
La différentielle est plus facile à visualiser en dimension 2. Pour une fonction de deux
variables, le théorème 14 donne une approximation de f (x, y) sous la forme :
∂f ∂f
f (x, y) = f (a, b) + (x − a) (a, b) + (y − b) (a, b) + o(x, y) .
∂x ∂y
La surface d’équation z = f (a, b) + (x − a) ∂f

∂x
(a, b) + (y − b) ∂f
∂y
(a, b) est celle du plan
tangent à la surface z = f (x, y) au point (a, b) (cf. figure 3). Pour rappeler cette
interprétation géométrique, la différentielle de f au point (a, b) porte aussi le nom
d’application linéaire tangente.
f(a,b)
(a,b)
x
Figure 3 – Plan tangent à une surface en un point.
Une application de Rn dans Rm est continûment différentiable si ses m applica-

tions coordonnées le sont. On peut donc lui appliquer, coordonnée par coordonnée, le
théorème 14. La différentielle en un point de Rn est une application linéaire de Rn
dans Rm . Sa matrice est la matrice jacobienne. Ici encore nous donnons la définition
en dimension réduite pour des raisons de clarté.
46
Définition 16. Soit Φ une application de R3 dans R2 .

D −→ R2
Φ :
(x, y, z) 7−→ (f (x, y, z), g(x, y, z))
Soit (a, b, c) un point de R3 . On appelle matrice jacobienne de Φ au point (a, b, c), la
matrice des dérivées partielles de f et g :
∂f ∂f ∂f
 
∂x ∂y ∂z
 
M J(Φ)(a, b, c) =   (a, b, c)
 
 ∂g ∂g ∂g 
∂x ∂y ∂z
On appelle différentielle de Φ au point (a, b, c) l’application linéaire de R3 dans R2 dont
la matrice dans les bases canoniques de R3 et R2 est la matrice jacobienne.
Voici la matrice jacobienne au point (a, b, c) pour la surface et le volume d’un
parallélépipède en fonction de ses trois dimensions.
!
2(b + c) 2(a + c) 2(a + b)
MJ = .
bc ac ab
3.3 Dualité
D’après le théorème 9, une combinaison linéaire d’applications linéaires est encore
une application linéaire. Donc l’ensemble des applications linéaires de E dans F est un
espace vectoriel. L’espace des applications linéaires de E dans R joue un rôle important
autant en algèbre qu’en analyse : on l’appelle l’espace dual, et on le note E ∗ .
Une application linéaire de E dans R s’appelle une forme linéaire. Plaçons-nous
d’abord en dimension finie : E est un espace vectoriel de dimension n. Sauf si celle-ci
est nulle, l’image d’une forme linéaire est R, et son rang est donc 1. D’après le théorème
du rang (théorème 12), la dimension du noyau est n − 1. Le noyau d’une forme linéaire
s’appelle un hyperplan (un plan ordinaire si E est de dimension 3).
Munissons E d’une base, (b1 , . . . , bn ). Parmi les formes linéaires définies sur E,
les applications coordonnées jouent un rôle particulier. Nous les notons b∗1 , . . . , b∗n . Pour
tout i = 1, . . . , n, b∗i est l’application qui à un vecteur de E associe sa i-ième coordonnée
dans la base (b1 , . . . , bn ).
b∗i : v = x1 b1 + · · · + xi bi + · · · + xn bn 7−→ b∗i (v) = xi .
Théorème 15. La famille (b∗1 , . . . , b∗n ) est une base de E ∗ .
En conséquence, l’espace vectoriel E et son dual E ∗ ont la même dimension.
Démonstration : Montrons d’abord que la famille (b∗1 , . . . , b∗n ) est libre. Supposons que
la forme linéaire
v ∗ = λ∗1 b∗1 + · · · + λ∗n b∗n
47
est nulle, c’est-à-dire que l’image qu’elle donne de tout vecteur est 0. En particulier
l’image qu’elle donne du vecteur bi est nulle. Or,
b∗i (bi ) = 1 et b∗j (bi ) = 0 , ∀j 6= i .
Donc v ∗ (bi ) = λ∗i = 0. La forme v ∗ ne peut être nulle que si tous les λ∗i sont nuls.
Montrons maintenant que la famille (b∗1 , . . . , b∗n ) est génératrice. Soit v ∗ une forme
linéaire quelconque. D’après la proposition 8, v ∗ est déterminée par les images qu’elle
donne aux vecteurs de la base (b1 , . . . , bn ). Notons λ∗1 , . . . , λ∗n ces images :
∀i = 1, . . . , n , v ∗ (bi ) = λ∗i ∈ R .
On vérifie facilement que v ∗ est combinaison linéaire des b∗i :
v ∗ = λ∗1 b∗1 + · · · + λ∗n b∗n .

Le mot « dual » évoque une certaine symétrie entre E et E ∗ : tout se passe comme
si E ∗ était une image miroir de E. On note traditionnellement par h· , ·i le crochet de
dualité, à savoir l’image d’un vecteur par une forme linéaire :
hv ∗ , vi = v ∗ (v) ∈ R .
Le crochet de dualité est linéaire par rapport à chacun des arguments.
hv ∗ , λ v1 + µv2 i = λhv ∗ , v1 i + µhv ∗ , v2 i

hλ∗ v1∗ + µ∗ v2∗ , vi = λ∗ hv1∗ , vi + µ∗ hv2∗ , vi .
Le résultat suivant illustre l’aspect miroir de la dualité.

E dans F . Il existe une application linéaire unique f ∗ , de F ∗ vers E ∗ , telle que pour
tout v ∈ E et pour tout w∗ ∈ F ∗ ,
hw∗ , f (v)i = hf ∗ (w∗ ) , vi .
Soit (b1 , . . . , bn ) une base de E, (c1 , . . . , cm ) une base de F , et
A = (ai,j ) , i = 1, . . . , m , j = 1, . . . , n ,
la matrice de f dans ces bases. Alors la matrice de f ∗ dans les bases (c∗1 , . . . , c∗m ) (au
départ) et (b∗1 , . . . , b∗n ) (à l’arrivée) est la transposée de la matrice A, à savoir la matrice
à n lignes et m colonnes :
t
A = (aj,i ) , j = 1, . . . , n , i = 1, . . . , m .
48
Par exemple :
 
1 1 !
t 1 2 1
A= 2 3  , A= .

1 3 −1

1 −1
Démonstration : La double linéarité du crochet de dualité permet de travailler unique-

ment sur les images des vecteurs de bases. Soit i un indice entre 1 et m et j un indice
entre 1 et n. n
hc∗i , f (bj )i = hc∗i ,
X
ai0 ,j ci0 i = ai,j ,
i0 =1
par définition de la base duale (c∗1 , . . . , c∗m ). Notons (a∗j,i )j=1,...,n,i=1,...,m la matrice de
l’application f ∗ . On a de même :
m
hf ∗ (c∗i ) , bj i = h a∗j 0 ,i b∗j 0 , bj i = a∗j,i ,
X
j 0 =1
et donc nécessairement ai,j = a∗j,i , car hc∗i , f (bj )i = hf ∗ (c∗i ) , bj i.

La relation hw∗ , f (v)i = hf ∗ (w∗ ) , vi étant vérifiée pour v = bj et w∗ = c∗i , elle est
vraie pour tous v ∈ E et w∗ ∈ F ∗ , par la double linéarité. D’où l’existence. L’application
f est unique car elle est déterminée par sa matrice.

La notion de dualité prend toute sa puissance en dimension infinie pour les espaces
de fonctions, quand on y ajoute une notion de continuité que nous n’expliciterons pas.
Le dual d’un espace de fonctions est l’ensemble des formes linéaires continues définies
sur cet espace.
Comme premier exemple, notons C0 ([0, 1]) l’espace vectoriel des fonctions continues
sur l’intervalle [0, 1]. Voici une forme linéaire définie sur C0 ([0, 1])
Z 1
f ∈ C0 ([0, 1]) 7−→ f (x) dx .
0
Soit g un élément quelconque de C0 ([0, 1]). L’application

Z 1
f ∈ C0 ([0, 1]) 7−→ f (x) g(x) dx ,
0
est encore une forme linéaire sur C0 ([0, 1]). Il y en a beaucoup d’autres : le dual de
C0 ([0, 1]) est l’espace des mesures de Radon sur [0, 1].
En dimension infinie, les duaux ont la propriété de s’emboîter à l’inverse des espaces
fonctionnels dont ils sont issus. Par exemple l’espace C1 ([0, 1]) des fonctions continues
sur [0, 1] et dérivables sur ]0, 1[ est inclus dans C0 ([0, 1]). Son dual contient le dual de
C0 ([0, 1]). Pour fabriquer un très gros espace vectoriel, qui englobe les fonctions, les
mesures, et bien d’autres objets utiles, il faut prendre le dual d’un espace fonctionnel
49
très petit. En novembre 1944, au cours de ce qu’il décrit comme « la plus belle nuit de
sa vie » dans ses mémoires, Laurent Schwartz a eu l’idée de prendre le dual de l’espace
des fonctions indéfiniment dérivables, nulles en dehors d’un intervalle fermé et borné :
b
C∞ . Les objets de ce dual généralisent à la fois les fonctions et les mesures : ce sont les
distributions.
Un des miracles des distributions est la possibilité de les dériver à volonté, par la
formule « miroir » :
∀φ ∈ C∞b
, hf , φ0 i = −hf 0 , φi .
Prenons pour f la fonction de Heaviside :
(
0 si x < 0
f; x 7−→
1 si x > 0
Cette fonction s’identifie à la forme linéaire

Z Z +∞
φ 7−→ hf , φi = φ(x)f (x) dx = f (x) dx .
R 0
Sa dérivée au sens des distributions est la masse de Dirac en 0, à savoir la forme linéaire
δ0 , définie par :
δ0 : φ 7−→ hδ0 φi = φ(0) .
Ceci n’a pas surpris les physiciens, qui depuis un quart de siècle ne se privaient pas de
dériver la fonction de Heaviside (et d’autres) chaque fois qu’ils en avaient besoin. . .
3.4 Codes de Hamming

Le plus petit corps de nombres, celui des entiers modulo 2, ne contient que 0 et
1. On le note Z/2Z. Sur l’ensemble des n-uplets de 0 ou de 1, les opérations de Z/2Z
agissent composante par composante. Par exemple pour n = 4 :
(0, 1, 0, 1) + (1, 0, 0, 1) = (1, 1, 0, 0) .
Cet ensemble, noté (Z/2Z)n , est un espace vectoriel sur Z/2Z, tout comme Rn est un
espace vectoriel sur R.
Deux éléments de (Z/2Z)n qui diffèrent en une seule coordonnée sont dits voisins.
Si on met une arête entre deux n-uplets voisins, on obtient un graphe, que l’on appelle
l’hypercube de dimension n. Pourquoi hypercube ? La figure 4 devrait vous convaincre.
L’espace vectoriel (Z/2Z)n est-il une fantaisie de mathématicien ? Pas du tout ! Les
ordinateurs ne connaissent que les 0 et les 1 (les bits), rangés en mémoire par n-uplets,
avec n = 8 (les octets ou bytes), n = 16, n = 32, n = 64, . . . Ils peuvent représenter
n’importe quel ensemble fini, pourvu que l’on ait choisi au préalable une application
50
011 111
001 101
010 110
000 100
Figure 4 – Cube en dimension 3. Chaque arête joint deux triplets qui diffèrent par
une seule coordonnée.
injective de cet ensemble dans (Z/2Z)n pour un certain n. Cette application s’appelle
un code. Le plus connu est le code ASCII standard qui associe 64 caractères (chiffres,
lettres, $, %, /, . . . ) aux éléments de (Z/2Z)6 .
Les transmissions entre ordinateurs, que ce soit par câble, par ondes radio ou infra-
rouges, sont des échanges de signaux composés de paquets de 0 et de 1, qui ont été
codés par l’émetteur et seront décodés par le récepteur. Mais si dans un paquet une
erreur est commise (un 0 est changé en 1 ou le contraire), alors le paquet entier, et
peut-être tout le message, seront perdus. A moins que l’on utilise un code correcteur
d’erreurs.
Un code est « correcteur d’erreurs » si parmi les voisins dans l’hypercube d’un
élément codé, on ne trouve jamais ni un autre élément codé, ni l’un de ses voisins. De
cette façon, si un n-uplet est reçu, soit il a été transmis sans erreur et il figure dans le
code, soit une erreur a été commise, et elle sera corrigée en remplaçant le n-uplet reçu
par celui de ses voisins qui figure dans le code. Cela ne fonctionne plus si deux erreurs
ou plus ont été commises, mais on peut généraliser : il existe des codes capables de
corriger plusieurs erreurs.
Contentons nous pour l’instant de comprendre le problème en dimension 4 (cf. figure
5). Supposons que (0, 0, 0, 0) code un objet, alors aucun de ses 4 voisins ne peut être
codant ; mais si un de ces voisins est reçu, il faut pouvoir le relier à (0, 0, 0, 0) sans
ambiguïté. Donc les voisins des voisins de 0 ne peuvent pas non plus coder. Il reste 5
vecteurs codants possibles, (0, 1, 1, 1), (1, 0, 1, 1), (1, 1, 0, 1), (1, 1, 1, 0) et (1, 1, 1, 1). Si
l’un de ceux-là est codant, aucun des 4 autres ne peut l’être. Donc on ne peut utiliser
que 2 éléments, par exemple (0, 0, 0, 0) et (1, 1, 1, 1). Si une coordonnée est changée,
on pourra retrouver où est l’erreur et la corriger. Observons au passage que l’ensemble
{(0, 0, 0, 0), (1, 1, 1, 1)} est un sous-espace vectoriel de dimension 1 de (Z/2Z)4 : c’est
une « droite » vectorielle.
Nous allons présenter un exemple de code correcteur d’erreur, le code de Hamming.
Notre objectif sera surtout de relier ses propriétés aux applications linéaires sur l’espace
vectoriel (Z/2Z)n .
51
1100 1101
1000 1001
0100 0101
0000 0001
0010 0011
0110 0111
1010 1011
1110 1111
Figure 5 – Hypercube en dimension 4. Chaque arête joint deux quadruplets qui dif-
fèrent par une seule coordonnée.
Nous considérons le problème de coder les éléments de (Z/2Z)n par ceux de (Z/2Z)m ,
donc de définir une application injective de (Z/2Z)n dans (Z/2Z)m . Evidemment, m
doit être plus grand que n. Pour les codes de Hamming, on prend m = 2k − 1, et
n = m − k, où k est un certain entier. Nous prendrons l’exemple k = 3, donc nous
coderons les 16 éléments de (Z/2Z)4 par autant d’éléments choisis dans (Z/2Z)7 (128
éléments). Dans la pratique, on utilise les codes de Hamming pour des valeurs de k
beaucoup plus élevées, et la « place perdue » n’est pas aussi importante qu’il y paraît.
Comme nous l’avons vu précédemment, si on veut pouvoir corriger une erreur, deux
mots du code ne peuvent ni être voisins, ni avoir un voisin en commun. Ils doivent
donc différer en au moins 3 coordonnées. Nous devons donc trouver une application de
(Z/2Z)4 dans (Z/2Z)7 , telle que les images de deux vecteurs quelconques diffèrent en
3 coordonnées au moins.
Dans toute la suite, les espaces vectoriels considérés sont munis de leur base ca-
nonique. Considérons l’application linéaire f , de (Z/2Z)4 dans (Z/2Z)7 , définie par la
matrice A suivante.  
1 0 1 1
 1 1 1 0 
 
 
 0 1 1 1 
 
A= 1 0 0 0 
 
 
 0 1 0 0 
 
 0 0 1 0 
 
0 0 0 1
52
Notons a1 , a2 , a3 , a4 les 4 vecteurs colonnes de A. Pour vérifier que f est injective, c’est-
à-dire que son noyau est réduit au seul vecteur nul, il suffit de montrer que son image
est de dimension 4, ou encore que les vecteurs a1 , a2 , a3 , a4 forment une famille libre.
On voit immédatement que c’est le cas en examinant leurs 4 dernières coordonnées.
Les 4 vecteurs a1 , a2 , a3 , a4 codent les 4 vecteurs de la base canonique de (Z/2Z)4 .
Pour obtenir le code (l’image par f ) d’un autre vecteur de (Z/2Z)4 , il suffit de le
multiplier par la matrice A (toutes les opérations se font dans Z/2Z, c’est-à-dire modulo
2). Voici par exemple le calcul de f (v), avec v = (1, 1, 0, 1).
1
 

 1 

0
 
 
1
   
1 0 1 1 0
1 1 1 0 0
   
   
   

 0 1 1 1 


 0 


 1 0 0 0 


 1 

   

 0 1 0 0 


 1 


 0 0 1 0 


 0 

0 0 0 1 1
Observons que les 4 dernières lignes de la matrice A sont celles de la matrice identité
en dimension 4. Donc l’image par f d’un vecteur de 4 bits quelconque se termine par
ces mêmes 4 bits. Les trois bits de tête sont des « bits de correction ». Nous laissons
au lecteur le soin de calculer les images par f des 16 vecteurs de (Z/2Z)4 et de vérifier
que ces images diffèrent deux à deux en au moins 3 bits.
Pour comprendre comment fonctionne la correction d’erreur, il faut considérer l’appli-
cation linéaire g, de (Z/2Z)7 dans (Z/2Z)3 , dont la matrice B est la suivante.
 
1 0 0 1 0 1 1
B= 0 1 0 1 1 1 0 


0 0 1 0 1 1 1
Remarquez que les colonnes de B sont les écritures en base 2 des entiers de 1 à 7.
Proposition 10. Le noyau de l’application g de matrice B et l’image de l’application

f de matrice A sont le même sous-espace vectoriel de dimension 4 de (Z/2Z)7 .
Démonstration : Il est facile de vérifier que l’image par g des 4 vecteurs a1 , a2 , a3 , a4

est le vecteur nul. Ceci entraîne que Im(f ) ⊂ Ker(g). Il suffit alors de montrer que les
dimensions de Im(f ) et Ker(g) sont toutes deux égales à 4. Nous l’avons déjà fait pour
Im(f ). Pour Ker(g), observons que les trois premiers vecteurs colonnes de B sont les 3
53
vecteurs de la base canonique en dimension 3. Donc Im(g) a pour dimension 3, et donc

Ker(g) a pour dimension 7 − 3 = 4, d’après le théorème du rang.
Par la proposition précédente, l’image par f d’un vecteur quelconque est dans le
noyau de g. Donc si un code a été correctement transmis, son image par g doit être
nulle. Reprenons le vecteur v = (1, 1, 0, 1) et supposons maintenant qu’une erreur a été
commise sur son codage : au lieu de transmettre le vecteur f (v) = (0, 0, 0, 1, 1, 0, 1),
on a transmis (0, 0, 0, 1, 0, 0, 1), c’est-à-dire que le cinquième bit a été changé : c’est
f (v) + e5 qui a été transmis, avec e5 = (0, 0, 0, 0, 1, 0, 0). Puisque g(f (v)) est le vecteur
nul, l’image par g de f (v) + e5 est g(e5 ), à savoir la cinquième colonne de B.
Etant donné un vecteur de 7 bits reçu, on commence par prendre son image par
g (en le multipliant par la matrice B). Si cette image est nulle, alors il n’y a pas eu
d’erreur de transmission, et il suffit de lire les 4 derniers bits du vecteur transmis. Si
l’image est égale à l’un des vecteurs colonnes de B, disons le i-ième, alors le i-ième bit
du vecteur reçu est faux : on le corrige et on lit ensuite les 4 derniers bits du vecteur
corrigé.
54
Calcul matriciel
Bernard Ycart
Ce chapitre est essentiellement technique et ne requiert pas d’autre connaissance

théorique que celle des espaces vectoriels de dimension finie. Vous y apprendrez les
manipulations élémentaires de matrices, qui ne devraient pas vous poser de problème
si vous avez bien compris la résolution des systèmes linéaires.
Table des matières

1 Cours 1
1.1 Opérations sur les matrices . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Matrices carrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Matrices et applications linéaires . . . . . . . . . . . . . . . . . . . . . 6
1.4 Rang d’une matrice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Calcul de l’inverse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Entraînement 16
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3 Compléments 30
3.1 Les avocats de Cambridge . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.2 Diagonalisation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Décomposition LU . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
8 novembre 2011
Maths en Ligne Calcul matriciel UJF Grenoble
1 Cours
1.1 Opérations sur les matrices
Etant donnés deux entiers m et n strictement positifs, une matrice à m lignes et n
colonnes est un tableau rectangulaire de réels A = (ai,j ). L’indice de ligne i va de 1 à
m, l’indice de colonne j va de 1 à n.
a1,1 ··· a1,j ··· a1,n

 
 . .. .. 
 .. . . 
 
A = (ai,j ) =  ai,1

··· ai,j ··· ai,n 
 .
 .. .. ..
 
 . . .


am,1 · · · am,j · · · am,n
Les entiers m et n sont les dimensions de la matrice, ai,j est son coefficient d’ordre
(i, j). L’ensemble des matrices à m lignes et n colonnes et à coefficients réels est noté
Mm,n (R). Ce qui suit s’applique aussi, si on remplace R par C, à l’ensemble des matrices
à coefficients complexes.
L’ensemble Mm,n (R) est naturellement muni d’une addition interne (on peut ajou-
ter deux matrices de mêmes dimensions terme à terme) et d’une multiplication externe
(on peut multiplier une matrice par un réel terme à terme).
• Addition : Si A = (ai,j ) et B = (bi,j ) sont deux matrices de Mm,n (R), leur somme
A + B est la matrice (ai,j + bi,j ). Par exemple :
     
1 1 −3 1 −2 2

 2 3 +
 
  5 −3 
 =  7

0 

1 −1 0 2 1 1
• Multiplication externe : Si A = (ai,j ) est une matrice de Mm,n (R), et λ est un

réel, le produit λA est la matrice (λai,j ). Par exemple :
   
1 1 −2 −2
−2  2

3  =  −4 −6 
 

1 −1 −2 2
Observons que les opérations auraient le même effet si les matrices étaient disposées
comme des mn-uplets de réels (toutes les lignes étant concaténées par exemple). Donc
Mm,n (R), muni de son addition et de sa multiplication externe, est un espace vectoriel,
isomorphe à Rmn . La base canonique de Mm,n (R) est formée des matrices dont tous
les coefficients sont nuls, sauf un qui vaut 1.
L’opération la plus importante est le produit matriciel.
1
Définition 1. Soient m, n, p trois entiers strictement positifs. Soit A = (ai,j ) une

matrice de Mm,n (R) et soit B = (bj,k ) une matrice de Mn,p (R). On appelle produit
matriciel de A par B la matrice C ∈ Mm,p (R) dont le terme général ci,k est défini,
pour tout i = 1, . . . , m et pour tout k ∈ 1, . . . , p par :
n
X
ci,k = ai,j bj,k .
j=1
Nous insistons sur le fait que le produit AB de deux matrices n’est défini que si
le nombre de colonnes de A et le nombre de lignes de B sont les mêmes. Observons
d’abord que la définition 1 est cohérente avec la définition du produit d’une matrice
par un vecteur, donnée au chapitre précédent : si p = 1, la matrice B a n lignes et 1
colonne, et le produit AB a m lignes et 1 colonne. D’autre part, appliquer la définition
1 revient à effectuer successivement le produit de A par chacune des colonnes de B.
Pour effectuer ce produit, nous conseillons d’adopter la même disposition que pour le
produit par un vecteur, en plaçant B au-dessus et à droite de A.
b1,1 · · · b1,k · · · b1,n
 
 . .. .. 
 .. . . 
 

 ··· bj,k · · · 


.. .. .. 
. . .
 
 
bn,1 · · · bn,k · · · bn,p

a1,1 ··· ··· a1,n
  .. 
 .
c 1,1 . c1,p
 .. .. ..  
.

 . .  
  .. 


 ai,1 ··· ai,j · · · ai,n   · · · · · · c
  

i,k

.. .. ..   
. . .
   
   
am,1 · · · ··· am,n cm,1 cm,p
Posons par exemple :
 
1 1 !
0 1 −1 −2
A= 2 3  et B = .

−3 −2 0 1

1 −1
La matrice A a 3 lignes et 2 colonnes, la matrice B a 2 lignes et 4 colonnes. Le produit
AB a donc un sens : c’est une matrice à 3 lignes et 4 colonnes.
!
0 1 −1 −2
−3 −2 0 1
   
1 1 −3 −1 −1 −1
 2   −9 −4 −2 −1 
3 
  
1 −1 3 3 −1 −3
Le produit matriciel a toutes les propriétés que l’on attend d’un produit, sauf qu’il
n’est pas commutatif.
2
Proposition 1. Le produit matriciel possède les propriétés suivantes.

1. Associativité : Si les produits AB et BC sont définis, alors les produits A(BC)
et (AB)C le sont aussi et ils sont égaux.
A(BC) = (AB)C .
2. Linéarité à droite : Si B et C sont deux matrices de mêmes dimensions, si λ et

µ sont deux réels et si A a autant de colonnes que B et C ont de lignes, alors
A(λB + µC) = λAB + µAC .
3. Linéarité à gauche : Si A et B sont deux matrices de mêmes dimensions, si λ et

µ sont deux réels et si C a autant de lignes que A et B ont de colonnes, alors
(λA + µB)C = λAC + µBC .
Ces propriétés se démontrent à partir de la définition 1.

La transposition est une notion importante, dont la justification provient de la dualité,
qui dépasse le cadre de ce cours.
Définition 2. Étant donnée une matrice A = (ai,j ) de Mm,n (R), sa transposée est la
matrice de Mn,m (R) dont le coefficient d’ordre (j, i) est ai,j .
Pour écrire la transposée d’une matrice, il suffit de transformer ses lignes en co-
lonnes. Par exemple :
 
1 1 !
t 1 2 1
A= 2

3  , A= .
1 3 −1

1 −1
Observons que la transposée de la transposée est la matrice initiale.

t t
( A) = A .
La transposée d’un produit est le produit des transposées, mais il faut inverser l’ordre
des facteurs.
Proposition 2. Soient m, n, p trois entiers strictement positifs. Soient A = (ai,j ) une

matrice de Mm,n (R) et B = (bj,k ) une matrice de Mn,p (R). La transposée du produit
de A par B est le produit de la transposée de B par la transposée de A.
t
(AB) = tB tA .
3
Par exemple, en reprenant les matrices A et B définies ci-dessus :

!
1 2 1
1 3 −1
0 −3 −3 −9 3
   

 1 −2  
  −1 −4 3 

−1 0   −1 −2 −1 
   

−2 1 −1 −1 −3
Observons que le produit d’une matrice par sa transposée est toujours défini.
 
2 5 0 !
t t 6 6
A A =  5 13 −1  , AA = .
 
6 11
0 −1 2
Le résultat est une matrice carrée (autant de lignes que de colonnes) et symétrique.
Définition 3. Soit n un entier strictement positif et A une matrice carrée à n lignes
et n colonnes. On dit que A est symétrique si pour tous i, j = 1, . . . , n, ses coefficients
d’ordre ai,j et aj,i sont égaux, ce qui est équivalent à dire que A est égale à sa transposée.
Le produit d’une matrice par sa transposée est toujours une matrice symétrique.
En effet :
t
(A tA) = t (tA) tA = A tA .
1.2 Matrices carrées

En général si le produit AB est défini, le produit BA n’a aucune raison de l’être.
Le produit d’une matrice par sa transposée est une exception, les matrices carrées en
sont une autre : si A et B sont deux matrices à n lignes et n colonnes, les produits AB
et BA sont tous deux définis et ils ont les mêmes dimensions que A et B. En général
ils ne sont pas égaux. Par exemple,
! !
0 −1 0 1
1 0 1 0
! ! ! !
0 1 1 0 0 −1 −1 0
1 0 0 −1 1 0 0 1
Nous noterons simplement Mn l’ensemble Mn,n (R) des matrices carrées à n lignes et
n colonnes, à coefficients réels. Parmi elles la matrice identité, notée In joue un rôle
particulier.
1 0 ··· ··· 0
 
 .. .. 
 0
 1 . . 

 . . . . .
. . . . .

In =  .
 . . . . 
 .
 . ... 
 . 1 0 

0 ··· ··· 0 1
4
En effet, elle est l’élément neutre du produit matriciel : pour toute matrice A ∈
Mn,m (R),
A In = Im A = A .
On le vérifie facilement à partir de la définition 1.
Définition 4. Soit A une matrice de Mn . On dit que A est inversible s’il existe une
matrice de Mn , notée A−1 , telle que
A A−1 = A−1 A = In .
Par exemple :
       
1 0 −1 1 −1 1 1 −1 1 1 0 −1 1 0 0

 1 −1 0 
 1 −2 1 
 =

 1 −2 1 
 1 −1 0 
 =  0 1 0 
 
1 −1 1 0 −1 1 0 −1 1 1 −1 1 0 0 1
Nous verrons plus loin une méthode qui permet de savoir si une matrice est inversible,
et de calculer son inverse quand elle l’est. Observons que l’inverse, s’il existe, est néces-
sairement unique. En effet, soient B1 et B2 deux matrices telles que A B1 = B1 A = In
et A B2 = B2 A = In . En utilisant l’associativité, le produit B1 A B2 vaut B1 (A B2 ) =
B1 In = B1 , mais aussi (B1 A) B2 = In B2 = B2 . Donc B1 = B2 .
Il suffit de trouver une matrice B telle que A B = In pour être sûr que A est
inversible et que son inverse est B.
Théorème 1. Soit A une matrice de Mn . Supposons qu’il existe une matrice B telle
que A B = In ou bien B A = In . Alors A est inversible et B = A−1 .
Démonstration : Supposons qu’il existe une matrice B telle que A B = In . Consi-

dérons l’application, de Mn dans lui-même, qui à une matrice X associe le produit
X A. D’après le point 3 de la proposition 1, c’est une application linéaire, donc un
endomorphisme de l’espace vectoriel Mn . Montrons qu’elle est injective, c’est-à-dire
que son noyau ne contient que la matrice nulle. Si X A = 0, alors (X A) B = 0, mais
(X A) B = X (A B) = X In = X par hypothèse : donc X = 0. Une application linéaire
entre deux espaces de même dimension qui est injective est aussi surjective. Donc il
existe une matrice X telle que X A = In . Il reste à vérifier que cette matrice est B. Si
X A = A B = In , alors X (A B) = X et (X A) B = B. D’où le résultat.
On procède de façon symétrique si B A = In , en considérant l’application qui à X
associe A X.
Si A et B sont deux matrices inversibles de Mn , leur produit est inversible.
Proposition 3. Soient A et B deux matrices inversibles de Mn . Le produit AB est
inversible et son inverse est B −1 A−1 .
Démonstration : Nous utilisons le théorème 1, ainsi que l’associativité du produit :

(B −1 A−1 )(AB) = B −1 (A−1 A)B = B −1 In B = B −1 B = In .

5
1.3 Matrices et applications linéaires

Soient E et F deux espaces vectoriels de dimension finie, munis respectivement des
bases (b1 , . . . , bn ) et (c1 , . . . , cm ).
Une application linéaire f est déterminée par les images des vecteurs b1 , . . . , bn . Ces
images sont des combinaisons linéaires c1 , . . . , cm : pour tout j = 1, . . . , n,
m
X
f (bj ) = ai,j ci .
i=1
Les coordonnées ai,j de ces vecteurs dans la base (c1 , . . . , cm ), rangés en n colonnes,
forment la matrice de l’application f , relative aux bases considérées.
départ
f (b1 ) · · · f (bj ) · · · f (bn )

a1,1 · · · a1,j · · · a1,n c1
.. .. .. ..
. . . .
ai,1 ··· ai,j ··· ai,n ci arrivée
.. .. .. ..
. . . .
am,1 ··· am,j ··· am,n cm
Les opérations sur les applications linéaires se traduisent en des opérations analogues
sur les matrices. Soient f , g deux applications linéaires de E dans F et λ, µ deux réels.
Si les matrices de f et g (relatives aux mêmes bases au départ et à l’arrivée) sont A
et B, alors la matrice de λ f + µ g est λ A + µ B. La composée de deux applications
linéaires est encore une application linéaire. Sa matrice est le produit des matrices de
f et g.
Proposition 4. Soient E, F, G trois espaces vectoriels, f une application linéaire de
E dans F et g une application linéaire de F dans G.
f g
E −→ F −→ G
u 7−→ f (u) 7−→ g ◦ f (u) = g(f (u)) .
Soient (b1 , . . . , bn ) une base de E, (c1 , . . . , cm ) une base de F et (d1 , . . . , dp ) une base
de G.
Soit A la matrice de f relative aux bases (b1 , . . . , bn ) et (c1 , . . . , cm ).
Soit B la matrice de g relative aux bases (c1 , . . . , cm ) et (d1 , . . . , dp ).
Alors la matrice de g ◦ f relative aux bases (b1 , . . . , bn ) et (d1 , . . . , dp ) est le produit BA.
Remarquez que l’ordre dans lequel s’effectue le produit est l’ordre dans lequel s’écrit
la composition.
matrice de g ◦ f = (matrice de g) (matrice de f ) .
6
Démonstration : L’image par g ◦ f des vecteurs b1 , . . . , bn se calcule en prenant l’image

par g des vecteurs f (b1 ), . . . , f (bn ). On calcule les coordonnées de ces images dans la
base (d1 , . . . , dp ) en effectuant le produit par la matrice de g, des vecteurs exprimant
f (b1 ), . . . , f (bn ) dans la base (c1 , . . . , cm ), qui sont les vecteurs colonnes de A. Effectuer
successivement le produit de B par chacun des vecteurs colonnes de A revient à calculer
le produit de B par A.
Pour les endomorphismes (les espaces de départ et d’arrivée sont les mêmes), nous
conviendrons toujours de choisir la même base au départ et à l’arrivée.
Proposition 5. Soit E un espace vectoriel, muni de la base (b1 , . . . , bn ), et f une
application linéaire de E dans lui-même. L’application f est un automorphisme si et
seulement si la matrice de f dans la base (b1 , . . . , bn ) est inversible. Si c’est le cas, la
matrice de f −1 est l’inverse de la matrice de f .
Démonstration : Observons d’abord que la matrice de l’application identique est la ma-

trice identité, quelle que soit la base. Si l’application f est bijective, alors sa réciproque
f −1 est l’unique application dont la composée avec f est l’application identique.
f −1 ◦ f = f ◦ f −1 = IE .
Si A est la matrice de f et B la matrice de f −1 , la proposition 4 entraîne que A B =

B A = In .
Réciproquement si A est inversible, alors A−1 définit une application linéaire unique
de E dans E. La composée de cette application avec f a pour matrice In : c’est l’ap-
plication identique. Donc cette application est la réciproque de f .
Un automorphisme de E est une application linéaire qui envoie une base de E
sur une autre base. Effectuer un changement de base (remplacer une base par une
autre) revient à prendre l’image par l’automorphisme qui envoie la nouvelle base sur
l’ancienne, donc le produit par la matrice de cet automorphisme.
Proposition 6. Soit E un espace vectoriel. Soient (b1 , . . . , bn ) et (c1 , . . . , cn ) deux bases
de E. Notons P la matrice dans la base (b1 , . . . , bn ) de l’application qui à bi associe
ci (nouveaux vecteurs en fonction des anciens). Soient x1 , . . . , xn les coordonnées de
v dans la base (b1 , . . . , bn ) (anciennes) et y1 , . . . , yn les coordonnées de v dans la base
(c1 , . . . , cn ) (nouvelles).
v = x1 b1 + · · · + xn bn = y1 c1 + · · · + yn cn .
Alors le vecteur (yj )j=1,...,n est le produit de la matrice P −1 par le vecteur (xi )i=1,...,n .
   
y1 x1
 .  .. 
 .  = P −1 

 .    .
. 
yn xn
7
Démonstration : Notons φ l’automorphisme de E qui à bi associe ci , pour tout i =

1, . . . , n. Ecrivons :
v = y1 c1 + · · · + yn cn
= y1 φ(b1 ) + · · · + yn φ(bn ) .
Par définition, les coordonnées de φ(bj ) dans la base bi forment la j-ième colonne de la
matrice P = (pi,j ). Donc :
n n
!
X X
v = yj pi,j bi
j=1 i=1
 
n
X n
X
=  pi,j yj  bi
i=1 j=1
Comme les coordonnées dans la base (b1 , . . . , bn ) sont uniques, on en déduit, pour tout
i = 1, . . . , n :
n
X
xi = pi,j yj ,
j=1
donc (xi ) = P (yj ), d’où le résultat en multipliant à gauche par P −1 .

La matrice P s’appelle la matrice de passage. Dans un changement de base, nous
conviendrons toujours de noter P la matrice qui donne les nouveaux vecteurs en fonc-
tion des anciens. Voici un exemple. Munissons E = R3 , des deux bases suivantes.
(b1 , b2 , b3 ) = ((1, 0, 0), (0, 1, 0), (0, 0, 1)) et (c1 , c2 , c3 ) = ((1, 0, 0), (1, 1, 0), (1, 1, 1)) .
Voici la matrice de passage P et son inverse.

   
1 1 1 1 −1 0
P = 0 1 1  , P −1 = 0 1 −1 
 .
  
0 0 1 0 0 1
Si un vecteur v a pour coordonnées x, y, z dans la base canonique (b1 , b2 , b3 ), alors ses
coordonnées dans la base (c1 , c2 , c3 ) s’obtiennent en effectuant le produit :
    
1 −1 0 x x−y

 0 1 −1 
 y = y−z 
  
0 0 1 z z
Constatez que :
(x − y)(1, 0, 0) + (y − z)(1, 1, 0) + z(1, 1, 1) = (x, y, z) .
On peut appliquer ce qui précède pour trouver la matrice d’un endomorphisme quel-
conque dans la nouvelle base : c’est la formule de changement de base.
8
Théorème 2. Soit E un espace vectoriel, soient (b1 , . . . , bn ) et (c1 , . . . , cn ) deux bases

de E. Soit f un endomorphisme de E, et A sa matrice dans la base (b1 , . . . , bn ). Soit
P la matrice de l’application linéaire qui à bi associe ci , pour tout i = 1, . . . , n.
La matrice de f dans la base (c1 , . . . , cn ) est P −1 A P .
Démonstration : Notons φ l’application qui à bi associe ci . La matrice de f dans la base

(c1 , . . . , cn ) a pour vecteurs colonnes les images des vecteurs c1 , . . . , cn . Pour calculer
f (ci ), on peut calculer f (φ(bi )) = f ◦ φ(bi ). Donc les coordonnées des vecteurs f (ci )
dans la base (b1 , . . . , bn ) sont les colonnes de la matrice de f ◦ φ, qui est AP . D’après
la proposition 6, pour obtenir les coordonnées de ces vecteurs dans la base (c1 , . . . , cn ),
il faut multiplier à gauche par la matrice P −1 , d’où le résultat.
Reprenons l’exemple en dimension 3 des deux bases :
(b1 , b2 , b3 ) = ((1, 0, 0), (0, 1, 0), (0, 0, 1)) et (c1 , c2 , c3 ) = ((1, 0, 0), (1, 1, 0), (1, 1, 1)) .
Considérons l’application de R3 dans R3 définie par :
f : (x, y, z) 7−→ (x − z, 2x − 3y + z, y − 2z) .
Sa matrice dans la base canonique (b1 , b2 , b3 ) est :

 
1 0 −1
 2 −3
A= 1 

0 1 −2
La matrice de f dans la base (c1 , c2 , c3 ) est :

 
−1 2 0
−1
P AP =  2 −2 1 


0 1 −1
L’image par f du vecteur c2 = (1, 1, 0) est le vecteur (1, −1, 1) = 2c1 − 2c2 + c3 . Les
coordonnées 2, −2, 1 figurent dans la seconde colonne de P −1 AP .
Définition 5. Deux matrices A et B de Mn sont dites semblables si et seulement si

il existe une matrice inversible P ∈ Mn telle que :
B = P −1 AP .
Le théorème 2 affirme que deux matrices sont semblables si et seulement si elles

représentent le même endomorphisme dans des bases différentes. Il se généralise à des
applications linéaires quelconques, comme suit.
9
Théorème 3. Soit E un espace vectoriel, soient (b1 , . . . , bn ) et (b01 , . . . , b0n ) deux bases
de E. Soit F un autre espace vectoriel, soient (c1 , . . . , cm ) et (c01 , . . . , c0m ) deux bases de
F . Soit f une application linéaire de E dans F , et A ∈ Mm,n sa matrice relative aux
bases (b1 , . . . , bn ) et (c1 , . . . , cm ). Soit P ∈ Mn la matrice de l’application linéaire qui
à bi associe b0i , pour tout i = 1, . . . , n. Soit Q ∈ Mm la matrice de l’application linéaire
qui à ci associe c0i , pour tout i = 1, . . . , n.
La matrice de f relative aux bases (b01 , . . . , b0n ) et (c01 , . . . , c0n ) est Q−1 A P .
La démonstration est pratiquement la même que celle du théorème 2, avec des

notations plus lourdes. Nous l’omettons.
Définition 6. Deux matrices A et B de Mm,n (R) sont dites équivalentes si et seule-

ment si il existe deux matrices inversibles P ∈ Mn et Q ∈ Mm telles que :
B = Q−1 AP .
Le théorème 3 affirme que deux matrices sont équivalentes si et seulement si elles

peuvent représenter la même application linéaire, à un changement de base près dans
les espaces de départ et d’arrivée.
1.4 Rang d’une matrice

Nous avons déjà défini la notion de rang pour une famille de vecteurs et pour une
application linéaire :
1. le rang d’une famille de vecteurs est la dimension du sous espace vectoriel qu’elle
engendre,
2. le rang d’une application linéaire est la dimension de son image.
Soient E et F deux espaces vectoriels, et f une application linéaire de E dans F . Si
(b1 , . . . , bn ) est une base de E, l’image de f est le sous-espace vectoriel de F engendré
par (f (b1 ), . . . , f (bn )). Donc le rang de f est aussi le rang de la famille (f (b1 ), . . . , f (bn ))
et ce, quelle que soit la base (b1 , . . . , bn ). Ce rang ne dépend pas non plus de la base
dans laquelle on écrit la famille (f (b1 ), . . . , f (bn )) à l’arrivée : c’est le rang des vecteurs
colonnes de la matrice de f , quelles que soient les bases par rapport auxquelles on écrit
cette matrice.
Définition 7. Soit A ∈ Mm,n (R) une matrice. On appelle rang de la matrice A la

dimension du sous-espace vectoriel (de Rm ) engendré par ses vecteurs colonnes.
Observons que la connaissance du rang fournit un critère d’inversibilité.
Proposition 7. Une matrice de Mn (R) est inversible si et seulement si son rang est
n.
10
Démonstration : D’après la proposition 5, une matrice est inversible, si et seulement

si elle représente une application linéaire bijective de Rn dans lui-même. Or une appli-
cation linéaire est bijective si et seulement si l’image qu’elle donne d’une base est une
base, c’est-à-dire si son rang est n.
Le rang d’une matrice est celui des applications linéaires qu’elle représente, qui ne
dépend pas des bases. Si deux matrices représentent la même application dans des bases
différentes, elles auront nécessairement même rang. Rappelons (définition 6 et théorème
3) que deux matrices sont équivalentes si elles représentent la même application linéaire
dans deux bases différentes, ou encore si on déduit l’une de l’autre en multipliant à
gauche ou à droite par une matrice inversible. Deux matrices équivalentes ont même
rang. Nous allons démontrer la réciproque.
Théorème 4. Deux matrices de Mm,n (R) sont équivalentes si et seulement si elles

ont même rang.
Démonstration : Nous devons démontrer que deux matrices ayant le même rang sont
équivalentes. Soit A une matrice à m lignes, n colonnes, et de rang r. Notons a1 , . . . , an
les n vecteurs colonnes de A, qui sont des vecteurs de Rm . Le rang de A est la dimension
de l’espace engendré par (a1 , . . . , an ), qui est inférieure ou égale à n et à m. Nous allons
montrer que la matrice A est équivalente à la matrice Jr obtenue en complétant la
matrice identité Ir par des zéros, à droite et en dessous.
1 ··· r ··· n
0 ··· ··· 0 0
1 ··· 0 1
 
 .. .. .. .. 
 0 1 . . . . 
..
 
 . . . . .
 . .. .. . . ..

 .

 .
 . . ..
Jr =  ... 
 .. 1 0 .. .


r
 
 0 ··· ··· 0 1 0 ··· 0 
 
 0

··· 0 0 ··· 0 
 r+1
 ..

.. .. ..  ..
 . . . . .


0 ··· 0 0 ··· 0 m
Considérons l’application f , de Rn dans Rm dont la matrice relative aux bases ca-

noniques est A. Nous voulons trouver une base de l’espace de départ et une base de
l’espace d’arrivée, telles que la matrice de f relative à ces bases soit Jr .
Comme la dimension de l’image de f est r, la dimension du noyau est n − r, d’après
le théorème du rang. Soit (c1 , . . . , cr ) une base de Im(f ) et (b1 , . . . , bn−r ) une base de
Ker(f ). Pour tout i = 1, . . . , r, choisissons un vecteur vi tel que f (vi ) = ci . La famille
(v1 , . . . , vr , b1 , . . . , bn−r )
est une base de E : ceci a été établi dans la démonstration du théorème du rang.
11
Dans l’espace d’arrivée F , la famille (c1 , . . . , cr ) est une famille libre car c’est une
base de Im(f ). On peut la compléter par m − 1 vecteurs cr+1 , . . . , cm de sorte que
(c1 , . . . , cr , cr+1 , . . . , cm )
soit une base de F .
Pour i = 1, . . . , r, l’image de vi est ci . Les images de b1 , . . . , bn−r sont nulles : la
matrice de f relative aux bases (v1 , . . . , vr , b1 , . . . , bn−r ) (au départ) et (c1 , . . . , cm ) (à
l’arrivée) est la matrice Jr .
Puisque A et Jr sont équivalentes, il existe deux matrices inversibles P et Q telles
que Jr = Q−1 AP , et donc A = QJr P −1 . Soit B une autre matrice de Mm,n (R),
également de rang r. Il existe deux autres matrices inversibles R et S telles que Jr =
S −1 BR. En multipliant à gauche par Q et à droite par P −1 , on obtient :
A = (QS −1 )B(RP −1 ) .
Donc deux matrices de même taille et de même rang sont équivalentes.
On déduit de la démonstration qui précède que A et tA ont le même rang.
Proposition 8. Une matrice et sa transposée ont même rang.
Démonstration : Nous avons démontré qu’une matrice A de rang r est équivalente à

la matrice Jr obtenue en complétant Ir par des zéros. Or tJr est du même type que Jr :
elle contient la matrice identité Ir , complétée par des zéros. Elle est aussi de rang r.
Par la proposition 2, si A = QJr P −1 , la transposée de A s’écrit :
t
A = t (P −1 )tJr tQ .
Par la proposition 2, la transposée d’une matrice inversible est inversible. Nous avons
donc montré que tA est équivalente à tJr , qui est de rang r.
Déterminer le rang d’une matrice consiste à déterminer le rang de ses vecteurs
colonnes, ou encore de ses vecteurs lignes, puisque ce sont les colonnes de la transposée.
Pour ce faire, nous avons vu une méthode consistant à écrire un système homogène,
puis à lui appliquer la méthode de Gauss.
Soit A = (ai,j ) une matrice à m lignes et n colonnes.
a1,1 ··· a1,j ··· a1,n
 
 . .. .. 
 .. . . 
 
A = (ai,j ) = 

a ··· ai,j ··· ai,n 
.
 i,1

 .. .. .. 
 . . .


am,1 · · · am,j · · · am,n
Munissons Rn et Rm de leurs bases canoniques, et notons f l’application linéaire de Rn
dans Rm qui a pour matrice A relativement à ces bases. L’application linéaire f peut
être caractérisée de deux façons différentes.
12
1. f est l’application qui à un n-uplet x = (x1 , . . . , xn ) associe le m-uplet Ax, dont

la i-ième coordonnée vaut
ai,1 x1 + · · · + ai,n xn .
2. f est l’application qui au j-ième vecteur de la base canonique de Rn associe le

m-uplet (aj,1 , . . . , aj,m ), à savoir le j-ième vecteur colonne de A.
Le noyau de f est l’ensemble des n-uplets (x1 , . . . , xn ), solutions du système homogène
(H) suivant.
a1,1 x1 + · · · +a1,j xj + · · · +a1,n xn = 0



.. .. .. ..



. . . .




(H) ai,1 x1 + ··· +ai,j xj + ··· +ai,n xn = 0

 .. .. .. ..
. . . .





am,1 x1 + · · · +am,j xj + · · · +am,n xn = 0

Le rang de ce système est égal à la fois au rang de f , au rang de A, au rang de la famille

des vecteurs colonnes de A et au rang de la famille des vecteurs lignes. Pour le calculer,
il suffit de mettre le système (H) sous forme échelonnée : le rang est le nombre de
pivots non nuls de la forme échelonnée. On peut aussi déduire de la forme échelonnée
une base de l’image, c’est-à-dire une base de l’espace engendré par les vecteurs colonnes
de A. Il n’est pas indispensable de passer par le système (H) pour cela. On peut très
bien appliquer la méthode du pivot de Gauss en transformant la matrice A, sans écrire
le système. Ceci revient à remplacer à chaque étape une matrice par une autre matrice
telle que le noyau de l’application linéaire associée soit le même : le rang n’est donc
pas modifié. Voici un exemple.
Considérons la matrice suivante.
1 1 0 1
 
 2 1 1 0 
A=
 
1 2 −1 1

 
−1 0 −1 −3
Le coefficient d’ordre (1, 1) est non nul, il n’y a donc pas de permutations à effectuer.
Le premier pivot est p1 = 1. Voici les transformations qui annulent la première colonne
au-dessous du pivot.
1 1 0 1
 
L2 ← L2 − 2L1 
 0 −1 1 −2 

L3 ← L3 − L1 0 1 −1 0
 
 
L4 ← L4 + L1 0 1 −1 −2
13
Le second pivot est −1. Les transformations qui annulent le bas de la seconde colonne
sont les suivantes.
1 1 0 1
 
 0 −1 1 −2 
 
L3 ← L3 + L2  0 0 0 −2
 

L4 ← L4 + L2 0 0 0 −4
Pour obtenir un troisième pivot non nul, il faut échanger les deux dernières colonnes.
1 1 1 0
 

 0 −1 −2 1 

0 0 −2 0
 
 
0 0 −4 0
Le troisième pivot est −2. Il ne reste qu’une ligne à transformer.
1 1 1 0
 

 0 −1 −2 1 

0 0 −2 0
 
 
L4 ← L4 − 2L3 0 0 0 0
Le rang de la matrice est donc 3. En n’oubliant pas que les colonnes 3 et 4 ont été
échangées, on obtient aussi que les vecteurs colonnes numéros 1, 2 et 4 de la matrice
A forment une famille libre, donc une base de l’espace engendré.
Bien que l’écriture du système soit mathématiquement superflue, elle est techniquement
plus sûre, et nous vous conseillons de la conserver.
1.5 Calcul de l’inverse

Soit A ∈ Mn (R) une matrice carrée. Soit b ∈ Rn un vecteur quelconque. Chercher
un n-uplet x = (x1 , . . . , xn ) tel que Ax = b, c’est résoudre un système linéaire de n
équations à n inconnues. Si la matrice A est inversible, alors la solution s’écrit x = A−1 b.
La méthode du pivot de Gauss parmet de résoudre le système Ax = b pour un second
membre quelconque, donc de calculer x = A−1 b. Les coefficients de A−1 se lisent sur
le système résolu. Voici ce qu’on obtient pour une matrice A à deux lignes et deux
colonnes.
x = −2a + b
  
 x +2y = a  x +2y = a 
⇐⇒ ⇐⇒
1
3x +4y = b −2y = b − 3a y = (3a − b)
  
2
Les coefficients de A−1 sont ceux de a et b dans l’expression de x et y. Dans le cas

général on obtient :
! !
α β −1 1 δ −β
A= , A = ,
γ δ αδ − βγ −γ α
14
si αδ − βγ 6= 0. L’expression de A−1 est facile à mémoriser. Pour inverser une matrice

à deux lignes et deux colonnes, il faut :
1. échanger les deux coefficients diagonaux
2. changer le signe des deux autres
3. diviser tous les coefficients par le déterminant αδ − βγ.
Pour n > 3, il n’y a pas de formule générale aussi facile. La technique la plus sûre
consiste à résoudre le système Ax = b pour un second membre quelconque, avec la
méthode du pivot de Gauss, puis à écrire ensuite que la solution obtenue est le produit
de A−1 par le second membre.
Soit par exemple à inverser la matrice A suivante.
 
1 0 −1
A=

1 −1 0 

1 −1 1
Ecrivons le système    
x a
 y = b  ,
A   
z c
soit 

 x −z = a
x −y = b
x −y +z = c


Voici les différentes étapes de la résolution par la méthode du pivot de Gauss.

 

 x −z = a 
 x −z = a
x −y = b ⇐⇒ −y +z = b − a
x −y +z = c −y +2z = c − a

 

 

 x −z = a 
 x −z = a
⇐⇒ −y +z = b − a ⇐⇒ y −z = a − b
z = c−b z = c−b

 

    

 x = a−b+c x a
−1 
⇐⇒ y = a − 2b + c ⇐⇒  y =A  b  ,
  
−b + c


z = z c
avec  
1 −1 1
A−1 =  1 −2 1 
 .

0 −1 1
15
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soient A et B deux matrices. Parmi les affirmations suivantes, lesquelles
sont vraies, lesquelles sont fausses, et pourquoi ?
1. Si le produit AB est défini, alors le produit BA est défini.
2. Si la somme A + B est définie, alors le produit AB est défini.
3. Si le produit AB est défini, alors le produit tB tA est défini.
4. Si la somme A + B est définie, alors le produit A tB est défini.
5. Si les produits AB et BA sont définis, alors la somme A + B est définie.
6. Si les produits AB et BA sont définis, alors la somme A + tB est définie.
7. Si les produits AB et tBA sont définis, alors la somme A + tA est définie.
8. Si les produits AB et tBA sont définis, alors la somme A + tB est définie.
9. Si le produit AB est défini, alors la somme A tA + B tB est définie.
10. Si le produit AB est défini, alors la somme tA A + B tB est définie.
Vrai-Faux 2. Soit A une matrice carrée. Parmi les affirmations suivantes, lesquelles
1. Si A est inversible, alors A tA = tA A.
2. Si A est inversible, alors A tA est inversible.
3. Si A est inversible, alors A + tA est inversible.
4. Si A est inversible, alors A est équivalente à la matrice identité.
5. Si A est inversible, alors A est semblable à la matrice identité.
Vrai-Faux 3. Soit A une matrice carrée. On dit que A est diagonale si tous ses coef-
ficients d’ordre (i, j) avec i 6= j, sont nuls. Parmi les affirmations suivantes, lesquelles
1. Si A est diagonale, alors A est inversible.
2. Si A est diagonale, alors A est symétrique.
3. Si A est diagonale et si tous ses coefficients diagonaux sont non nuls, alors A
est inversible.
4. Si A est diagonale, alors A est semblable à la matrice identité.
5. Si A est diagonale, alors A est équivalente à la matrice identité.
1. Si une matrice est de rang r, alors elle est équivalente à la matrice Ir
16
2. Une matrice est de rang r si et seulement si la famille de ses vecteurs colonnes

est de rang r.
3. Une matrice est de rang r si et seulement si la famille de ses vecteurs lignes
est de rang r.
4. Si une matrice A est de rang r, alors toute matrice formée de r colonnes parmi
les colonnes de A est de rang r.
5. Si une matrice formée de r colonnes parmi les colonnes de A est de rang r,
alors A est de rang > r.
6. La matrice nulle est la seule matrice de rang 0.
7. Si deux lignes de A ne sont pas proportionnelles, alors le rang de A est au plus
2.
8. Si deux lignes de A sont proportionnelles, alors le rang de A est strictement
inférieur à son nombre de colonnes.
9. Si une matrice carrée de Mr , extraite de A est inversible, alors A est de rang
> r.
10. Si A est de rang r, alors aucune matrice carrée de Mr+1 extraite de A n’est
inversible.
11. Si toute matrice carrée de Mr , extraite de A est de rang r, alors A est de rang
r.
2.2 Exercices
Exercice 1. On considère les matrices suivantes.
           
0 1 −1 2 −2 3
 1   1   0   −1   3   −1 
           
0 1 1 0 1 2
! ! !
1 0 0 1 2 −1 −1 2 3
0 1 0 2 −1 1 2 1 −3
     
1 0 0 1 0 0 −2 3 −4
 0 1 0   0 −1 0   3 1 −3 
   
 
0 0 1 0 0 2 1 −2 0
0 0 1 1 2 3 −1 −2 0
     

 0 1 0 


 3 2 1 


 2 1 0 

1 0 0 2 1 3 −2 0 1
     
     
1 1 1 1 3 2 0 −1 2
1. Ecrire la transposée de chacune de ces matrices.
17
2. Etant données deux matrices A, B appartenant à l’ensemble ci-dessus, calculer

ceux des produits A B, tA B, A tB, tA tB qui sont définis.
Exercice 2. On considère la matrice suivante.

 
0 0 0
A= 1 0 1  .
 
0 0 1
On note f l’endomorphisme de R3 qui a pour matrice A dans la base canonique de R3 ,

notée (e1 , e2 , e3 ).
1. Montrer que f ◦ f (e1 ) = f (e2 ) = 0. Montrer que f ◦ f (e3 ) = f (e3 ).
2. En déduire A2 . Vérifier en effectuant le produit matriciel.
3. Montrer que A3 = A2 sans effectuer le produit matriciel, puis vérifier en l’effec-
tuant.
4. Donner une base de Ker(f ) et une base de Im(f )

 
0 0 1
A= 1 0 0 

 .
0 1 0

notée (e1 , e2 , e3 ).
1. Pour i = 1, 2, 3, déterminer f ◦ f (ei ), puis f ◦ f ◦ f (ei ).
2. En déduire que A2 = A−1 . Vérifier en calculant le produit matriciel.

 
0 1 0
A= 0 0 1  .
 
0 0 0

notée (e1 , e2 , e3 ).
1. Pour i = 1, 2, 3, déterminer f ◦ f (ei ), puis f ◦ f ◦ f (ei ).
2. En déduire A2 et A3 .
3. Pour k ∈ N∗ , donner une expression de (I3 + A)k en fonction de k. Vérifier votre
expression pour k = 3 en effectuant le produit matriciel.
4. Reprendre la question précédente pour (I3 − A)k , puis pour (3I3 − 2A)k .
18

 
1 1 1
A= 1 1 1 

 .
1 1 1

notée (e1 , e2 , e3 ).
1. Pour i = 1, 2, 3, déterminer f ◦ f (ei ), en déduire que f ◦ f = 3f .
2. Pour k ∈ N∗ , démontrer par récurrence que f ◦k = 3k−1 f .
3. En déduire l’expression de Ak en fonction de k.
4. Pour k ∈ N∗ , donner une expression de (I3 + A)k en fonction de k. Vérifier votre
expression pour k = 3 en effectuant le produit matriciel.
5. Reprendre la question précédente pour (I3 − A)k , puis pour (3I3 − 2A)k .
Exercice 6. On rappelle qu’une matrice carrée est symétrique si elle est égale à sa
transposée. On note Sn l’ensemble des matrices carrées symétriques. On dit qu’une
matrice carrée est antisymétrique si elle est l’opposée de sa transposée : tA = −A. On
note An l’ensemble des matrices carrées antisymétriques.
1. Montrer que les éléments diagonaux d’une matrice antisymétrique sont nuls.
2. Montrer que Sn et An sont des sous-espaces vectoriels de Mn .
3. Soit A une matrice carrée quelconque. Montrer que A+ tA est symétrique et A− tA
est antisymétrique.
4. Montrer que le produit de deux matrices symétriques A et B est symétrique si
et seulement si AB = BA (on dit que A et B « commutent »).
5. Montrer que le produit de deux matrices antisymétriques A et B est antisymé-
trique si et seulement si AB = −BA.
6. Soit A une matrice inversible. Montrer que tA est inversible et que son inverse est
t
(A−1 ).
7. Soit A une matrice symétrique et inversible. Montrer que son inverse est symé-
trique.
8. Soit A une matrice antisymétrique et inversible. Montrer que son inverse est
antisymétrique.
9. Montrer qu’aucune matrice de A3 n’est inversible.
Exercice 7. On appelle trace d’une matrice carrée la somme de ses éléments diagonaux.
On note tr(A) la trace de A ∈ Mn .
1. Soient A, B deux matrices de Mn . Montrer que tr(AB) = tr(BA).
2. En déduire que deux matrices carrées semblables ont la même trace.
19
3. Soit A une matrice carrée non nulle. Montrer que les traces de A tA et tA A sont
strictement positives.
Exercice 8. Déterminer le rang des matrices suivantes.
2 −3 −4 0 1 −2 1 1 2 1
     

 3 1 5 


 1 −1 7 


 −1 2 1 −1 

−1 0 −1 −2 0 −10 2 1 3 2 
     
    
0 2 4 1 3 −1 0 −1 0 −1
Exercice 9. Vérifier que les matrices suivantes sont inversibles et calculer leurs inverses.
       
0 1 0 0 2 2 2 −1 1 1 2 0
 0 0 1   −1 3 −1   1 4 −3   3 −1 1 
     
 
−2 1 2 3 −3 1 1 1 0 0 1 2
Exercice 10. Pour chacune des matrices A suivantes :

! ! ! ! ! !
2 1 2 2 −5 6 5 2 5 2 7 5
1 2 2 −1 −3 4 3 0 −3 0 −6 −4
1. Déterminer selon les valeurs de λ le rang de la matrice A − λI2 .

2. On note λ1 et λ2 les deux réels tels que le rang de A − λi I2 est 1. Pour i = 1, 2,
déterminer l’ensemble des solutions du système linéaire
! !
x 0
(A − λi I2 ) = .
y 0
On note vi un vecteur non nul solution de ce système.

3. Montrer que (v1 , v2 ) est une base de R2 .
4. Soit P la matrice de passage de la base canonique de R2 à la base (v1 , v2 ). Calculer
P −1 . Montrer que !
−1 λ1 0
P AP = .
0 λ2
5. Montrer que la matrice (A − λ1 I2 )(A − λ2 I2 ) est nulle. En déduire une expression
de A−1 en fonction de A et I2 .
6. En utilisant l’expression de la question précédente, vérifier que
!
1/λ1 0
P −1 A−1 P = .
0 1/λ2
7. Pour k ∈ N∗ , donner une expression de Ak en fonction de k.
20
Exercice 11. Pour chacune des matrices A suivantes :

     
0 1 0 0 2 2 2 −1 1
 0 0 1 
  
 −1 3 −1 


 1 4 −3 

−2 1 2 3 −3 1 1 1 0
1. Déterminer selon les valeurs de λ le rang de la matrice A − λI3 .

2. On note λ1 , λ2 et λ3 les trois réels tels que le rang de A − λi I3 est 2. Pour
i = 1, 2, 3, déterminer l’ensemble des solutions du système linéaire
   
x 0
(A − λi I3 ) 
 y = 0  .
  
z 0
On note vi un vecteur non nul solution de ce système.

3. Montrer que (v1 , v2 , v3 ) est une base de R3 .
4. Soit P la matrice de passage de la base canonique de R3 à la base (v1 , v2 , v3 ).
Calculer P −1 . Montrer que
 
λ1 0 0
P −1 AP = 
 0 λ2 0  .

0 0 λ3
5. Montrer que la matrice (A − λ1 I3 )(A − λ2 I3 )(A − λ3 I3 ) est nulle. En déduire une

expression de A−1 en fonction de A2 , A et I3 .
6. En utilisant l’expression de la question précédente, vérifier que
 
1/λ1 0 0
−1 −1
P A P = 0

1/λ2 0   .
0 0 1/λ3
7. Pour k ∈ N∗ , donner une expression de Ak en fonction de k.
2.3 QCM
rapporte 2 points.
Question 1. Soient A et B deux matrices.
A Si la somme A + B est définie, alors le produit AB est défini.
B Si la somme A + B est définie, alors le produit tAB est défini.
21
C Si le produit AB est défini, alors la somme A + tB est définie.

D Si les produits AB et BA sont définis, alors la somme A + B est définie.
E Si les produits AB et BA sont définis, alors la somme tA + B est définie.
Question 2. Soit A une matrice.
A Le produit AA est toujours défini.
B Le produit A tA est toujours défini.
C Le produit (A tA)(tAA) est défini si et seulement si A est carrée.
D Si A est carrée alors A tA = tAA.
E Si A tA = tAA alors A = tA.
Question 3. Soit A une matrice carrée, et I la matrice identité, de même taille que A.
A Si A est inversible, alors A tA est inversible.
B Si A est inversible, alors I − A est inversible.
C Si A est inversible, alors A + tA est inversible.
−1
D Si A est inversible, alors (A−1 tA)−1 = tA A.
E Si A est inversible, alors (A tA)(A−1 tA−1 ) = I.
Question 4. On considère la matrice A suivante.
 
1 0 1
 0 1 0  .
A= 
1 0 1
Soit f l’application linéaire de R3 dans R3 dont la matrice dans la base canonique de

R3 est A.
A L’application f est injective.  
0 0 0
B L’application f a pour matrice  0 1 0  dans une certaine base de R3 .
 
0 0 2
 
2 0 2
C L’application f ◦ f a pour matrice  0 2 0  dans la base canonique de R3 .
 
2 0 2
 
1 0 0
D La matrice A est équivalente à la matrice   0 1 0  .

0 0 0
 
1 0 0
E La matrice A est semblable à la matrice  0 1 0  .
 
0 0 0
!
1 1 1
A= .
1 1 1
22
Soit f l’application linéaire de R3 dans R2 dont la matrice relative aux bases canoniques
de R3 et R2 est A.
A L’application f est surjective.
B Le noyau de f est un plan vectoriel. !
1 0 0
C La matrice A est équivalente à la matrice .
0 1 0
!
1 0 0
D La matrice A est équivalente à la matrice .
0 0 0
E La matrice A est de rang 2.
Question 6. Soit A une matrice.
A Le rang de AtA est toujours supérieur ou égal au rang de A
B Le rang de tA est toujours égal au rang de A.
C Le rang de tAA est toujours inférieur ou égal au rang de A.
D Si A a plus de lignes que de colonnes, alors le rang de A est égal à son nombre
de colonnes.
E Si le rang de A est égal à son nombre de colonnes, alors A est inversible.
Question 7. Soit A une matrice à 4 lignes, 3 colonnes, de rang 2.
A A est la matrice d’une application linéaire de R4 dans R2 .
B A est la matrice d’une application linéaire dont le noyau est un plan vectoriel.
C A est la matrice d’une application linéaire dont l’image est un plan vectoriel.
1 0 0
 
 0 1 0 
D A est équivalente à la matrice   .
 
 0 0 0 
0 0 0
1 0 0
 
 0 1 0 
E A est équivalente à la matrice   .
 
 0 0 1 
0 0 0
Question 8. Soit A ∈ Mn une matrice carrée inversible. Soit f l’application de Rn
dans Rn qui a pour matrice A dans la base canonique.
A A est semblable à la matrice identité de même taille que A.
B Le noyau de f est une droite vectorielle.
C A est équivalente à la matrice identité de même taille que A.
D L’image de f est Rn .
E Le système linéaire Ax = 0 admet une solution non nulle.
!
1 1
A= .
0 1
23
Soit I la matrice identité à deux lignes et deux colonnes.

A L’inverse de A est égal à A.
B La matrice A est semblable à I.
C L’inverse de A a des coefficients non entiers.
D La matrice 12 (A + A−1 ) est égale à I.
E La matrice A + A−1 est diagonale.
 
0 0 1
 1 0 0  .
A=

0 1 0
Soit I la matrice identité à trois lignes et trois colonnes.
A A − I est inversible.
B A2 = A.
C A−1 = tA.
D A + A2 est de rang 2.
E I + A + A2 est de rang 1.
Réponses : 1–DE 2–BC 3–AD 4–BD 5–BD 6–BC 7–CD 8–CD 9–DE 10–CE
2.4 Devoir
répondu.
Questions de cours : Soit A ∈ Mn une matrice carrée. On note I la matrice identité
de dimension n. On suppose qu’il existe une matrice B telle que A B = I.
1. Soit f l’application de Mn dans Mn qui à une matrice X associe le produit XA.
Montrer que f est une application linéaire.
2. Montrer que f est injective. En déduire que f est bijective.
3. Montrer qu’il existe une matrice B∗ ∈ Mn telle que B∗ A = I. Montrer que
B∗ = B. En déduire que A est inversible.
4. Soit B ∗ une matrice telle que A B ∗ = I. Montrer que B ∗ = B.
5. Soit C ∈ Mn une autre matrice inversible. Montrer que le produit A C est inver-
sible et que (A C)−1 = C −1 A−1 .
Exercice 1 : Soient A et B les deux matrices suivantes.
   
1 0 0 1 0 1
A= 0 1 0 
 et B =  0 1 1  .
  
1 1 −1 0 0 1
24
1. Vérifier que A est inversible et calculer A−1 .

2. Vérifier que B est inversible et calculer B −1 .
3. On pose M = AB. Justifier le fait que M est inversible et calculer M −1 , en
utilisant les résultats des deux questions précédentes.
Dans toute la suite, (b1 , b2 , b3 ) désigne une base de R3 . On note f (respectivement :
g) l’application de R3 dans lui-même qui a pour matrice A (respectivement : B)
dans la base (b1 , b2 , b3 ).
4. Exprimer en fonction de b1 , b2 , b3 les vecteurs f (b1 ), f (b2 ), f (b3 ), puis f ◦ f (b1 ), f ◦

f (b2 ), f ◦ f (b3 ). Retrouver le résultat de la question 1.
5. Exprimer les vecteurs g −1 (b1 ), g −1 (b2 ), g −1 (b3 ) en fonction de b1 , b2 , b3 .
6. On note h l’application linéaire de R3 dans lui-même, qui à un vecteur v associe
h(v) = f (v) − g −1 (v). Ecrire la matrice de h dans la base (b1 , b2 , b3 ).
7. Donner, en fonction de b1 , b2 , b3 , une base de Ker(h) et une base de Im(h).
8. On note c1 = f (b1 ), c2 = f (b2 ), c3 = f (b3 ). Montrer que (c1 , c2 , c3 ) est une base
de R3 . Quelle est la matrice de l’application f dans la base (c1 , c2 , c3 ) ?
9. Calculer les matrices des applications g et g −1 dans la base (c1 , c2 , c3 ).
Exercice 2 : Soient A et B les deux matrices suivantes.
1 −2 1
 
 
1 −1 2 1
 −1 0 −1 
A=
 
et B =  1

2 1 −1 
 .
0 1 2 
 

2 1 3 0
1 2 0
On note f l’application de R3 dans R4 qui a pour matrice A relativement aux bases

canoniques, et g l’application de R4 dans R3 qui a pour matrice B relativement aux
bases canoniques.
1. Calculer les produits AB et BA.
2. On note P la matrice constituée des trois premières lignes de la matrice A. Vérifier
que P est inversible et calculer son inverse. En déduire le rang de la matrice A.
3. Déterminer le rang de B. En déduire le rang des matrices AB et BA.
4. On note (b1 , b2 , b3 ) les trois vecteurs colonnes de la matrice A. Soit e4 = (0, 0, 0, 1)
le quatrième vecteur de la base canonique de R4 . Justifier le fait que (b1 , b2 , b3 , e4 )
est une base de R4 .
5. Donner la matrice de l’application f , relative à la base canonique de R3 au départ
et à la base (b1 , b2 , b3 , e4 ) à l’arrivée.
6. Calculer la matrice de l’application f ◦ g dans la base (b1 , b2 , b3 , e4 ).
25

1. Soient X, Y ∈ Mn deux matrices, λ, µ deux réels.
(λX + µY ) A = λXA + µY A ,
car le produit matriciel est distributif par rapport à l’addition. Donc l’application
f est linéaire.
2. Pour montrer qu’une application linéaire est injective, il suffit de montrer que
son noyau est réduit à {0}. Soit X un élément du noyau de f , c’est-à-dire une
matrice telle que XA = 0 (matrice nulle). En multipliant à droite par B, et en
utilisant l’associativité du produit matriciel :
(XA) B = X(A B) = X I = X .
Or si XA = 0, alors (XA) B = 0, donc X = 0. Donc le noyau de f ne contient

que la matrice nulle : f est injective.
Une application linéaire entre deux espaces de même dimension, si elle est injec-
tive, est aussi surjective, donc bijective.
3. Puisque f est surjective, il existe B∗ ∈ Mn telle que f (B∗ ) = I, soit B∗ A = I.
Pour montrer que B∗ = B, on utilise encore l’associativité du produit matriciel :
B∗ (A B) = (B∗ A) B. Or :
B∗ (A B) = B∗ I = B∗ et (B∗ A) B = I B = B .
Par définition, s’il existe une matrice B telle que B A = A B = I, la matrice A

est inversible.
4. La démonstration est la même que précédemment : B (A B ∗ ) = (B A) B ∗ . Or :
B (A B ∗ ) = B I = B et (B A) B ∗ = I B ∗ = B ∗ .
5. Utilisons encore l’associativité du produit matriciel.
(A C) (C −1 A−1 ) = A (CC −1 ) A−1 = A I A−1 = A A−1 = I .
Il existe donc une matrice qui, multipliée à droite par A C donne l’identité. Par
application de ce qui précède, la matrice A C est donc inversible et son inverse
est la matrice C −1 A−1 .
Exercice 1 :
1. La matrice A est triangulaire et ses termes diagonaux sont non nuls : elle est de
rang 3, donc inversible. On trouve A−1 = A.
26
2. La matrice B est triangulaire et ses termes diagonaux sont non nuls : elle est de
rang 3, donc inversible. On trouve :
 
1 0 −1
B −1 = 0 1 −1 
 .

0 0 1
3. Le produit de deux matrices inversibles est inversible.

 
0 −1 1
M −1 = B −1 A−1  −1
= 0 1 
 .
1 1 −1
4.
f (b1 ) = b1 + b3 , f (b2 ) = b2 + b3 , f (b3 ) = −b3 .
f ◦ f (b1 ) = f (b1 ) + f (b3 ) = b1
f ◦ f (b2 ) = f (b2 ) + f (b3 ) = b2
f ◦ f (b3 ) = f (−b3 ) = b3 .
L’application f ◦ f coïncide avec l’application identique sur une base de R3 , donc
sur R3 tout entier. Donc f est sa propre réciproque, donc A−1 = A.
5. La matrice de l’application g −1 dans la base (b1 , b2 , b3 ) est B −1 . On en déduit :
g −1 (b1 ) = b1 , g −1 (b2 ) = b2 , g −1 (b3 ) = −b1 − b2 + b3 .
6. La matrice de h dans la base (b1 , b2 , b3 ) est A − B −1 .

 
0 0 1
A − B −1 = 0 0 1 
 .

1 1 −2
7. Soit (x, y, z) les coordonnées dans la base (b1 , b2 , b3 ) d’un vecteur de Ker(h),


 z = 0
z = 0
x +y −2z = 0 .


Tout vecteur de Ker(h) s’écrit xb1 −xb2 , où x est un réel quelconque. Donc Ker(h)
est une droite vectorielle, dont une base est le vecteur b1 − b2 . L’image de f est
un plan vectoriel, dont une base est donnée par le premier et le troisième vecteur
colonne de la matrice : (b3 , b1 + b2 − 2b3 ).
8. Puisque A est inversible, l’image par f d’une base est une base. Donc (c1 , c2 , c3 )
est une base de R3 . D’après la question 4,
f (c1 ) = b1 = c1 + c3 , f (c2 ) = b2 = c2 + c3 , f (c3 ) = b3 = −c3 .
27
Donc dans la base (c1 , c2 , c3 ), la matrice de f est encore la matrice A. On peut

aussi le montrer en utilisant la formule de changement de base : P −1 AP , où P
est la matrice de passage de l’ancienne base (b1 , b2 , b3 ) à la nouvelle (c1 , c2 , c3 ),
qui ici vaut A.
9. En utilisant la formule de changement de base, la matrice de g dans la base
(c1 , c2 , c3 ) est :  
2 1 −1
A−1 BA =  1 2 −1   .

2 2 −1
La matrice de g −1 dans la base (c1 , c2 , c3 ) est l’inverse de la précédente :
 
0 −1 1
−1 −1
A B A =  −1 0 1 
 .

−2 −2 3
Exercice 2 :
1. On trouve :
1 −4 3 3
 
 
3 2 6
 −3 0 −5 −1 
AB = et BA =  −2 −3 1 
 .
  
5 4 7 −1
 
1 −1
 
7
3 3 4 −1
   
x a
2. En résolvant le système P  y  =  b , on trouve que ce système est de rang
   
z c
3, donc la matrice P est bien inversible. Son inverse est :
 
−1 −5 −2
1
P −1 =  −2 −2 0 
 .
4
1 1 2
Les trois vecteurs colonnes de P sont linéairement indépendants, donc les trois
premiers vecteurs colonnes de A le sont aussi : la matrice A est de rang 3.
3. Les deux premières lignes de B sont linéairement indépendantes. La troisième est
la somme des deux autres. Donc la matrice B est de rang 2.
La matrice AB est celle de l’application composée f ◦ g. Puisque B est de rang
2, l’image de g est un plan vectoriel de R3 . Puisque l’application f est de rang 3,
son noyau est réduit à {0} et sa restriction à Im(g) est de rang 2. Donc l’image
de f ◦ g est un plan vectoriel : AB est de rang 2.
Le raisonnement est analogue pour BA : c’est la matrice de l’application g ◦ f .
Puisque f est de rang 3, son image est R3 , donc Im(g ◦ f ) = Im(g). Donc g ◦ f
est de rang 2, comme g. Donc la matrice BA est de rang 2.
28
4. Soit Q la matrice formée en juxtaposant la matrice A et le vecteur colonne e4 .

Voici Q et sa transposée.
1 −2 1 0 1 −1 0 1
   
 −1 0 −1 0 
t
 −2 0 1 2 
Q= et Q= .
   
0 1 2 0 1 −1 2 0
 
   
1 2 0 1 0 0 0 1
Notons l1 , l2 , l3 , l4 les 4 vecteurs lignes de Q (vecteurs colonnes de tQ). Soient

α, β, γ, δ 4 réels tels que αl1 + βl2 + γl3 + δl4 = 0. Nécessairement, δ = 0, donc
αl1 + βl2 + γl3 = 0. Mais les vecteurs l1 , l2 , l3 sont linéairement indépendants,
d’après la question 2, donc α = β = γ = 0. La matrice tQ est donc de rang 4, et
il en est de même pour Q. Donc (b1 , b2 , b3 , e4 ) est une base de R4 .
5. Par définition, les images par f des vecteurs de la base canonique de R3 sont
b1 , b2 , b3 . Donc la matrice de l’application f , relative à la base canonique de R3
au départ et à la base (b1 , b2 , b3 , e4 ) à l’arrivée est la suivante.
1 0 0
 
 0 1 0 
.
 
0 0 1
 
 
0 0 0
6. Par application de la formule de changement de variable, la matrice de l’applica-

tion f ◦ g dans la base (b1 , b2 , b3 , e4 ) est Q−1 AB Q. Or la matrice de la question
précédente est Q−1 A, ce qui simplifie le calcul : la matrice Q−1 AB est la matrice
carrée obtenue en ajoutant à B une quatrième ligne de zéros. Il reste à calculer
le produit par Q :
3 2 6 1
 
 −2 −3 1 −1 
Q−1 ABQ =   .

1 −1 7 0 


0 0 0 0
29
3 Compléments
3.1 Les avocats de Cambridge
Tous deux ont fait leurs études à Cambridge, tous deux ont exercé assez longuement
comme avocats tout en considérant cela comme un moyen accessoire de gagner leur vie,
tous deux ont fini professeurs de mathématiques. Ils étaient amis, et se sont influencés
l’un l’autre par leurs travaux respectifs, même s’il n’ont cosigné aucun article 1 . Nous
parlons de Arthur Cayley (1821–1895) et de James Joseph Sylvester (1814–1897). Voici
ce que disait le second, vers la fin de sa carrière.
Cayley, who, though younger than myself is my spiritual progenitor – who
first opened my eyes and purged them of dross so that they could see and
accept the higher mysteries of our common mathematical faith. . .
Sylvester est le premier qui a employé le mot « matrix » en 1850. L’année suivante, il
explicite l’analogie qui l’a conduit à ce terme.
I have in a previous paper defined a “Matrix” as a rectangular array of
terms, out of which different systems of determinants may be engendered,
as from the womb of a common parent.
Au début, une matrice n’était donc qu’un tableau à partir duquel étaient engendrés
des déterminants. C’est Cayley qui a le premier en 1858 traité les matrices comme
de nouveaux objets mathématiques, susceptibles d’être ajoutés et multipliés. Lisez le
début de « A memoir on the Theory of Matrices », et admirez l’élégance et la concision
du style (les notations ont légèrement changé).
The term matrix might be used in a more general sense, but in the present
memoir I consider only square and rectangular matrices, and the term ma-
trix used without qualification is to be understood as meaning a square
matric ; in this restricted sense, a set of quantities arrranged in the form of
a square, e. g.
a, b, c,

a0 , b 0 , c 0 ,

00
a , b00 c00 ,

is said to be a matrix.
[. . . ]
It will be seen that matrices (attending only to those of the same order)
comport themselves as single quantities ; they may be added, multiplied
or compounded together, &c. : the law of addition of matrices is precisely
similar to that for the addition of ardinary algebraix quantities ; as regards
their multiplication (or composition), there is the peculiarity that matrices
are not in general convertible ; it is nevertheless possible to form the powers
1. N.J. Higham : Cayley, Sylvester and early matrix theory Lin. Alg. Appl. 428 p. 39–43 (2008)
30
(positive or negative, integral or fractional) of a matrix, and thence to

arrrive at the notion of a rational and intergal function, or generally os any
algebraical function, of a matrix.
Le style de Sylvester était moins dépouillé que celui de Cayley. Ils se rejoignaient
pourtant dans leurs opinions esthétiques.
Cayley : « As for everything else, so for a mathematical theory : beauty can be
perceived but not explained.
Sylvester : « May not music be described as the mathematics of the sense, mathe-
matics as music of the reason ? The musician feels mathematics, the mathemati-
cian thinks music : music the dream, mathematics the working life.
3.2 Diagonalisation
Voici deux systèmes linéaires d’équations.
 

 y +z = 1 
 x = 0

 

 
(a)  − 12 x + 23 y − 12 z = 0 (d)  −y = −1

 

3
− 23 y + 12 z = −1
 
x 2z = 0
 
2
Voici deux systèmes linéaires d’équations de récurrence.

 

 uk+1 = vk +wk 
 uk+1 = uk

 

 
(a) vk+1 = − 12 uk + 32 vk − 21 wk (d) vk+1 = −vk

 

 
3
− 32 vk + 21 wk
 
wk+1 = u wk+1 = 2wk
 
2 k
Voici deux systèmes linéaires d’équations différentielles.
x0 (t) = x0 (t) = x(t)

 

 y(t) +z(t) 


 

 
(a) y 0 (t) = − 21 x(t) + 32 y(t) − 12 z(t) (d) y 0 (t) = −y(t)

 

 
z 0 (t) = 3
− 32 y(t) + 12 z(t) z 0 (t) =
 
x(t) 2z(t)
 
2
Les trois problèmes, de natures très différentes, ont en commun leur écriture matricielle,
avec les deux matrices suivantes.
0 1 1 1 0 0
   
   
− 21 3
− 12
   
A= 
 2

 D= 
 0 −1 0 

   
3
2
− 32 1
2
0 0 2
Tous les problèmes linéaires sont plus faciles à résoudre quand la matrice est diagonale !
31
Il se trouve que les deux matrices A et D sont semblables, c’est-à-dire qu’elles

représentent le même endomorphisme dans deux bases différentes, ou encore, il existe
une matrice de passage P telle que P −1 AP = D.
 1 1 1 
0 1 1 1 −1 0 1 0 0
    
2 2 2
      
− 12 1 1  
 
− 21 3
− 21
    

 2 2  

2



 1 0 1 


 0 −1 0 

=
      
− 12 1
2
− 12 3
− 32 1
0 1 −1 0 0 2
| {z }| 2 2
{z } | {z } | {z }
P −1 A P D
Définition 8. Une matrice carrée A ∈ Mn est diagonalisable si elle est semblable à

une matrice diagonale, c’est-à-dire s’il existe une matrice de passage P telle que
P −1 AP = D .
Les techniques permettant de savoir si une matrice donnée est diagonalisable et

de calculer la matrice de passage P si elle l’est, dépassent le cadre de ce cours. On
commence par calculer les coefficients diagonaux de D, qui sont les valeurs de λ telles
que A − λIn n’est pas inversible : on les appelle les valeurs propres, et leur ensemble
est le spectre de la matrice. Pour chaque valeur propre λ, on détermine ensuite le sous-
espace propre associé à λ : c’est l’ensemble des vecteurs v tels que (A − λIn )v = 0.
La matrice est diagonalisable lorsqu’on peut trouver une base de Rn constituée de
vecteurs appartenant aux sous-espaces propres. La matrice de passage P est la matrice
exprimant ces vecteurs dans la base canonique. Quelques exemples élémentaires sont
donnés dans les exercices 10 et 11.
Quand une matrice A est diagonalisable, il est facile de résoudre le système linéaire
Ax = b : il est équivalent au système Dy = c, avec y = P −1 x et c = P −1 b. Or dans
un système dont la matrice est diagonale, toutes les équations n’ont qu’une inconnue
et se résolvent séparément.
Prenons maintenant l’exemple d’un système d’équations de récurrence linéaire, du
type Uk+1 = A Uk , où Uk désigne un vecteur dont on souhaite connaître l’expression en
fonction de k. Du point de vue théorique, il n’y a pas de problème :
Uk = Ak U0 .
Mais cela n’avance à rien si on ne sait pas calculer formellement l’expression de Ak en

fonction de k. C’est possible si A est diagonalisable. En effet, si A = P DP −1 :
Ak = P DP −1 P DP −1 . . . P DP −1 = P Dk P −1 .
Ecrire Dk est immédiat. On en déduit l’expression générale de Ak , donc de Uk . Dans
32
l’exemple ci-dessus, on trouve :

(−1)k k k
− (−1) − (−1)
 
1 1 1
2
+ 2 2
+ 2 2
+ 2
 
 
k 2k 1 2k 1 2k 1 
A = −2 + + −2 +

2 2 2 2 
 

 
k (−1)k (−1)k
2k 2k 2k
− (−1)
2
+ 2 2
− 2 2
+ 2
Passons maintenant aux systèmes d’équations différentielles, du type
Y 0 (t) = A Y (t) , (1)
où Y est une fonction (inconnue) de R dans Rn , et A ∈ Mn est une matrice carrée de

réels. Si A = P DP −1 , alors
P −1 Y 0 (t) = D(P −1 Y (t)
Donc X(t) = P −1 Y (t) est solution du système X 0 (t) = DX(t). En posant X(t) =
(x1 (t), . . . , xn (t)), ce système s’écrit
∀i = 1, . . . , n , x0i (t) = λi xi (t) .
Sa solution est facile à calculer :
∀i = 1, . . . , n , xi (t) = eλi t xi (0) .
Le vecteur des conditions initiales pour le système diagonalisé est X(0) = P −1 Y (0).
Connaissant X(t), on en déduit Y (t) = P X(t).
Soit par exemple à résoudre
x0 (t) =


 y(t) +z(t)



y 0 (t) = − 21 x(t) + 32 y(t) − 12 z(t) ,



z 0 (t) = 3
− 32 y(t) + 12 z(t)

x(t)

2
avec les conditions initiales x(0) = 0, y(0) = 1, z(0) = 2. Le système s’écrit sous la
forme Y 0 (t) = A Y (t), avec
x(t) 0 1 1
   
   
− 12 3
− 12
   
Y (t) = 
 y(t) 
 et A= 
 2

 .
   
3
z(t) 2
− 23 1
2
33
En utilisant la diagonalisation de A, on obtient

3 t 3 −t

x(t) = e − e






 2 2
3 t 1 2t


y(t) = e − e


 2 2
3 −t 1 2t



z(t) = e + e



2 2
Présentée ainsi la diagonalisation semble un outil magique. En réalité, les algo-

rithmes qui calculent numériquement les valeurs propres et les vecteurs propres sont
relativement lents et il est impossible de diagonaliser une matrice si sa dimension dé-
passe quelques dizaines.
3.3 Décomposition LU
La méthode du pivot de Gauss n’est pas exactement programmée comme elle a
été présentée. Il y a plusieurs raisons à cela, dont la principale est le problème de la
précision numérique.
Voici un système de deux équations à deux inconnues, dépendant du paramètre
ε 6= 0.
1
− (2 − 1ε )/(1 − 1ε ))
  
 εx + y = 1  εx + y = 1  x = ε
(1
⇐⇒ ⇐⇒
x+y = 2 (1 − 1ε )y = 2 − 1
y = (2 − 1ε )/(1 − 1ε )
  
ε
Voici le même système, après avoir échangé les deux équations.

x = 2 − (1 − 2ε)/(1 − ε)
  
 x+y = 2  x+y = 2 
⇐⇒ ⇐⇒
εx + y = 1 (1 − ε)y = 1 − 2ε y = (1 − 2ε)/(1 − ε)
  
Les deux solutions sont évidemment les mêmes. Pourtant, si ε est très petit en valeur
absolue, les deux calculs ne sont pas du tout équivalents numériquement : diviser par
un petit nombre, ou multiplier par un grand nombre, augmente les erreurs d’approxi-
mation.
Telles que nous les avons présentées, les permutations de lignes et de colonnes
servent à assurer que les pivots restent non nuls. La plupart des systèmes que l’on
rencontre en pratique ont une solution unique : ce sont des systèmes de n équations
à n inconnues, de rang n. En général, on peut leur appliquer la méthode du pivot de
Gauss sans rencontrer de pivot nul. Mais on utilise quand même les permutations de
lignes et de colonnes, pour faire en sorte qu’à chaque étape, le pivot soit le plus grand
possible en valeur absolue.
Permuter les lignes d’une matrice, revient à la multiplier à gauche par une matrice
de permutation. Une matrice de permutation est la matrice de passage de la base
34
(b1 , . . . , bn ) à la base (bσ(1) , . . . , bσ(n) ), où σ est une bijection de {1, . . . , n} dans lui-
même. Ses coefficients d’ordre (σ(i), i) valent 1, les autres 0. Permuter les colonnes
d’une matrice, revient à la multiplier à droite par une autre matrice de permutation.
En permutant les lignes et les colonnes, on remplace la matrice A par la matrice P1 AP2
où P1 et P2 sont deux matrices de permutation.
Dans sa version la plus courante, l’algorithme ne considère que des permutations de
lignes : il remplace donc la matrice A par P A, où P est une matrice de permutation.
Une fois choisi l’ordre dans lequel on traite les lignes, la i-ième étape de la méthode
consiste à ajouter aux lignes d’indice i + 1, i + 2, . . . , n la i-ième ligne multipliée par un
certain coefficient. Cela revient à multiplier à gauche par une matrice du type suivant.
 
1 0 ··· ··· ··· 0

. .. .. .. 
 0

. . 

 .. .. .. 

 . 1 . . 

 . . . . . . . .. 
 
 .. λi+1,i . 
 
 . .. ...
 ..

 . 0  
0 · · · λm,i 0 ··· 1
Le produit de ces matrices, pour i allant de 1 à m est la matrice ci-dessous.

 
1 0 ··· ··· ··· 0

... ... .. 
λ2,1 .
 
 

.. ... .. 
. 1 .
 
 
.. ..
 
 .. .. 

 . λi+1,i . . . 

 .. .. 

 . . 1 0 

λm,1 · · · λm,i ··· λm,m−1 1
Son inverse est encore une matrice du même type : trianglaire inférieure avec des 1
sur la diagonale. On la note L (pour « lower triangular »). Le produit L−1 P A est une
matrice triangulaire supérieure, que l’on note U pour « upper triangular » : U est la
forme échelonnée de A.
L−1 P A = U ⇐⇒ P A = LU .
La décomposition LU de la matrice A est la donnée des trois matrices P, L, U telles
que P A = LU .
Si on doit résoudre le système Ax = b, on le transformera en deux systèmes trian-
gulaires, un de matrice L, l’autre de matrice U .

 Ly = P b
Ax = b ⇐⇒ P Ax = P b ⇐⇒ LU x = P b ⇐⇒ 
Ux = y
35
Il arrive fréquemment que l’on ait à résoudre successivement de nombreux systèmes

linaires ayant tous la même matrice A, mais des seconds membres différents. Calculer
au préalable la décomposition LU de A réduit de beaucoup le temps de calcul. Pour
certaines matrices qui reviennent souvent dans les calculs, la décomposition LU figure
dans les bibliothèques de codes, et elle est chargée en mémoire avant le début du calcul.
36
Espaces vectoriels
Bernard Ycart
Vous devez vous habituer à penser en termes de « vecteurs » dans un sens très
général : polynômes, matrices, suites, fonctions, etc. Le problème est que, contrairement
à R2 ou R3 , il est difficile de visualiser des vecteurs dans un espace de dimension
infinie. . . quand ce sont des fonctions par exemple ! Avoir assimilé la théorie de la
dimension finie serait une bonne idée avant d’attaquer ce chapitre.
Table des matières

1 Cours 1
1.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Sous-espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Familles génératrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Familles libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Dimension finie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Applications linéaires . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Projections et symétries . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.8 Récurrences linéaires d’ordre deux . . . . . . . . . . . . . . . . . . . . . 20
2 Entraînement 24
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Compléments 40
3.1 Kate and William : so romantic ! . . . . . . . . . . . . . . . . . . . . . 40
3.2 Équations de récurrence linéaires . . . . . . . . . . . . . . . . . . . . . 41
3.3 Équations différentielles linéaires . . . . . . . . . . . . . . . . . . . . . 42
3.4 Polynômes de Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.5 Transformée de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1er décembre 2014

Maths en Ligne Espaces vectoriels UJF Grenoble
1 Cours
1.1 Définition
Un espace vectoriel est un ensemble sur lequel sont définies :
• une addition interne (on peut ajouter entre eux deux éléments de l’ensemble et
cela donne un élément de l’ensemble)
nombre réel et cela donne un élément de l’ensemble).
Ces deux opérations doivent vérifier certaines propriétés de compatibilité qui sont listées
dans la définition 1.
Définition 1. On dit que E est un espace vectoriel sur R si E est muni d’une addition
et d’une multiplication
( externe vérifiant les propriétés suivantes.
E × E −→ E
• Addition :
(v, w) 7−→ v + w
1. Associativité : ∀u, v, w ∈ E , u + (v + w) = (u + v) + w
2. Élément neutre : ∃e ∈ E , ∀v ∈ E , v+e=e+v =v
3. Opposé : ∀v ∈ E , ∃v 0 ∈ E , v + v0 = v0 + v = e
4. Commutativité : ∀v, w ∈ E , v+w =w+v
(
R × E −→ E
(λ, v) 7−→ λ v
5. Associativité : ∀λ, µ ∈ R , ∀v ∈ E , λ(µ v) = (λµ) v
6. Élément neutre : ∀v ∈ E , 1v = v
7. Distributivité (1) : ∀λ, µ ∈ R , ∀v ∈ E , (λ + µ) v = λ v + µ v
8. Distributivité (2) : ∀λ ∈ R , ∀v, w ∈ E , λ (v + w) = λ v + λ w
La proposition suivante nous autorisera à noter 0 l’élément neutre pour l’addition

(nous l’appellerons « vecteur nul ») et −v l’opposé de v.

1. Le produit par le réel 0 d’un vecteur v quelconque est l’élément neutre pour l’ad-
dition :
∀v ∈ E , 0 v = e .
2. Le produit par le réel −1 d’un vecteur v quelconque est son opposé pour l’addition :
∀v ∈ E , v + (−1) v = e .
1
Démonstration : Notons (provisoirement) v 0 l’opposé de v pour l’addition : v + v 0 = e.

En utilisant les propriétés de la définition 1 :
0v = 0v + e par 2.
= 0 v + (v + v 0 ) par 3.
= 0 v + (1 v + v 0 ) par 6.
= (0 v + 1 v) + v 0 par 1.
= (0 + 1) v + v 0 par 7.
= 1 v + v0 = v + v0 = e par 6.
Ceci démontre le premier point. Pour le second, il suffit d’écrire
v + (−1) v = 1 v + (−1) v = (1 + (−1)) v = 0 v = e .

Le singleton contenant seulement le vecteur nul est un espace vectoriel particulier.
Ce n’est pas le plus intéressant. Voici quelques ensembles, naturellement munis d’une
addition et d’une multiplication externe. Nous démontrerons plus loin que tous sont
effectivement des espaces vectoriels.
1. Nombres complexes : C = { a + ib , a, b ∈ R }.
L’ensemble des complexes est muni de l’addition et de la multiplication par un
réel, qui agissent sur les parties réelles et imaginaires.
• Addition : (2 + 3i) + (1 − 2i) = 3 + i
• Multiplication externe : (−2)(2 − 3i) = −4 + 6i
2. n-uplets de réels : Rn = { (x1 , . . . , xn ) , x1 , . . . , xn ∈ R }.
L’ensemble des n-uplets de réels (couples pour n = 2, triplets pour n = 3, . . . ) est
• Addition : (1, 2, 3, 4) + (3, −1, −2, 2) = (4, 1, 1, 6)
3. Matrices à coefficients réels : Mm,n = { (ai,j ) , ai,j ∈ R , 1 6 i 6 m , 1 6 j 6 n }.
L’ensemble des matrices à m lignes et n colonnes, à coefficients réels, est muni
de l’addition et de la multiplication
! par un réel, coefficient
! par coefficient.
!
1 −2 3 −6 5 −4 −5 3 −1
• Addition : + =
−4 5 −6 3 −2 1 −1 3 −5
! !
1 −2 3 −2 4 −6
• Multiplication externe : (−2) =
−4 5 −6 8 −10 12
4. Suites de réels : RN = { (un ) , ∀n ∈ N, un ∈ R }.
L’ensemble des suites de réels est muni de l’addition et de la multiplication par
un réel, terme à terme.
• Addition : (2−n ) + (3n ) = (2−n + 3n )
• Multiplication externe : (−2) (2−n ) = (−2−n+1 )
2
5. Polynômes : R[X] = {a0 + a1 X + . . . + an X n , n ∈ N, (a0 , . . . , an ) ∈ Rn+1 }.

L’ensemble des polynômes d’une variable, à coefficients réels est aussi muni na-
turellement d’une addition et d’une multiplication externe.
• Addition : (−1 + 2X + 3X 2 ) + (3X − X 2 − 2X 4 ) = −1 + 5X + 2X 2 − 2X 4
• Multiplication externe : (−2) (3X − X 2 − 2X 4 ) = −6X + 2X 3 + 4X 4
6. Applications : RR = {f : x 7→ f (x) , ∀x ∈ R , f (x) ∈ R}.
L’ensemble des applications de R dans R est muni de l’addition des images et de
leur multiplication par un réel.
• Addition : (cos + sin) : x 7→ cos(x) + sin(x)
• Multiplication externe : (−2) cos : x 7→ −2 cos(x)
Il est inutile de s’inquiéter de la quantité de propriétés à vérifier dans la définition 1.
Dans tous les exemples que l’on rencontrera, les opérations sont parfaitement natu-
relles et leurs propriétés évidentes. On ne vérifie d’ailleurs jamais les 8 propriétés de la
définition 1. La raison pour laquelle c’est inutile sera explicitée dans la section suivante.
Remarquons seulement pour l’instant que tous les exemples ci-dessus peuvent être mis
en correspondance avec l’ensemble des applications d’un certain ensemble A, dans R.
Cela va sans dire pour les applications de R dans R. Les n-uplets de réels sont des
applications de {1, . . . , n} dans R. Les nombres complexes peuvent être identifiés à des
couples de réels, les matrices à des applications de {1, . . . , m} × {1, . . . , n} dans R. Les
suites sont des applications de N dans R. Nous verrons plus loin comment les poly-
nômes se ramènent à des suites. Nous nous contenterons donc de vérifier pour l’instant
que l’ensemble des applications de A dans R est un espace vectoriel.
Théorème 1. Soit A un ensemble quelconque et E = RA l’ensemble des applications
de A dans R :
E = { v : x ∈ A 7−→ v(x) ∈ R } .
L’ensemble E est muni des deux opérations suivantes.
• Addition : (v + w) : x 7−→ v(x) + w(x)
• Multiplication externe : (λ v) : x 7−→ λv(x)
Muni de ces deux opérations, E est un espace vectoriel sur R.
Démonstration : Chacune des propriétés requises par la définition 1 provient d’une

propriété analogue des réels. Plutôt que de répéter formellement les énoncés des pro-
priétés, il est plus intéressant de comprendre quels sont les objets que l’on manipule.
Par exemple, l’élément neutre pour l’addition, même si on le note aussi 0 n’est pas le
réel 0 : c’est l’application nulle.
(
A −→ R
0 :
x 7−→ 0
De même, l’opposé de v est l’application qui à x associe −v(x).
(
A −→ R
−v :
x 7−→ −v(x)
3
Considérons la propriété 5. de la définition 1.
∀λ, µ ∈ R , ∀v ∈ E , λ(µ v) = (λµ) v
Elle signifie ici :

« si on multiplie par λ l’application qui à x associe µ v(x), on trouve la
même chose que si on multiplie par λµ l’application qui à x associe v(x),
c’est-à-dire l’application qui à x associe (λµ) v(x), »
. . . ce qui est bien vrai, n’est-ce pas ?
Nous laissons au lecteur le plaisir de traduire de même chacune des propriétés de
la définition 1.
Nous ne parlerons dans ce chapitre que d’espaces vectoriels sur R. Cependant, on
peut remplacer R par un autre corps commutatif dans la définition 1, sans modifier
notablement la théorie. Hormis R, les corps les plus utilisés sont C et Z/2Z.
1.2 Sous-espaces vectoriels

La raison pour laquelle il est inutile en général de vérifier les 8 propriétés de la
définition 1. est que tous les espaces vectoriels que l’on utilise sont des sous-espaces
d’un espace vectoriel d’applications, c’est-à-dire qu’ils sont des sous-ensembles, sur
lesquels on applique localement les opérations de l’espace entier.
Définition 2. Soit E un espace vectoriel et F un sous-ensemble non vide de E. On

dit que F est un sous-espace vectoriel de E s’il est un espace vectoriel pour l’addition
et la multiplication externe de E.
Observons que tout sous-espace vectoriel de E contient au moins le vecteur nul. La

notion prend tout son intérêt grâce au théorème suivant.

L’ensemble F est un sous-espace vectoriel de E si et seulement si :
∀v, w ∈ F v+w ∈F
(1)
∀v ∈ F , ∀λ ∈ R λv ∈ F
Démonstration : Si F est un sous-espace vectoriel de E, alors c’est un espace vectoriel

et (1) est vrai.
Montrons la réciproque. Parmi les 8 propriétés de la définition 1, celles qui ne
font intervenir que le quantificateur ∀ (associativités, commutativité, distributivités),
puisqu’elles sont vraies dans E, restent vraies dans F à cause de (1). Il suffit donc
de vérifier les 2 propriétés impliquant une existence (élément neutre et opposé). Nous
devons démontrer que F contient le vecteur nul, ainsi que l’opposé de tout vecteur de
F . D’après le premier point de la proposition 1, le vecteur nul s’écrit 0 v pour tout
4
vecteur v de E, donc pour tout vecteur de F . Comme F est non vide, il est donc dans
F . De même si v est un vecteur de F , alors son opposé, qui s’écrit (−1) v d’après le
second point de la proposition 1, est aussi dans F .
Voici une première application. Une suite (un )n∈N de réels est nulle à partir d’un
certain rang (on dit aussi à support fini) s’il existe n0 ∈ N tel que pour tout n > n0 ,
un = 0. Tout polynôme peut être identifié à la suite de ses coefficients, qui est nulle
à partir d’un certain rang (le degré du polynôme, plus 1). La proposition suivante
démontre donc du même coup que l’ensemble des polynômes, muni de l’addition et de
la multiplication externe, est un espace vectoriel.
Proposition 2. L’ensemble des suites nulles à partir d’un certain rang est un sous-
espace vectoriel de l’espace vectoriel des suites de réels.
Démonstration : Soit (un ) une suite, nulle à partir du rang n0 , et (vn ) une suite nulle
à partir du rang n1 . Alors la suite (un + vn ) est nulle, au moins à partir du rang
max{n0 , n1 } (et peut-être avant). Pour tout λ ∈ R, la suite (λun ) est nulle, au moins
à partir du rang n0 .
Le résultat suivant découle tout aussi facilement du théorème 2.
Proposition 3. L’intersection de deux sous-espaces vectoriels est un sous-espace vec-

toriel.
La réunion de deux sous-espaces vectoriels n’est pas un espace vectoriel en général

(pensez à deux droites distinctes).
Pour chacun des espaces vectoriels donnés en exemple à la section précédente, nous
donnons dans les tableaux ci-dessous des sous-ensembles qui sont des sous-espaces
vectoriels, et d’autres qui n’en sont pas. Nous conseillons au lecteur de le démontrer
pour chacun. Pour démontrer qu’un ensemble est un sous-espace vectoriel, il suffit
d’appliquer le théorème 2. Pour démontrer qu’un ensemble n’est pas un sous-espace
vectoriel, il suffit de trouver un contre-exemple : vérifiez d’abord si 0 appartient à
l’ensemble : si ce n’est pas le cas, c’est terminé. Sinon, vérifiez si l’opposé d’un vecteur
de l’ensemble est dans l’ensemble. Si c’est encore vrai, trouvez deux vecteurs particuliers
de l’ensemble, tels que leur somme n’y soit pas.
Complexes
Oui Non
{ z ∈ C , Re(z) = 0 } { z ∈ C , Re(z) = 1 }
{ z ∈ C , |z| = 0 } { z ∈ C , |z| = 1 }
{ z ∈ C , |z − e | = |z + e | } { z ∈ C , |z − eiπ/4 | = |z| }
iπ/4 iπ/4
5
Couples de réels
Oui Non
{ (x, y) ∈ R2 , x = 0 } { (x, y) ∈ R2 , x = 1 }
{ (x, y) ∈ R2 , 3x − 2y = 0 } { (x, y) ∈ R2 , 3x2 − 2y 2 = 0 }
{ (x, y) ∈ R2 , 2x + 3y = 0 } { (x, y) ∈ R2 , sin(3x + 2y) = 0 }
Matrices
Oui Non
t
{ A ∈ M2,2 (R) , A= A } { A ∈ M2,2 (R) , A = A2 }
{ A ∈ M2,2 (R) , A 11 = 00 } { A ∈ M2,2 (R) , A 11 = 11 }
{ A ∈ M2,2 (R) , tr(A) = 0 } { A ∈ M2,2 (R) , det(A) = 0 }
Suites de réels
Oui Non
{ (un ) , u0 = 0 } { (un ) , u0 = 1 }
{ (un ) , ∃ l lim un = l } { (un ) , lim un = +∞ }
{ (un ) , ∀n , un+1 = 2un } { (un ) , ∀n , un+1 = un + 1 }
Polynômes
Oui Non
{ P ∈ R[X] , deg(P ) 6 5 } { P ∈ R[X] , deg(P ) = 5 }
{ P ∈ R[X] , P (X) = P (−X) } { P ∈ R[X] , P 2 (X) = P 2 (−X) }
{ P ∈ R[X] , P (2) + P 0 (2) = 0 } { P ∈ R[X] , P (2) + P 0 (2) = 1 }
Fonctions de R dans R
Oui Non
{ f , f (0) = 0 } { f , f (1) = 1 }
{ f , continues en 0 } { f , |f | continue en 0 }
{ f , dérivables sur ]0, 1[ } { f , non dérivables en 0 }
Dans un espace vectoriel, l’associativité de l’addition permet d’écrire (sans parenthèses)

des combinaisons linéaires de vecteurs.
Définition 3. Soient v1 , . . . , vn n vecteurs d’un espace vectoriel E. On appelle combi-
naison linéaire de v1 , . . . , vn , tout vecteur s’écrivant :
n
X
λ1 v1 + · · · + λn vn = λi v i ,
i=1
6

Les trois affirmations suivantes sont équivalentes.
1. F est un sous-espace vectoriel de E.
2. F contient toutes les combinaisons linéaires de deux de ses vecteurs.
∀v, w ∈ F , ∀λ, µ ∈ R , λv + µw ∈ F
3. pour tout n > 1, F contient toutes les combinaisons linéaires de n de ses vecteurs.
n
X
∀v1 , . . . , vn ∈ F , ∀λ1 , . . . , λn ∈ R , λi vi ∈ F
i=1
Démonstration : Rappelons que F est un sous-espace vectoriel de E si et seulement

si il vérifie (1). L’équivalence entre (1) et 2 est un exercice facile, laissé au lecteur.
L’implication 3 =⇒ 2 est évidente. Nous allons démontrer la réciproque 2 =⇒ 3, par
récurrence sur n. Notons H(n) l’hypothèse de récurrence :
n
X
H(n) : ∀v1 , . . . , vn ∈ F , ∀λ1 , . . . , λn ∈ R , λi vi ∈ F
i=1
Le point 2 est H(2), et il implique H(1) (cas particulier µ = 0). Supposons que H(n)
soit vrai. Soient v1 , . . . , vn+1 des vecteurs de F et λ1 , . . . , λn+1 des réels. Ecrivons
n+1
X
λi vi = v + λn+1 vn+1 ,
i=1
avec n
X
v= λi vi
i=1
Le vecteur v appartient à F , par H(n). La combinaison linéaire v +λn+1 vn+1 appartient
à F d’après H(2), d’où le résultat.
1.3 Familles génératrices

D’après le théorème 3, un sous-espace vectoriel contient toutes les combinaisons
linéaires d’un nombre quelconque de vecteurs : pour tout entier n, pour tous vecteurs
v1 , . . . , vn de E, et pour tous réels λ1 , . . . , λn ,
n
X
λ1 v1 + · · · + λn vn = λi v i ∈ E .
i=1
Une des manières de fabriquer un sous-espace vectoriel est de partir d’une famille
d’éléments, puis de lui adjoindre toutes les combinaisons linéaires de ces éléments. Une
famille d’éléments de E est définie comme une application d’un ensemble d’indices I,
à valeurs dans E.
V = vi , i ∈ I
7
Définition 4. Soit E un espace vectoriel et V une famille de vecteurs de E. On ap-

pelle sous-espace engendré par V l’ensemble des combinaisons linéaires de sous-familles
finies quelconques d’éléments de V.
On dit que V est une famille génératrice pour E si le sous-espace engendré par V
est E lui-même.
L’ensemble des combinaisons linéaires d’éléments de V est un espace vectoriel,

d’après le théorème 3. Le même théorème implique aussi que tout espace vectoriel
contenant V doit contenir toutes les combinaisons linéaires de ses éléments. Donc le
sous-espace engendré par V est inclus dans tout sous-espace contenant V. Voici quelques
exemples de familles avec les espaces qu’elles engendrent.
Complexes
Famille

Espace engendré
i { z ∈ C , Re(z) = 0 }

eiπ/4 { z ∈ C , Re(z) = Im(z) }

1, i C
Couples de réels
Famille

Espace engendré
(0, 1) { (x, y) ∈ R2 , x = 0 }

(1, 1) { (x, y) ∈ R2 , x = y }

(0, 1), (1, 1) R2
Matrices
Famille! ! Espace
(
engendré
!)
0 0 0 0
0 0 !! (
0! 0 )
1 0 λ 0
, λ∈R
0 1
! !!
0 λ
1 −1 0 0 n o
, A ∈ M2,2 (R) , A 11 = 00
0 0 1 −1
Suites de réels
Famille

Espace engendré
(2n ) { (un ) , ∀n , un+1 = 2un }

(un ) , ∃ n0 , ∀n 6= n0 , un = 0 { (un ) , ∃ n0 , ∀n > n0 , un = 0 }

(un ) , ∀n , un ∈ [0, 1] { (un ) , ∃M , |un | 6 M }
8
Polynômes
Famille

Espace engendréo
X { λX , λ ∈ R

1 + X, 1 − X { P ∈ R[X] , deg(P ) 6 1 }

P ∈ R[X] , P (1) = 1 R[X]
Fonctions de R dans R
Famille

Espace engendré
cos { λ cos , λ ∈ R }

cos, sin { λ cos +µ sin , λ, µ ∈ R }

f , f (0) = 1 RR
Notre définition de la somme de deux sous-espaces utilise la notion de sous-espace

engendré.
Définition 5. Soient E un espace vectoriel, F et G deux sous-espaces vectoriels de E.

On appelle somme de F et G, et on note F + G, l’espace engendré par la famille des
vecteurs de F ∪ G.
Si F ∩ G = {0}, on dit que la somme est directe, et on la note F ⊕ G.
Si F ⊕ G = E, on dit que F et G sont supplémentaires dans E.
La justification du terme « somme » et l’intérêt de cette notion résident dans la

proposition suivante.
Proposition 4. Soient E un espace vectoriel, F et G deux sous-espaces vectoriels de

E.
1. F + G = { v + w , v ∈ F , w ∈ G }.
2. Si F ∩ G = {0}, alors pour tout vecteur u dans F ⊕ G il existe un unique couple
de vecteurs (v, w), tels que v ∈ F , w ∈ G et u = v + w.
La figure 1 illustre la notion de somme directe.
Démonstration : Tout vecteur de la forme v + w, où v ∈ F et w ∈ G, appartient à

l’espace engendré par F ∪ G. Réciproquement l’espace engendré par F ∪ G est formé
des combinaisons linéaires d’un nombre quelconque d’éléments de F ∪G. Mais une telle
combinaison linéaire peut s’écrire comme la somme de deux combinaisons linéaires :
l’une ne contient que des éléments de F , et appartient donc à F , l’autre ne contient
que des éléments de G, et appartient donc à G.
Dans le cas où la somme est directe, l’existence de la décomposition u = v + w est
démontrée par ce qui précède. Nous devons prouver l’unicité. Supposons u = v1 + w1 =
v2 + w2 , avec v1 , v2 ∈ F et w1 , w2 ∈ G. Les deux vecteurs v1 − v2 et w2 − w1 sont égaux,
9
w u
Figure 1 – Somme directe d’espaces vectoriels et décomposition d’un vecteur de la

somme.
donc ils appartiennent à la fois à F et à G. Par hypothèse, F ∩ G = {0}, donc v1 = v2

et w1 = w2 .
Dans l’espace vectoriel R[X] des polynômes, considérons les deux familles suivantes :

V = X 2k , k ∈ N et W = X 2k+1 , k ∈ N
Ce sont respectivement les familles des monômes de degrés pairs, et des monômes de
degré impair. Soient F et G les espaces vectoriels engendrés respectivement par V et W.
L’espace vectoriel F contient tous les polynômes constitués uniquement de monômes
de degrés pairs : par exemple, 1+3X 2 −2X 4 . L’espace vectoriel G contient le polynôme
nul, et tous les polynômes constitués uniquement de monômes de degrés impairs : par
exemple, X + 2X 3 − X 5 . L’intersection de F et G est réduite au polynôme nul. De
plus, tout polynôme de R[X] s’écrit (de façon unique) comme somme d’un élément de
F et d’un élément de G. Par exemple :

1 + X + 3X 2 + 2X 3 − 2X 4 − X 5 = 1 + 3X 2 − 2X 4 + X + 2X 3 − X 5
Les sous-espaces F et G sont supplémentaires dans R[X].
1.4 Familles libres

Définition 6. Soit E un espace vectoriel, et V une famille de vecteurs. On dit que
V est une famille libre si pour tout entier n > 1 et pour tout n-uplet (v1 , . . . , vn ) de
vecteurs de V,
n
X
λi vi = 0 =⇒ ∀i = 1, . . . , n , λi = 0
i=1
10
Une famille (quelconque) de vecteurs est libre si toute sous-famille finie est libre : la
seule combinaison linéaire nulle de ces vecteurs, a tous ses coefficients nuls. Observons
que si une famille est libre dans un espace vectoriel E, elle reste libre dans n’importe
quel espace vectoriel contenant E ou contenu dans E. Dans le cas contraire, elle est
dite liée.
Nous rassemblons dans la proposition suivante des exemples classiques de familles
libres, dans l’espace des polynômes, des suites, et des fonctions.
Proposition 5.
1. Dans l’espace vectoriel des polynômes, toute famille de polynômes non nuls, de
degrés distincts deux à deux, est libre.
2. Dans l’espace vectoriel des suites de réels, la famille des suites de la forme (rk )k∈N ,
pour r > 0, est libre.
3. Dans l’espace vectoriel des fonctions de R dans R, la famille des fonctions de la
forme x 7→ eαx , pour α ∈ R, est libre.
Démonstration : Pour démontrer qu’une famille est libre, nous devons montrer que
toute sous-famille finie de n vecteurs est libre, pour tout n. Les trois démonstrations
se font par récurrence sur n. Pour initialiser les récurrences, observons que la famille
formée d’un seul vecteur non nul est toujours libre, quel que soit l’espace.
1. Soient P1 , . . . , Pn des polynômes non nuls, de degrés distincts deux à deux. Sans
perte de généralité, supposons que les polynômes ont été rangés par ordre crois-
sant de leurs degrés. Si λ1 P1 + · · · + λn Pn = 0, alors le coefficient du terme de
plus haut degré est nul, donc λn = 0. D’où le résultat, par récurrence.
2. Soient r1 , . . . , rn des réels strictement positifs, distincts deux à deux. Supposons-
les rangés par ordre croissant. Supposons que la suite de terme général λ1 r1k +
· · · + λn rnk soit nulle. Puisque rn est strictement supérieur à tous les autres ri ,
1
lim k
(λ1 r1k + · · · + λn rnk ) = λn ,
n→∞ rn
donc λn = 0. D’où le résultat, par récurrence.
3. Soient α1 , . . . , αn des réels, distincts deux à deux. Supposons-les rangés par ordre
croissant. Supposons que la fonction x 7→ λ1 eα1 x +· · ·+λn eαn x soit nulle. Puisque
αn est strictement supérieur à tous les autres αi ,
1
lim (λ1 eα1 x + · · · + λn eαn x ) = λn ,
x→+∞ eα n x
donc λn = 0. D’où le résultat, par récurrence.

Par exemple :
11

1. 1, 2X + 3X 2 , 3X − X 2 + X 3 est une famille de polynômes, libre dans R[X].

2. (2−k )k∈N , (2k )k∈N , (3k )k∈N est une famille de suites, libre dans RN .

3. x 7→ e−x , x 7→ 1, x 7→ ex est une famille de fonctions, libre dans RR .
1.5 Dimension finie

La théorie de la dimension, qui est traitée dans un autre chapitre, est supposée
connue. Nous rappelons ici quelques uns des principaux résultats.
Définition 7. Soit E un espace vectoriel contenant des vecteurs non nuls. On dit
que E est finiment engendré s’il est engendré par une famille finie de vecteurs. Soit
(v1 , . . . , vn ) un n-uplet de vecteurs de E. On dit que (v1 , . . . , vn ) est une base de E si
c’est à la fois une famille génératrice et libre.
Le résultat le plus important est le théorème suivant.
Théorème 4. Dans un espace vectoriel contenant des vecteurs non nuls, finiment
engendré, il existe des bases et toutes les bases ont le même nombre d’éléments.
Ceci permet d’appeler dimension de l’espace, le cardinal commun de toutes les

bases. On convient de dire que l’espace contenant uniquement le vecteur nul, est de
dimension 0. Les coordonnées d’un vecteur sont définies grâce au résultat suivant.
Théorème 5. Soit E un espace vectoriel de dimension n et (u1 , . . . , un ) une base de

E. Pour tout x ∈ E, il existe un unique n-uplet de réels (x1 , . . . , xn ) tel que
n
X
v= xi ui
i=1
Les réels x1 , . . . , xn sont les coordonnées de v dans la base (u1 , . . . , un ).

Considérons par exemple l’espace vectoriel des polynômes de degrés inférieurs ou égaux
à 3. C’est un espace vectoriel de dimension 4, dont la base la plus naturelle (base
canonique) est :
1 , X , X2 , X3
Dans cette base, les coordonnées du polynôme 2−X 2 +X 3 sont (2, 0, −1, 1). Considérons
maintenant une nouvelle famille.

1 , (1 + X) , (1 + X + X 2 ) , (1 + X + X 2 + X 3 )
C’est une famille de polynômes de degrés distincts, donc par la proposition 5, c’est
une famille libre. Dans un espace de dimension 4, une famille libre de 4 éléments est
12
forcément génératrice : c’est une base. Le polynôme 2 − X 2 + X 3 s’écrit de façon unique

comme combinaison linéaire des éléments de cette nouvelle base :
2 − X 2 + X 3 = 2(1) + 1(1 + X) + −2(1 + X + X 2 ) + 1(1 + X + X 2 + X 3 )
Les coordonnées de 2 − X 2 + X 3 dans la nouvelle base sont donc (2, 1, −2, 1).
Dans un espace vectoriel de dimension finie, tout sous-espace est lui-même de dimen-
sion finie, inférieure ou égale à celle de l’espace. Le théorème de la base incomplète dit
que dans un espace vectoriel de dimension finie, toute famille libre peut être complétée
en une base de l’espace. On en déduit immédiatement l’existence de supplémentaires.
Proposition 6. Soit E un espace vectoriel de dimension finie et F un sous-espace

vectoriel de E. Il existe un sous-espace vectoriel G tel que F ⊕ G = E. De plus :
dim(E) = dim(F ) + dim(G)
Démonstration : Soit (b1 , . . . , bk ) une base de F . Le théorème de la base incomplète

affirme qu’il existe des vecteurs c1 , . . . , cn−k tels que :

b1 , . . . , bk , c1 , . . . , cn−k
soit une base de E. Soit G l’espace engendré par (c1 , . . . , cn−k ). Tout vecteur de E
s’écrit :
k
X n−k
X
v= λ i bi + µ j cj
i=1 j=1
La première somme est un vecteur de F , la seconde un vecteur de G, donc E = F + G.

Il reste à vérifier que l’intersection est réduite au seul vecteur nul. Si
k
X n−k
X
λi bi = µ j cj ,
i=1 j=1
alors nécessairement tous les coefficients λi et µj sont nuls, car (b1 , . . . , bk , c1 , . . . , cn−k )
est une famille libre. D’où le résultat.
La proposition suivante relie la dimension d’une somme de sous-espaces vectoriels
à celles des composants.
Proposition 7. Soit E un espace vectoriel, F et G deux sous-espaces vectoriels, de

dimensions finies.
dim(F + G) = dim(F ) + dim(G) − dim(F ∩ G)
13
Démonstration : Choisissons un supplémentaire G0 de F ∩ G dans G. La somme de F

et G0 est directe, car G0 ∩ F = G0 ∩ (F ∩ G) = {0}. Donc :
F + G = F ⊕ G0 ,
Or dim(G0 ) = dim(G) − dim(F ∩ G). Donc :
dim(F + G) = dim(F ) + dim(G0 ) = dim(F ) + dim(G) − dim(F ∩ G) .
1.6 Applications linéaires

Une application entre deux espaces vectoriels est dite linéaire si elle respecte les
deux opérations définissant la structure.

F . On dit que f est une application linéaire si
∀v, w ∈ E f (v + w) = f (v) + f (w)

(2)
∀v ∈ E , ∀λ ∈ R f (λv) = λ f (v)
Une application linéaire f de E dans F envoie nécessairement le vecteur nul de E

sur le vecteur nul de F . Elle envoie l’opposé de v sur l’opposé de f (v). La proposition
suivante se démontre facilement, dans le style du théorème 3.
Proposition 8. Soient E et F deux espaces vectoriels, et f une application de E dans

F . Les trois affirmations suivantes sont équivalentes.
1. f est une application linéaire.
2.
∀v, w ∈ E , ∀λ, µ ∈ R , f (λ v + µ w) = λ f (v) + µ f (w) .
3. Pour tout n > 1,
n n
!
X X
∀v1 , . . . , vn ∈ E , ∀λ1 , . . . , λn ∈ R , f λi vi = λi f (vi )
i=1 i=1
D’une application entre deux ensembles munis d’une structure (groupes, anneaux,
etc.) qui respecte les structures, on dit qu’elle est un morphisme.

F . On dit que l’application f est un :
• morphisme si elle est linéaire,
• isomorphisme si elle est linéaire et bijective,
• endomorphisme si elle est linéaire et E = F ,
14
• automorphisme si elle est linéaire, bijective et E = F .
Voiciquelques exemples d’applications linéaires.

• de C dans R2 : z 7−→ (Re(z), Im(z))
• de C dans C : z 7−→ z
• de R2 dans R2 : (x, y) 7−→ (x + y, 2x + 3y)
• de Mn,n (R) dans Mn,n (R) : A 7−→ tA
• de RN dans R2 : (un )n∈N 7−→ (u0 , u1 )
• de R[X] dans R : P (X) 7−→ P (0)
• de R[X] dans R2 : P (X) 7−→ (P (0), P 0 (1))
• de R[X] dans R[X] : P (X) 7−→ (X + 1)P 0 (X)
• de l’espace vectoriel des suites convergentes, dans R : (un )n∈N 7−→ lim un
• de l’espace vectoriel des fonctions continûment dérivables, dans l’espace vectoriel
des fonctions continues : f 7−→ f 0
• de l’espace vectoriel des fonctions continues sur [a, b], dans R : f 7−→ ab f (x) dx
R
Le fait qu’une application linéaire respecte les combinaisons linéaires entraîne qu’elle
respecte aussi les sous-espaces vectoriels, au sens suivant.
Théorème 6. Soient E et F deux espaces vectoriels, et f une application linéaire de
E dans F .
1. Soit A un sous-espace vectoriel de E. Alors
f (A) = { f (v) , v ∈ A } ,
est un sous-espace vectoriel de F .

2. Soit B un sous-espace vectoriel de F . Alors
f −1 (B) = { v ∈ E , f (v) ∈ B } ,
est un sous-espace vectoriel de E.

L’ensemble des images par une application linéaire des éléments d’un espace vecto-
riel est un sous-espace vectoriel de l’espace d’arrivée (point 1). L’ensemble des éléments
de l’espace de départ dont l’image par une application linéaire est dans un sous-espace
de l’espace d’arrivée, est un sous-espace de l’espace de départ (point 2).
Attention à la notation f −1 (B) : elle a un sens même si l’application f n’est pas
bijective et donc même si l’application réciproque f −1 n’existe pas.
Démonstration : Pour montrer qu’un sous-ensemble est un sous-espace vectoriel, il

suffit de vérifier qu’il est non vide, et que toute combinaison linéaire de deux de ses
vecteurs reste dans l’ensemble (théorème 3). Rappelons que tout sous-espace vectoriel
contient au moins le vecteur nul, et que si f est linéaire alors f (0) = 0. Donc le vecteur
nul de F appartient à f (A) et celui de E appartient à f −1 (B). Les deux ensembles
f (A) et f −1 (B) sont donc non vides.
15
1. Deux vecteurs quelconques de f (A) s’écrivent f (v), f (v 0 ), où v, v 0 ∈ A. Etant

donnés deux réels λ et µ, λ f (v) + µ f (v 0 ) est l’image par f de λ v + µ v 0 qui est
un vecteur de A.
2. Si v et v 0 sont tels que f (v) et f (v 0 ) appartiennent à B, alors f (λ v + µ v 0 ) =
λ f (v) + µ f (v 0 ) ∈ B. Donc λ v + µ v 0 ∈ f −1 (B).

Parmi les cas particuliers du théorème 6, l’image et le noyau jouent un rôle important.
Définition 10. Soient E, F deux espaces vectoriels et f une application linéaire de E
dans F . On appelle
1. image de f et on note Im(f ) le sous-espace vectoriel de F :
Im(f ) = f (E) = { f (v) , v ∈ E } .
2. noyau de f et on note Ker(f ) le sous-espace vectoriel de E :
Ker(f ) = f −1 ({0}) = { v ∈ E , f (v) = 0 } .
La notation Ker vient de l’allemand, où noyau se dit « Kern ».

E dans F . L’application f est
1. surjective si et seulement si Im(f ) = F
2. injective si et seulement si Ker(f ) = {0}
Démonstration : La caractérisation de la surjectivité est une simple traduction des

définitions. Celle de l’injectivité utilise la linéarité. Soient v et w deux éléments de E.
f (v) = f (w) ⇐⇒ f (v − w) = 0 ⇐⇒ (v − w) ∈ Ker(f )
Par définition, f est injective si et seulement si f (v) = f (w) implique v = w, donc si

et seulement si (v − w) ∈ Ker(f ) implique v − w = 0, d’où le résultat.
Considérons la dérivation des polynômes. C’est l’application D de R[X] dans R[X]
qui à un polynôme associe son polynôme dérivé.
D
R[X] −→ R[X]
a0 + a1 X + · · · + an X n = P (X) 7−→ P 0 (X) = a1 + 2a2 X + · · · + nan X n−1 .
C’est une application linéaire. L’image de D est R[X] tout entier (D est surjective), le
noyau de D est l’ensemble des polynômes constants (D n’est pas injective). Une telle
situation, où l’espace de départ et l’image sont les mêmes tandis que le noyau est non
nul, est impossible entre espaces vectoriels de dimension finie.
16
Reprenons l’exemple de la dérivation des polynômes, mais cette fois-ci vue comme
une application de l’espace Rn [X] des polynômes de degré 6 n dans lui-même. L’es-
pace est de dimension n + 1, et la base canonique est (1, X, . . . , X n ). L’application D
envoie ces n + 1 polynômes, respectivement sur 0, 1, . . . , nX n−1 . Ils engendrent l’espace
vectoriel des polynômes de degré n − 1, qui est de dimension n. Le noyau de D est
R0 [X], et l’image de D est Rn−1 [X].
En dimension finie, la dimension de l’espace de départ est la somme de la dimension
de l’image et de la dimension du noyau : c’est le théorème du rang.
Théorème 7. Soient E et F deux espaces vectoriels et f une application linéaire de
E dans F . Si E est de dimension finie, il en est de même pour Im(f ) et Ker(f ) et :
dim(Im(f )) + dim(Ker(f )) = dim(E) .
Démonstration : celle que nous donnons ici est basée sur la notion de supplémentaire.
Soit (v1 , . . . , vn ) une base de E. Donc f (v1 ), . . . , f (vn ) est une famille génératrice
de Im(f ). Donc Im(f ) est finiment engendré, et admet une base. Chacun des éléments
de cette base est image d’un vecteur de E. Notons donc (f (c1 ), . . . , f (ck )) une base
de Im(f ). La famille (c1 , . . . , ck ) est libre, car sinon son image par f serait liée. Soit
G le sous-espace de E, engendré par (c1 , . . . , ck ). Nous allons montrer que G est un
supplémentaire de Ker(f ) dans E, ce qui implique le résultat.
Soit v un vecteur quelconque de E. Comme f (v) est un vecteur de Im(f ), il s’écrit :
k
X
f (v) = λi f (ci )
i=1
Posons :
k
X
w= λi ci
i=1
Alors :
k
!
X
f (v − w) = f (v) − λi f (ci ) = 0
i=1
Donc v − w ∈ Ker(f ). Donc v = (v − w) + w est somme d’un vecteur de Ker(f ) et
d’un vecteur de G. Pour montrer que la somme est directe, nous devons montrer que
l’intersection est réduite au vecteur nul. Prenons un vecteur de G sous la forme :
k
X
w= λi ci
i=1
S’il appartient aussi à Ker(f ), son image est nulle :

k
X
f (w) = λi f (ci ) = 0
i=1

Mais puisque f (c1 ), . . . , f (ck ) est une famille libre, ceci entraîne que les λi sont tous
nuls, donc w est le vecteur nul.
17
1.7 Projections et symétries

L’étude des projections et symétries, sera l’occasion de mettre en œuvre à la fois
des applications linéaires entre espaces vectoriels généraux et les sommes d’espaces
vectoriels. Aussi bien pour les projections que pour les symétries, l’ingrédient principal
est une somme directe. Soit E un espace vectoriel, F et G deux sous-espaces tels que
E = F ⊕ G. Pour tout vecteur u dans E, il existe un couple unique de vecteurs (v, w)
tels que v ∈ F , w ∈ G et u = v + w (voir la proposition 4 et la figure 1).
Définition 11. Soit E un espace vectoriel, F et G deux sous-espaces tels que E =
F ⊕ G.
1. On appelle projection sur F parallèlement à G l’application qui à u ∈ E associe
l’unique élément v de F tel que u − v ∈ G.
2. On appelle symétrie par rapport à F parallèlement à G l’application qui à u ∈ E
associe v − w, où (v, w) est le couple unique de vecteurs tels que v ∈ F , w ∈ G
et u = v + w.
La figure 2 illustre la projection sur F parallèlement à G et la symétrie correspon-
dante. Reprenons par exemple la décomposition de l’espace des polynômes R[X] =
F ⊕ G, où F (respectivement : G) est l’ensemble des polynômes ne contenant que des
termes de degré pair (respectivement : impair). La projection p sur F parallèlement à
G associe à un polynôme, le polynôme formé par ses termes de degré pair.
p(1 + X + 3X 2 + 2X 3 − 2X 4 − X 5 ) = 1 + 3X 2 − 2X 4
La symétrie par rapport à F change le signe des termes de degré impair (transformation
X 7→ −X).

s(1 + X + 3X 2 + 2X 3 − 2X 4 − X 5 ) = 1 + 3X 2 − 2X 4 − X + 2X 3 − X 5 )
Proposition 10. Soit E un espace vectoriel, F et G deux sous-espaces tels que E =

F ⊕ G. La projection sur F d’une part, et la symétrie par rapport à F parallèlement à
G d’autre part, sont des applications linéaires.
Démonstration : Si u = v + w et u0 = v 0 + w0 , alors
λ u + µ u0 = (λ v + µ v 0 ) + (λ w + µ w0 ) .
Puisque les vecteurs λ v + µ v 0 et λ w + µ w0 appartiennent respectivement à F et G, la

formule précédente donne la décomposition de λ u + µ u0 . Sa projection sur F est donc
λ v + µ v 0 , et son symétrique par rapport à F est
(λ v + µ v 0 ) − (λ w + µ w0 ) = λ (v − w) + µ (v 0 − w0 ) ,
18
w u
p(u)
−w s(u)
F
Figure 2 – Somme directe E = F ⊕ G, projection sur F , et symétrie par rapport à F .
La projection sur F parallèlement à G a pour image F et pour noyau G. La symétrie
est une bijection de E sur lui-même : c’est un automorphisme de E. La proposition sui-
vante caractérise les projections et les symétries, indépendamment de la décomposition
en somme directe.

1. Un endomorphisme p de E est une projection si et seulement si p ◦ p = p.
2. Un endomorphisme s de E est une symétrie si et seulement si s ◦ s = IE , où IE
désigne l’application identique de E.
Démonstration : Si p est la projection sur F parallèlement à G, alors pour tout v ∈ F ,

p(v) = v, et donc p ◦ p = p. Réciproquement, si p ◦ p = p, nous allons montrer que p est
la projection sur Im(p) parallèlement à Ker(p). Commençons par montrer que Im(p)
et Ker(p) sont supplémentaires, c’est-à-dire que E = Im(p) ⊕ Ker(p). Observons que
pour tout u ∈ E,
p(u − p(u)) = p(u) − p ◦ p(u) = 0 ,
donc u − p(u) ∈ Ker(p). On peut toujours écrire u = p(u) + (u − p(u)). Pour vérifier que
la somme est directe, nous devons montrer que l’intersection de l’image et du noyau
est réduite au vecteur nul. Si u ∈ Im(p) ∩ Ker(p), alors il existe v tel que u = p(v)
(puisque u est dans l’image), et de plus p(u) = 0 (puisque u est dans le noyau). Donc
p(p(v)) = 0. Mais p(p(v)) = p(v) = u. D’où le résultat.
Nous avons montré que U = Im(p) ⊕ Ker(p). La décomposition d’un vecteur u selon
cette somme directe est
u = p(u) + (u − p(u)) .
19
Donc p(u) est bien la projection de u sur Im(p) parallèlement à Ker(p).

La formule v−(−w) = v+w entraîne que la composée d’une symétrie par elle-même
est l’application identique. Réciproquement, soit s une application telle que s ◦ s = IE .
Définissons les applications p1 et p2 par :
1 1
p1 : u 7−→ (u + s(u)) et p2 : u 7−→ (u − s(u)) .
2 2
Composons l’application p1 par elle-même :
1

p1 ◦ p1 (u) = p1 (u + s(u))
2
1
= p1 (u) + p1 (s(u))
2
1
= u + s(u) + s(u) + s ◦ s(u)
4
1
= 2u + 2s(u) = p1 (u) .
4
On vérifie de même que p2 ◦ p2 = p2 . D’après ce qui précède, p1 et p2 sont donc des
projections. Or p1 + p2 = IE . Il s’ensuit que si p1 est la projection sur F parallèlement
à G, alors p2 est la projection sur G parallèlement à F . Mais puisque s = p1 − p2 , alors
s est la symétrie par rapport à F , parallèlement à G.
1.8 Récurrences linéaires d’ordre deux

Comme application des notions de ce chapitre, nous proposons d’étudier l’ensemble
des solutions de l’équation de récurrence suivante :
(E) ∀n ∈ N , un+2 = α un+1 + β un ,
où α et β sont deux réels fixés. L’exemple le plus simple est l’équation définissant les
nombres de Fibonacci, un+2 = un+1 + un . Nous notons E l’ensemble des suites de réels
qui vérifient (E). Dire que (E) est linéaire revient à dire que E est un espace vectoriel.
Proposition 12. L’ensemble E des suites de réels vérifiant (E) est un espace vectoriel
de dimension 2.
Démonstration : Commençons par vérifier que E est un sous-espace vectoriel de l’en-

semble des suites de réels. Nous en donnerons ensuite une base.
Soient (un ) et (vn ) deux suites vérifiant (E), λ, µ deux réels.
un+2 = α un+1 + β un et vn+2 = α vn+1 + β vn
impliquent :
λun+2 + µvn+2 = α (λun+1 + µvn+1 ) + β (λun + µvn )
20
Donc (λun + µvn ) vérifie (E). D’où le résultat en appliquant le théorème 2. On peut
aussi démontrer que l’application qui à une suite (un ) quelconque associe la suite de
terme général vn = un+2 −αun+1 −βun est une application linéaire. L’ensemble E est le
noyau de cette aplication. C’est donc un sous-espace vectoriel de RN , par le théorème 6.
Considérons maintenant les deux suites (bn ) et (b0n ), vérifiant (E) et telles que
b0 = 1 , b1 = 0 et b00 = 0 , b01 = 1 .
Soit (un ) une suite quelconque vérifiant (E). La suite (un ) est définie de façon unique par
la donnée de u0 , u1 ∈ R et l’équation (E). Donc la suite (un ) est égale à la combinaison
0 0
linéaire u0 (bn ) + u1 (bn ) : la famille (bn ), (bn ) est génératrice. Supposons que (un ) soit

la suite nulle. Alors u0 = u1 = 0. Donc la famille (bn ), (b0n ) est libre : c’est une base.

Pour trouver une expression explicite aux solutions de (E), nous allons trouver une
autre base. Nous commençons par écarter le cas où α = β = 0 : dans ce cas, les suites
solutions de (E) sont nulles à partir du rang 2. Nous supposons désormais que α et
β ne sont pas tous les deux nuls. Cherchons quelles suites géométriques vérifient (E).
Supposons que (rn ) vérifie (E). Alors,
∀n ∈ N , rn+2 = α rn+1 + β rn .
C’est vrai si r est nul, ou bien s’il est solution de l’équation du second degré suivante,
qu’on appelle l’équation caractéristique associée.
(ECA) r2 = α r + β .
Théorème 8. Si l’équation caractéristique associée possède

1. deux racines réelles distinctes r1 et r2 , alors (r1n ), (r2n ) est une base de E :
n o
E = (λ r1n + µ r2n ) , (λ, µ) ∈ R2 .

2. une racine double r, alors (rn ), (nrn ) est une base de E :
n o
E = (λ rn + µ nrn ) , (λ, µ) ∈ R2 .

3. deux racines complexes conjuguées ρeiθ et ρe−iθ , alors (ρn cos(nθ)), (ρn sin(nθ))
est une base de E :
n o
E = (λ ρn cos(nθ) + µ ρn sin(nθ)) , (λ, µ) ∈ R2 .
21
Démonstration : Puisque l’espace vectoriel E est de dimension 2, il suffit dans chacun

des trois cas de montrer que les deux suites proposées vérifient (E) et forment une
famille libre.
Dans le premier cas, les deux suites vérifient (E) car r1 et r2 sont racines de (ECA).
Pour montrer qu’elles forment une famille libre, supposons que la suite (λr1n + µr2n ) soit
nulle. Les deux premiers termes sont :
λ + µ = 0 et λr1 + µr2 = 0
Puisque r1 6= r2 , ce système de deux équations a une solution unique, λ = µ = 0.
Dans le second cas la racine double est r = α/2 et elle est non nulle, le cas α = β = 0
étant écarté. Il est évident que (rn ) vérifie (E). On le vérifie facilement pour (nrn ). Pour
montrer que la famille est libre, supposons que la suite (λrn + µnrn ) soit nulle. Les
deux premiers termes sont :
λ = 0 et λr + µr = 0 .
Donc (puisque r 6= 0), λ = µ = 0.
Traitons maintenant le dernier cas : (ECA) a deux racines complexes conjuguées
ρe et ρe−iθ . Les suites (complexes) (ρn eniθ ) et (ρn e−niθ ) vérifient (E). Leur somme et
iθ
leur différence sont :

ρn eniθ + ρn e−niθ = 2ρn cos(nθ) et ρn eniθ − ρn e−niθ = 2iρn sin(nθ) .
On en déduit que les deux suites proposées vérifient (E). Pour montrer que la famille est
libre, supposons que la suite (λρn cos(nθ) + µρn sin(nθ)) soit nulle. Les deux premiers
termes sont :
λ = 0 , λρ cos(θ) + µρ sin(θ) = 0 .
On en déduit donc que µρ sin(θ) = 0, donc µ = 0 car ρ sin(θ) est non nul (sinon les
racines de (ECA) seraient réelles).
Comme premier exemple, considérons l’équation définissant les nombres de Fibo-
nacci :
(E) ∀n ∈ N , un+2 = un+1 + un .
L’équation caractéristique associée est
(ECA) r2 = r + 1 .
Elle a deux racines réelles distinctes, φ et −1/φ, où φ est le nombre d’or :
√ √
1+ 5 1 1− 5
φ= , − = .
2 φ 2
L’ensemble des suites réelles vérifiant (E) est donc
( √ !n √ !n ! )
1+ 5 1− 5
λ +µ , λ, µ ∈ R .
2 2
22
Les nombres de Fibonacci sont définis par (E), avec u0 = 1 et u1 = 1. Pour calculer les
coordonnées λ et µ de cette suite, il faut résoudre le système

 λ+µ = 1

λφ − µ/φ = 1
On en déduit l’expression suivante du n-ième nombre de Fibonacci :

1 √ √
un = √ (1 + 5)n+1 − (1 − 5)n+1 .
2n+1 5
(Persuadez-vous que un est bien un entier !)
Considérons maintenant l’équation suivante.
(E) ∀n ∈ N , un+2 = −un+1 − un .
L’équation caractéristique associée est :
(ECA) r2 = −r − 1 .
Ses racines sont :

√ √
1 3 1 3
j =− +i = e2iπ/3 et j = − − i = e−2iπ/3
2 2 2 2
Toute solution réelle de l’équation de récurrence s’écrit :
(un ) = ( λ cos(n2π/3) + µ sin(n2π/3) ) .
Les solutions sont périodiques de période 3.
23
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Parmi les sous-ensembles suivants de l’espace vectoriel des suites réelles,
lesquels sont des sous-espaces vectoriels, lesquels ne le sont pas et pourquoi ?
1. Ensemble des suites bornées.
2. Ensemble des suites décroissantes à partir d’un certain rang.
3. Ensemble des suites périodiques.
4. Ensemble des suites convergeant vers 0.
5. Ensemble des suites monotones.
6. Ensemble des suites équivalentes à 1/n.
7. Ensemble des suites dominées par 1/n.
8. Ensemble des suites négligeables devant 1/n.
9. Ensemble des suites dont le terme général est 6 1 à partir d’un certain rang.
Vrai-Faux 2. Parmi les sous-ensembles suivants de l’espace vectoriel des polynômes,

lesquels sont des sous-espaces vectoriels, lesquels ne le sont pas et pourquoi ?
1. Ensemble des polynômes, nul ou de degré 0.
2. Ensemble des polynômes de degré 3.
3. Ensemble des polynômes dont le terme constant est nul.
4. Ensemble des polynômes à coefficients positifs ou nuls.
5. Ensemble des polynômes multiples de X − 1.
6. Ensemble des polynômes multiples de X − 1 ou X + 1.
7. Ensemble des polynômes multiples de X − 1 ou X 2 − 1.
8. Ensemble des polynômes contenant uniquement des monômes de degrés im-
pairs.
9. Ensemble des polynômes dont la dérivée est soit nulle, soit formée uniquement
de monômes de degrés impairs.
Vrai-Faux 3. Parmi les sous-ensembles suivants de l’espace vectoriel des applications de

R dans R, lesquels sont des sous-espaces vectoriels, lesquels ne le sont pas et pourquoi ?
1. Ensemble des fonctions telles que f (0) = f (1).
2. Ensemble des fonctions telles que f (0) = 1.
3. Ensemble des fonctions nulles sur l’intervalle [0, 1].
4. Ensemble des fonctions croissantes.
5. Ensemble des fonctions f telles que f 2 (x) = f 2 (−x).
24
6. Ensemble des fonctions périodiques de période 2π.

7. Ensemble des fonctions f telles que la suite (f (n)) tend vers 0.
R1
8. Ensemble des fonctions dérivables sur f telles que 0 f (x) dx = 0.
R1
9. Ensemble des fonctions dérivables sur f telles que 0 cos(f (x)) dx = 0.
1. L’intersection de deux sous-espaces vectoriels peut être vide.
2. Si un ensemble contient toutes les droites vectorielles engendrées par ses vec-
teurs, c’est un espace vectoriel.
3. Si un ensemble contient tous les plans vectoriels engendrés par deux de ses
vecteurs, c’est un espace vectoriel.
4. Si un ensemble contient toutes les combinaisons linéaires de 3 quelconques de
ses vecteurs, alors c’est un espace vectoriel.
5. Si un ensemble contient la somme de deux quelconques de ses vecteurs, c’est
un espace vectoriel.
6. Si l’intersection de deux sous-espaces vectoriels est réduite au vecteur nul, alors
leur somme est directe.
7. La somme de deux droites vectorielles est un plan vectoriel si et seulement si
cette somme est directe.
8. Dans un espace de dimension 3, la somme d’une droite vectorielle et d’un plan
vectoriel est toujours directe.
9. Dans un espace de dimension 3, la somme de deux plans vectoriels n’est jamais
directe.
1. C est un espace vectoriel de dimension 2 sur R.
2. L’ensemble des polynômes réels de degré 6 3 est un espace vectoriel de dimen-
sion 3 sur R.
3. L’ensemble des suites réelles, constantes ou bien périodiques de période 3, est
un espace vectoriel de dimension 3 sur R.
4. L’ensemble des polynômes à coefficients complexes de degré 6 3 est un espace
vectoriel de dimension 8 sur R.
5. L’ensemble des fonctions de R dans {0, 1} est un espace vectoriel de dimension
2 sur R.
6. L’ensemble des fonctions de {0, 1} dans R est un espace vectoriel de dimension
2 sur R.
25
Vrai-Faux 6. Parmi les applications suivantes de R[X] dans R[X], lesquelles sont des
applications linéaires, lesquelles ne le sont pas et pourquoi ?
1. P (X) 7−→ P (X + 1) − P (X)
2. P (X) 7−→ P (X + 1) − X
3. P (X) 7−→ XP (X + 1) − P 0 (X)
4. P (X) 7−→ XP (X + 1) − P 0 (1)
5. P (X) 7−→ XP (X + 1) − P 2 (1)
Vrai-Faux 7. Soient E et F deux espaces vectoriels et f une application linéaire de E
dans F . Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses
et pourquoi ?
1. L’image du vecteur nul de E est le vecteur nul de F .
2. L’image de f est un sous-espace vectoriel de F .
3. L’image par f d’une famille libre dans E est toujours une famille libre dans F .
4. L’image par f d’une famille liée dans E est une famille liée dans F .
5. L’image par f d’une famille génératrice dans E est toujours une famille géné-
ratrice dans F .
6. Si F est de dimension finie alors Ker f est un sous-espace de dimension finie
de E.
7. Si E est de dimension finie alors Im f est un sous-espace de dimension finie de
F.
8. Si E et F sont de dimension finie, et dim(E) > dim(F ) alors Ker(f ) 6= {0}.
9. Si E et F sont de dimension finie, et dim(E) > dim(F ) alors f est surjective.
10. Si E et F sont de dimension finie, et dim(E) < dim(F ) alors f est injective.
Vrai-Faux 8. Soient E un espace vectoriel, F et G deux sous-espaces supplémentaires
dans E (tels que F ⊕ G = E). On note :
• p la projection sur F parallèlement à G,
• s la symétrie par rapport à F parallèlement à G,
• p0 la projection sur G parallèlement à F ,
• s0 la symétrie par rapport à G parallèlement à F ,
• I l’application identique de E.
Parmi les relations suivantes, lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. p + p0 = I.
2. s + s0 = I.
3. s − s0 = 2p0 .
4. p − p0 = s.
5. s − p = p0 .
26
6. s + p0 = p.
7. p ◦ s0 = p.
8. p0 ◦ s0 = p0 .
9. s0 ◦ s = −I.
10. p0 ◦ p = I.
2.2 Exercices
Exercice 1. Montrer que les familles suivantes sont libres dans l’espace vectoriel des
R[X] des polynômes à coefficients réels. Décrire l’espace vectoriel que chacune engendre.

1. X , (X − 1)

2. X 2 , (X 2 − 1)

3. X 2 , (X − 1)2 , (X − 2)2

4. X 3 , (X + 1)3 , (X − 1)3
Exercice 2. Montrer que les familles suivantes sont libres dans l’espace vectoriel des
suites de réels.

1. (1) , (2n ) , (n2n )

2. (1) , (cos(nπ/4)) , (cos(nπ/2))

3. (1) , (sin(nπ/4)) , (sin(nπ/2))

4. (1) , (2n cos(nπ/4)) , (n2n cos(nπ/4))
Exercice 3. Montrer que la famille (f, g, h) est libre dans l’espace vectoriel des fonctions
de R dans R, dans les cas suivants.
1. f : x 7→ 1 , g : x 7→ x , h : x 7→ x2
q
2. f : x 7→ 1 , g : x 7→ |x| , h : x 7→ |x|
3. f : x 7→ ex , g : x 7→ cos(x) , h : x 7→ sin(x)
4. f : x 7→ sin(x) , g : x 7→ sin(2x) , h : x 7→ sin(3x)
Exercice 4. Dans l’espace vectoriel R3 [X], des polynômes de degrés au plus égal à 3,
on considère
les familles suivantes.
• (1 + X 2 ) )

• (1 + X 2 ) , (1 − X 2 ) )

• (X + X 2 + X 3 ) , (X − X 2 + X 3 ) )

• (1 + X) , (1 + X 2 ) , (1 − X 2 ) )

• (1 + X) , (1 + X 3 ) , (1 − X 3 ) )
27
Pour chacune de ces familles :

1. Démontrer que c’est une famille libre.
2. Décrire le sous-espace F engendré par la famille.
3. Compléter la famille en une base de R3 [X].
4. Déterminer un supplémentaire G du sous-espace engendré F .
5. Ecrire chacun des polynômes suivants comme somme d’un polynôme de F et d’un
polynôme de G.
1 ; X ; X 2 ; X 3 ; 1 − X + X 2 − X 3 ; 1 + 2X + 3X 2 + 4X 3
Exercice 5. Soient E, F, G trois sous-espaces d’un même espace vectoriel.

1. Montrer que E ∩ (F + G) ⊃ (E ∩ F ) + (E ∩ G).
2. Montrer que E + (F ∩ G) ⊂ (E + F ) ∩ (E + G).
3. Montrer que E ∩ (F + (E ∩ G)) = (E ∩ F ) + (E ∩ G).
4. Trois sous-espaces
n E, F , G de R3 osont définis comme suit.
3
• E = (x, y, z) ∈ R , x = y = 0
n o
• F = (x, y, z) ∈ R3 , z = 0
n o
• G = (x, y, z) ∈ R3 , x + y + z = 0
Donner la dimension de E, F , G, et de chacun des sous-espaces apparaissant
dans les questions 1 à 3.
n E, F , G deo R2 [X] sont définis comme suit.
• E = P ∈ R2 [X] , P 00 = 0
n o
• F = P ∈ R2 [X] , P 0 = 0
n o
• G = P ∈ R2 [X] ∈ R3 , P (1) = 0
n E, F , G de M2,2
o (R) sont définis comme suit.
• E = A ∈ M2,2 (R) , tr(A) = 0
n o
1 0
• F = A ∈ M2,2 (R) , A 0
= 0
n o
• G = A ∈ M2,2 (R) , (1, 0)A = (0, 0)
Exercice 6. Soit F l’ensemble des fonctions paires de R dans R : ce sont les fonctions
f telles que
∀x ∈ R , f (x) = f (−x) .
Soit G l’ensemble des fonctions impaires de R dans R : ce sont les fonctions f telles
que
∀x ∈ R , f (x) = −f (−x) .
28
1. Montrer que F et G sont des sous-espaces vectoriels de E = RR .

2. Montrer que F ∩ G est réduit à la fonction nulle.
3. Soit f une fonction de R dans R. On considère les deux fonctions φ et ψ, définies
pour tout x ∈ R par
f (x) + f (−x) f (x) − f (−x)

φ(x) = et ψ(x) = .
2 2
Montrer que φ ∈ F , ψ ∈ G et f = φ + ψ.
4. En déduire que RR = F ⊕ G.
5. Soit p la projection sur F parallèlement à G et s la symétrie par rapport à F
parallèlement à G. Calculer l’image par p et s des fonctions suivantes.
x 7→ 1 + x , x 7→ x2 + 2x3 , x 7→ ex , x 7→ ex + e−2x
Exercice 7. Soit E un espace vectoriel et f un endomorphisme de E.

1. Montrer que les deux propositions suivantes sont équivalentes.
(1) Ker(f ) ∩ Im(f ) = {0} ,

(2) Ker(f ) = Ker(f ◦ f ) .
2. Montrer que les deux propositions suivantes sont équivalentes.
(3) Ker(f ) + Im(f ) = E ,

(4) Im(f ) = Im(f ◦ f ) .
3. Montrer que si E est de dimension finie, alors les 4 propositions (1), (2), (3) et
(4) sont équivalentes.
4. Vérifier que pour l’application dérivation de R[X] dans lui-même, (1) et (2) sont
fausses, (3) et (4) sont vraies.
Exercice 8. Soit M2,2 (R) l’espace vectoriel des matrices carrées à deux lignes et deux
colonnes, à coefficients réels. Pour chacune des matrices A suivantes.
! ! ! !
1 1 1 1 1 −1 −2 1
, , ,
0 0 1 1 −1 1 4 −2
Soit f l’application de M2,2 (R) dans lui-même, qui à une matrice carrée X associe
f (X) = AX.
1. Montrer que f est un endomorphisme de M2,2 (R).
2. Donner une base de Im(f ) et une base de Ker(f ).
3. Reprendre l’exercice pour l’application g qui à X associe g(X) = XA.
29
Exercice 9. Soit M2,2 (R) l’espace vectoriel des matrices carrées à deux lignes et deux
colonnes, à coefficients réels. Pour chacun des vecteurs colonnes v suivants.
! ! ! !
0 1 0 2
, , ,
0 1 1 −1
Soit f l’application de M2,2 (R) dans M2,1 (R), qui à une matrice carrée X associe
f (X) = Xv.
1. Montrer que f est une application linéaire.
3. Reprendre l’exercice pour l’application g qui à X associe g(X) = tvX.
Exercice 10. Pour tout entier d > 1, on munit
l’espacevectoriel Rd [X] des polynômes
de degré 6 d en la variable X, de la base 1, X, . . . , X d . On considère les applications
f suivantes.
• f : R2 [X] −→ R0 [X] , P (X) 7−→ f (P ) = P (1).
• f : R2 [X] −→ R2 [X] , P (X) 7−→ f (P )(X) = XP 0 (X) + P (X).
• f : R2 [X] −→ R2 [X] , P (X) 7−→ f (P )(X) = XP 0 (X) − P (X).
• f : R2 [X] −→ R2 [X] , P (X) 7−→ f (P )(X) = (X 2 + 1)P 0 (X) − 2XP (X).
• f : R3 [X] −→ R1 [X] , P (X) 7−→ f (P )(X) = P (1) + (X − 1)P 0 (1).
• f : R3 [X] −→ R3 [X] , P (X) 7−→ f (P )(X) = P (X + 1) + P (X − 1) − 2P (X).
• f : R3 [X] −→ R3 [X] , P (X) 7−→ f (P )(X) = 3(X + 1)P (X) − (X + 1)2 P 0 (X).
Pour chacune de ces applications :
2. Calculer l’image par f du polynôme (X + 2)2 .
3. Donner la matrice de f , relative aux bases canoniques.
5. Calculer les coordonnées du polynôme (X +2)2 dans la base de l’espace de départ,
effectuer le produit du vecteur obtenu par la matrice de f , et vérifier le calcul de
la question 2.
6. Reprendre les questions 3 et 5, en remplaçant la base canonique de Rd [X] par la
base :
1 , (1 + X) , (1 + X + X 2 ) , . . . , (1 + X + · · · + X d )
Exercice 11. On considère les équations de récurrence linéaires suivantes.
3
un+2 = un+1 + 2un un+2 = u
2 n+1
+ un
un+2 = 2un+1 − 2un un+2 = −2un+1 − un
3
un+2 = u
2 n+1
− 21 un un+2 = −un
un+2 = un+1 − un un+2 = un+1 − 2un
un+2 = 4un+1 − 4un un+2 = 4un+1 + 4un
30
Pour chacune de ces équations,

1. Déterminer l’ensemble des suites de réels qui la vérifient.
2. Déterminer la suite (un ) vérifiant l’équation et u0 = 1, u1 = −1.
3. Déterminer la suite (un ) vérifiant l’équation et u0 = 0, u1 = 2.
2.3 QCM
rapporte 2 points.
Question 1. nL’ensemble E est

o un sous-espace vectoriel de C.
A E = z ∈ C , |z| = 1 .
n o
B E = z ∈ C , |z| = 0 .
n o
C E = z ∈ C , Re(z) = 0 .
n o
D E = z ∈ C , Im(z) = 1 .
n o
E E = z ∈ C , iz + 1 = 0 .
Question 2. nL’ensemble E est un sous-espace vectoriel

o de R[X].
2
A E = P ∈ R[X] , P (X)P (−X) = P (X ) .
n o
B E = P ∈ R[X] , P 0 (X) = X 2 .
n o
C E = P ∈ R[X] , P (X) = P (1 − X) .
n o
D E = P ∈ R[X] , P (X) = X(1 − P 0 (X)) .
n o
E E = P ∈ R[X] , P (X) = P (X 2 ) .
Question 3.La famille V est une

famille génératrice de R[X].
n
A V = (X − 1) , n ∈ N .

B V = (X − n) , n ∈ N .

C V = (X − m)n , (m, n) ∈ N2 .

D V = X 2n , n ∈ N .

E V = (X − 1)2n , n ∈ N .
Question 4.La famille V est une famille libre dans

RR .
2
A V = x 7→ x2 , x 7→ x , x 7→ ex , x 7→ ex .

B V = x 7→ sin(x) , x 7→ sin(3x) , x 7→ sin3 (x) .

C V = x 7→ sin(x) , x 7→ sin(2x) , x 7→ sin2 (x) .
31

D V = x 7→ 1 , x 7→ ex , x 7→ e2x , x 7→ (1 + ex )2 .

E V = x 7→ 1 , x 7→ cos(x) , x 7→ cos(2x), x 7→ (1 + cos(x)2 ) .
Question 5. nLes espaces vectoriels E oet F sontntels que F ⊕ G = C o

A E = z ∈ C , Re(z) = Im(z) et F = z ∈ C , z = xeiπ/4 x ∈ R .
n o n o
B E = z ∈ C , Re(z) = 0 et F = z ∈ C , z = xeiπ/4 x ∈ R .
n o n o
C E = z ∈ C , |z| = 0 et F = z ∈ C , z = xeiπ/4 x ∈ R .
n o n o
D E = z ∈ C , Re(z) = −Im(z) et F = z ∈ C , z = xeiπ/4 x ∈ R .
n o n o
E E = z ∈ C , Re(z) ∈ R et F = z ∈ C , z = xeiπ/4 x ∈ R .
Question 6. Le sous-espace vectoriel de R[X] engendré par la famille V est de dimen-

sion 3.
A V = 1 , X , X2 , X3 .

B V = X , X 2 , X 3 , X(1 + X)2 .

C V = X , X 2 , X 3 , X(1 + X)3 .

D V = (1 + X) , X 2 , X 3 , X 2 (1 + X) .

E V = X 2 , X 3 , X 2 (1 + X) .
Question 7. L’application f , de R[X] dans R est linéaire.

A f : P (X) 7→ P (0)P 0 (1).
B f : P (X) 7→ P (0) + P 0 (1).
C f : P (X) 7→ deg(P ).
D f : P (X) 7→ (P (0) + P 0 (1))2 .
E f : P (X) 7→ P (0) + P 0 (2) + 2P 00 (3).
Question 8. On considère l’application linéaire f , de M2,2 (R) dans R qui à une matrice
2 × 2 associe sa trace (somme des deux éléments diagonaux).
A f est injective.
B La matrice identité est élément de Ker(f ).
C f est surjective.
D Im(f ) est un espace vectoriel de dimension 3.
E Ker(f ) est un espace vectoriel de dimension 3.
Question 9. On considère les deux sous-espaces vectoriels E et F de R2 [X] définis

comme suit.
n o n o
F = bX + cX 2 , (b, c) ∈ R2 et G = a + aX , a ∈ R
On admettra que F ⊕ G = R2 [X]. On note p la projection sur F parallèlement à G et

s la symétrie par rapport à F , parallèlement à G.
32
A p(1 + 2X + X 2 ) = 2X + X 2 .
B s(1 + 2X + X 2 ) = −1 + X 2 .
C s(1 − X) = −1 + X
D p(1 + X 2 ) = −1 − 2X + X 2 .
E p(1 − X) = 0.
Question 10. On considère l’équation de récurrence linéaire d’ordre 2 suivante.
(E) un+2 = 2un+1 − 2un .
A L’ensemble des suites à valeurs réelles solutions de (E) est un espace vectoriel
de dimension 2 sur R.
B (E) admet des solutions non nulles qui sont des suites périodiques.
C (E) admet des solutions non nulles
qui sont dessuites convergentes.
D (E) admet pour solution la suite Re((1 + i)2n ) .
n∈N
E (E) admet des solutions non nulles qui sont des suites à valeurs entières.
Réponses : 1–BC 2–CE 3–AC 4–AC 5–BD 6–BD 7–BE 8–CE 9–BD 10–AE
2.4 Devoir
répondu.
1. Quand dit-on d’une application f entre deux espaces vectoriels E et F qu’elle est
linéaire ?
2. Définir l’image d’une application linéaire f .
3. Démontrer qu’une application linéaire f entre deux espaces vectoriels E et F est
surjective si et seulement si Im(f ) = F .
4. Définir le noyau d’une application linéaire f .
5. Démontrer qu’une application linéaire f entre deux espaces vectoriels E et F est
injective si et seulement si Ker(f ) = {0}.
Exercice 1 : On considère l’espace vectoriel R2 [X] des polynômes de degrés inférieurs
ou égaux à 2. Soit f l’application de R2 [X] dans R qui à P associe P (1).
On note F = Ker(f ). Montrer que F est un sous-espace vectoriel de dimension 2
de R2 [X].
33

2. Montrer que X − 1, X 2 − 1 est une base de F .
3. Soit G le sous-espace vectoriel de R2 [X], engendré par le polynôme (X 2 + 1).
Montrer que G est un sous-espace vectoriel de dimension 1 de R2 [X].

4. On note B = X − 1, X 2 − 1, X 2 + 1 . Montrer que B est une base de R2 [X].
5. Ecrire la matrice de l’application f dans la base B (au départ) et (1) (à l’arrivée).
6. Déterminer les coordonnées dans la base B des polynômes 1, X et X 2 .
7. Montrer que F et G sont supplémentaires dans R2 [X].
On note p la projection sur F parallèlement à G et s la symétrie par rapport à
F , parallèlement à G.
8. Donner la matrice de p et la matrice de s dans la base B.
9. Déterminer l’image par p et par s des polynômes 1, X et X 2 . En déduire les
matrices de p et s dans la base canonique de R2 [X].
Exercice 2 : Dans RR , on considère la famille V suivante.

V = x 7→ sin(x) , x 7→ cos(x) , x 7→ sin(2x) , x 7→ cos(2x) .
On note E l’espace vectoriel engendré par V, et D l’application qui à f associe sa

dérivée f 0 .
1. Montrer que V est une famille libre.
2. Montrer que D est un endomorphisme de E.
3. Montrer que D est un automorphisme de E.
Exercice 3 : On considère l’équation de récurrence linéaire d’ordre 2 suivante.
(E) un+2 = un+1 − un /2 .
1. Ecrire et résoudre l’équation caractéristique associée.

2. Déterminer l’ensemble des solutions réelles de (E).
3. Soit (un ) la suite solution de (E) telle que u0 = 0 et u1 = 1. Donner une expression
de un en fonction de n.

1. On dit qu’une application f entre deux espaces vectoriels E et F est linéaire si :
∀x, y ∈ E , ∀λ, µ ∈ R , f (λx + µy) = λf (x) + µf (y) .
34
2. L’image d’une application linéaire f de E dans F est le sous-espace vectoriel de

F défini par : n o
Im(f ) = f (x) , x ∈ E .
3. Par définition, une application est surjective si tout élément de l’ensemble d’ar-
rivée possède au moins un antécédent dans l’ensemble de départ.
∀y ∈ F , ∃x ∈ E , y = f (x) .
Donc une application linéaire f entre deux espaces vectoriels E et F est surjective
si et seulement si Im(f ) = F .
4. Le noyau d’une application linéaire f est l’ensemble des vecteurs de E dont
l’image par f est le vecteur nul de F .
n o
Ker(f ) = x ∈ E , f (x) = 0 .
5. Nous avons deux implications à démontrer. Montrons d’abord que si f est injec-
tive alors Ker(f ) = {0}.
Une application entre deux ensembles est injective si deux éléments distincts de
E n’ont jamais la même image par f . Le vecteur nul de E a pour image par f ,
le vecteur nul de F . Puisque f est injective, aucun vecteur non nul de E ne peut
avoir pour image 0. Donc Ker(f ) = {0}.
Montrons maintenant la réciproque. Supposons Ker(f ) = {0}. Soient x et y
deux éléments de E tels que f (x) = f (y). Puisque f est linéaire, f (x − y) =
f (x) − f (y) = 0. Donc x − y ∈ Ker(f ), donc x − y = 0, donc x = y.
Exercice 1 :
1. Nous devons montrer que :
∀P, Q ∈ F , ∀λ, µ ∈ R , f (λP + µQ) = λf (P ) + µf (Q) .
Cela découle immédiatement du fait que (λP + µQ)(1) = λP (1) + µQ(1).

Pour tout a ∈ R, L’image par f du polynôme constant a est le réel a. Donc f
est surjective. L’espace de départ est de dimension 3, l’image est de dimension 1.
D’après le théorème du rang, le noyau est de dimension 3 − 1 = 2.
2. Observons d’abord
que les deux polynômes de la famille appartiennent bien à F .
Montrons que X − 1, X 2 − 1 ) est une famille libre. Si a et b sont deux réels tels
que a(X − 1) + b(X 2 − 1) = 0, alors :
bX 2 + aX − (a + b) = 0 =⇒ a = b = 0 .
L’espace vectoriel F est de dimension 2, donc toute famille libre de 2 éléments

est une base.
35
3. Le polynôme X 2 + 1 est non nul, il forme une famille libre, donc une base de G.

4. L’espace vectoriel R2 [X] est de dimension 3. Pour montrer que B = X − 1, X 2 −

1, X 2 + 1 est une base, il suffit de montrer que c’est une famille libre. Soient
a, b, c trois réels. Supposons que :
P = a(X − 1) + b(X 2 − 1) + c(X 2 + 1) = (b + c)X 2 + aX + (−a − b + c) = 0 .
Alors, (a, b, c) est solution du système :



 b +c = 0
a = 0
−a −b +c = 0 .


La seconde équation donne a = 0 ; en prenant la somme et la différence de la

première et de la troisième, on en déduit b = c = 0.
5. Les images par f des éléments de la base B sont :
f (X − 1) = 0 , f (X 2 − 1) = 0 , f (X 2 + 1) = 2 .
La matrice de f est donc :
(0, 0, 2) ∈ M1,3 (R) .
6. En calculant directement on obtient :

1 1
1 = 0(X − 1) − (X 2 − 1) + (X 2 + 1) ,
2 2
1 1
X = 1(X − 1) − (X 2 − 1) + (X 2 + 1) ,
2 2
1 1
X 2 = 0(X − 1) + (X 2 − 1) + (X 2 + 1) .
2 2
On pouvait aussi calculer ces coordonnées en écrivant la matrice de passage de
la base canonique à la base B, puis en calculant son inverse.
   
−1 −1 1 0 2 0
1
π= 1 0 0  π −1 =  −1 −1 1  .
 
2

0 1 1 1 1 1
7. Puisque B est une base, pour tout polynôme P de R2 [X], il existe un triplet
unique de réels (a, b, c) tel que :
P (X) = a(X − 1) + b(X 2 − 1) + c(X 2 + 1) .
36
Le polynôme a(X −1)+b(X 2 −1) appartient à F , le polynôme c(X 2 +1) appartient

à G. Tout polynôme de R2 [X] est somme d’un élément de F et d’un élément de
G, donc F + G = R2 [X].
Pour démontrer que la somme est directe, il faut montrer en plus que F ∩G = {0}.
Soient a, b, c trois réels tels que :
a(X − 1) + b(X 2 − 1) = c(X 2 + 1) .
Alors a = b = c = 0, car B est une famille libre.

8. La projection p envoie X − 1 et X 2 − 1 sur eux-mêmes, X 2 + 1 sur 0. D’où la
matrice de p dans la base B :
 
1 0 0
 0 1 0  .
 
0 0 0
La symétrie s envoie X − 1 et X 2 − 1 sur eux-mêmes, X 2 + 1 sur son opposé.

D’où la matrice de p dans la base B :
 
1 0 0
 0 1 0 
 .

0 0 −1
9.
1 1 1

p(1) = p 0(X − 1) − (X 2 − 1) + (X 2 + 1) = − (X 2 − 1) ,
2 2 2
1 1 1

p(X) = p 1(X − 1) − (X 2 − 1) + (X 2 + 1) = 1(X − 1) − (X 2 − 1) ,
2 2 2
1 1 1

p(X 2 ) = p 0(X − 1) + (X 2 − 1) + (X 2 + 1) = (X 2 − 1) .
2 2 2
On en déduit la matrice de p dans la base canonique de R2 [X] :
 
1 −1 −1
1 
 0 2 0 
 .
2
−1 −1 1
1 1 1 1

s(1) = s 0(X − 1) − (X 2 − 1) + (X 2 + 1) = − (X 2 − 1) − (X 2 + 1) ,
2 2 2 2
1 1 1 1

s(X) = s (X − 1) − (X 2 − 1) + (X 2 + 1) = (X−1)− (X 2−1)− (X 2 +1) ,
2 2 2 2
1 1 1 1

s(X 2 ) = s 0(X − 1) + (X 2 − 1) + (X 2 + 1) = (X 2 − 1) − (X 2 + 1) .
2 2 2 2
37
On en déduit la matrice de s dans la base canonique de R2 [X] :

 
0 −1 −1
 0 1 0 
 .

−1 −1 0
On pouvait aussi calculer la matrice de p (respectivement : s) en effectuant le

produit matriciel πAπ −1 , où A est la matrice de p (respectivement s) dans la base
B et π est la matrice exprimant les vecteurs de la base B dans la base canonique.
Exercice 2 :
1. Soit a, b, c, d quatre réels. Notons f l’application
f : x 7→ a sin(x) + b cos(x) + c sin(2x) + d cos(2x) .
Pour montrer que V est une famille libre, nous devons montrer que si f est
l’application nulle, alors a = b = c = d = 0. Pour cela, nous choisissons des
valeurs particulières pour x :
f (0) = 0 =⇒ b+d = 0
f (π) = 0 =⇒ −b + d = 0
f (π/2) = 0 =⇒ a−d √ = 0
f (π/4) = 0 =⇒ (a + b) 2/2 + c = 0.
En prenant la somme et la différence des deux premières équations, on obtient

b = d = 0. La troisième implique alors que a = 0. On déduit ensuite c = 0 de la
quatrième.
2. Nous devons montrer que D est une application de E dans E et qu’elle est linéaire.
D’après la question précédente, V est une base de E. Pour tout élément f de E,
il existe 4 réels a, b, c, d tels que :
f : x 7→ a sin(x) + b cos(x) + c sin(2x) + d cos(2x) .
L’image de f par D est :
D(f ) : x 7→ a cos(x) − b sin(x) + 2c cos(2x) − 2d sin(2x) .
L’application D(f ) est bien élément de E.

Pour démontrer la linéarité, il suffit d’appliquer les résultats généraux sur la
dérivation : si f et g sont dérivables et si λ et µ sont deux réels, alors λf + µg
est dérivable et (λf + µg)0 = λf 0 + µg 0 .
3. Nous savons que D est un endomorphisme, il suffit de montrer que D est bijective.
Comme E est un espace vectoriel de dimension finie et D est une application
linéaire de E dans lui-même, il nous suffit de vérifier que D est injective (ou bien
surjective, mais il est inutile de vérifier les deux).
38
Pour montrer que D est injective, il suffit de montrer que son noyau ne contient
que l’application nulle. En reprenant les expressions de la question précédente, si
f s’écrit :
f : x 7→ a sin(x) + b cos(x) + c sin(2x) + d cos(2x)
l’image de f par D est :
D(f ) : x 7→ a cos(x) − b sin(x) + 2c cos(2x) − 2d sin(2x) .
Puisque V est une famille libre, D(f ) = 0 implique a = 0, −b = 0, 2c = 0,

−2d = 0. Donc a = b = c = d = 0 et f est l’application nulle.
Exercice 3 :
1. L’équation caractéristique associée est r2 = r − 1/2. Ses solutions sont :
1+i 1 1−i 1
r1 = = √ eiπ/4 et r2 = = √ e−iπ/4 .
2 2 2 2
2. L’ensemble E des solutions réelles de (E) est un espace vectoriel de dimension 2

sur R. Une base est donnée par les deux suites :
1 1
√ cos(nπ/4) et √ sin(nπ/4) .
( 2)n ( 2)n
( ! )
1
2
E= √ a cos(nπ/4) + b sin(nπ/4) , (a, b) ∈ R .
( 2)n n∈N
3. Nous savons qu’il existe deux réels a et b tels que pour tout n ∈ N,
1
un = √ n a cos(nπ/4) + b sin(nπ/4) .
2
En reportant les valeurs de un pour n = 0 et n = 2, on trouve a = 0 et b = 2. La
suite (un ) est donc : !
2
√ sin(nπ/4) .
( 2)n n∈N
39
3 Compléments
3.1 Kate and William : so romantic !
C’est à Sir William Rowan Hamilton 1 (1805–1865) que vous devez le terme de
vecteur, en même temps que les quaternions. Éduqué par son oncle James, ce fut un
enfant prodige. D’après la sœur de James, à 5 ans il impressionnait les visiteurs de la
famille par sa connaissance du grec.
There was a Mr. Montgomery with the Elliots the other day ; he is a curate
and takes a certain number of boys. We were there : they had been talking a
great deal of Willy to him ; however he looked on it all as nonsense, ’til after
tea Mr. Elliot got a Greek Homer and desired Mr. Montgomery to examine
him. When he opened the book, he said, “oh this book has contractions,
Mr. Elliot, of course the child cannot read it”. “Try him, sir”, said James.
To his amazement Willy went on with the greatest ease. Mr. Montgomery
dropped the book and paced the room ; but every now and then he would
come and stare at Willy, and when he went away, he told Mr. and Mrs.
Elliot that such a thing he had never heard of and that he really was seized
with a degree of awe that made him almost afraid to look at Willy. He would
not, he said, have thought as much of it had he been a grave, quiet child ;
but to see him the whole evening acting on the most infantile manner and
then reading all these things astonished him more than he could express.
À 19 ans, encore étudiant mais déjà considéré comme le meilleur mathématicien
irlandais, il rencontre Catherine Disney.
Wonderful hour ! of my sitting, irregularly, from the very first, – beside her ;
when, without a word said of love, we gave away our lives to each other. She
was, as you know, beautiful ; I was only clever and (already) celebrated.
Malheureusement, il avait à peine déclaré sa flamme, qu’il reçut la nouvelle que Cathe-
rine devait se marier avec William Barlow, de 15 ans plus âgé qu’elle. Bien des années
plus tard, marié lui-même, il n’avait toujours pas oublié Catherine.
The same remembrance has run like a river through my life, hidden seemin-
gly for intervals, but breaking forth again with an occasional power which
terrifies me – a really frightful degree of force and vividness.
Catherine non plus n’avait pas oublié : tentative de suicide, séparation, sa vie n’avait
jamais été heureuse. Un jour de 1853, presque 30 ans après leur première rencontre,
Hamilton reçut un plumier portant l’inscription « From one you must never forget, nor
think unkindly of, and who would have died more contented if we had once more met ».
Il se précipita chez Catherine, à temps pour la revoir une dernière fois : elle mourut
deux semaines plus tard.
1. F. Ó Cairbre, William Rowan hamilton (1805–1965) : Ireland’s greatest mathematician, Ríocht
na Midhe, Vol 11, p. 124–150 (2000)
40
Comment Hamilton supporta-t-il la tragédie de sa vie ? La religion dit-il, la poésie

dit son ami Wordsworth, l’alcool dit son entourage. . . et les mathématiques bien sûr !
3.2 Équations de récurrence linéaires

Nous présentons ici la généralisation du théorème 8 aux équations d’ordre quel-
conque.
Considérons l’équation E :
(E) ∀n ∈ N , un+d = a0 un + a1 un+1 + · · · + ad−1 un+d−1 .
Pour connaître la forme des solutions de (E), il faut résoudre l’équation caractéristique
associée :
(ECA) rd = a0 + a1 r + · · · + ad−1 rd−1 .
C’est la condition pour que (un ) = (rn ) soit solution de (E).
On démontre le résultat suivant, qui généralise le théorème 8.
Théorème 9. L’ensemble des suites complexes solution de (E) est un espace vectoriel
de dimension d sur C.
Notons r1 , . . . , rk les racines (réelles ou complexes) de l’équation caractéristique
associée (ECA) et m1 , . . . , mk leurs multiplicités. Toute solution de l’équation (E).
s’écrit :
i −1
k mX
λi,j nj (ri )n ,
X
un = (3)
i=1 j=0
où les d coefficients λi,j , i = 1, . . . , k , j = 0, . . . , mi −1 sont réels ou complexes.
En pratique, pour déterminer une solution vérifiant d conditions particulières, il

suffit de calculer ses coefficients λi,j en résolvant un système linéaire ordinaire, de d
équations à d inconnues.
Exemple : Considérons l’équation suivante :
(E) ∀n ∈ N , un+3 = un + un+1 − un+2 .
(ECA) r3 = 1 + r − r2 .
Elle a pour racines 1 (racine simple) et −1 (racine double). Toute solution de l’équation
de récurrence s’écrit donc :
un = a(1)n + b(−1)n + cn(−1)n .
41
Pour trouver la solution qui vérifie u0 = −1, u1 = 1, u2 = 0, on résout le système

suivant. 
 a+b
 = −1
a−b−c = 1


a + b + 2c = 0
La solution est a = 1/4, b = −5/4, c = 1/2. On obtient :
1 5 1
un = − (−1)n + n(−1)n .
4 4 2
3.3 Équations différentielles linéaires

Les équations différentielles linéaires sont très proches des équations de récurrence
traitées ci-dessus. Considérons l’équation E :
(E) y (d) (t) = a0 y(t) + a1 y 0 (t) + · · · + ad−1 y (d−1) (t) ,
où a0 , a1 , . . . , ad−1 sont d coefficients réels, y est une fonction indéfiniment dérivable,

et y (k) désigne sa dérivée k-ième. Pour connaître la forme des solutions de (E), il faut
résoudre l’équation suivante :
(ECA) rd = a0 + a1 r + · · · + ad−1 rd−1 .
Cette équation porte aussi le nom d’équation caractéristique associée. C’est la condition
pour que y(t) = ert soit solution de (E).
Le résultat suivant est l’analogue du théorème 9 et sa démonstration est très proche.
Théorème 10. L’ensemble des solutions (réelles ou complexes) de l’équation (E) est
un espace vectoriel de dimension d sur C.
Notons r1 , . . . , rk les racines (réelles ou complexes) de l’équation caractéristique as-
sociée (ECA) et m1 , . . . , mk leurs multiplicités. Toute solution de l’équation (E) s’écrit :
i −1
k mX
λi,j tj eri t ,
X
y(t) =
i=1 j=0
où les d coefficients λi,j , i = 1, . . . , k , j = 0, . . . , mi −1 sont réels ou complexes.
En pratique, pour déterminer une solution vérifiant d conditions particulières, il

suffit de calculer ses coefficients λi,j en résolvant un système linéaire ordinaire, de d
équations à d inconnues.
Exemple : Considérons l’équation suivante :
(E) y 000 (t) = y(t) + y 0 (t) − y 00 (t) .
42

(ECA) r3 = 1 + r − r2 .
Cette équation a pour racines 1 (racine simple) et −1 (racine double). Toute solution
de l’équation différentielle s’écrit donc :
y(t) = aet + be−t + cte−t .
Pour trouver la solution qui vérifie y(0) = −1, y 0 (0) = 1, y 00 (0) = 0, on résout le
système suivant. 
 a+b
 = −1
a−b+c = 1
a + b − 2c


= 0
La solution est a = 1/4, b = −5/4, c = −1/2. La fonction cherchée est donc :
1 5 1
y(t) = et − e−t − te−t .
4 4 2
Il se peut que l’équation caractéristique associée admette des racines complexes

conjuguées. Supposons que λ = α + iβ soit racine de (ECA), alors λ = α − iβ est aussi
solution. Donc eλt , eλt et toutes leurs combinaisons linéaires sont solutions de (E). En
particulier :
1 λt 1 λt
(e + eλt ) = eαt cos(βt) et (e − eλt ) = eαt sin(βt) .
2 2i
Parmi les solutions réelles de (E), on trouvera donc toutes les combinaisons linéaires
de ces deux fonctions.
L’ensemble des solutions réelles de (E) est un espace vectoriel de dimension d sur
R.
Exemple : Considérons l’équation suivante.
(E) y 00 (t) = −y(t) − y 0 (t) .
(ECA) r2 = −1 − r .
Ses racines sont : √ √
1 3 1 3
j =− +i et j = − − i .
2 2 2 2
Toute solution réelle de l’équation différentielle s’écrit :
√ √
y(t) = ae−t/2 cos(t 3/2) + be−t/2 sin(t 3/2) .
Cette équation pourrait correspondre aux petites oscillations d’un pendule en milieu
visqueux. Les solutions trouvées tendent vers 0, avec des oscillations de plus en plus
atténuées.
43
3.4 Polynômes de Lagrange

Même s’ils le font très vite, il n’y a guère qu’une chose que les ordinateurs sachent
faire avec des nombres : les ajouter et les multiplier, donc évaluer des fonctions poly-
nômes. Si on doit effectuer des calculs sur une fonction quelconque, il est important de
pouvoir l’approcher par des fonctions polynômes.
Selon le sens précis que l’on donne à « approcher », il existe une grande variété de
techniques, et autant de familles de polynômes qui leur sont adaptées. Nous traitons ici
une des questions les plus simples : comment construire un polynôme de degré minimal,
dont le graphe passe par certains points du plan. C’est le problème de l’interpolation.
Nous commençons par nous donner les abscisses des points. Ce sont n réels, a1 , . . . , an ,
différents deux à deux. Nous définissons maintenant n polynômes L1 , . . . , Ln , de degré
n−1, qui sont tels que Li (ai ) = 1 et Li (aj ) = 0 pour j 6= i.
Définition 12. On appelle polynômes interpolateurs de Lagrange aux abscisses

a1 , . . . , an , les n polynômes L1 , . . . , Ln , définis pour i = 1, . . . , n par :
Y X − aj
Li (X) = .
j6=i ai − aj
Voici les trois polynômes associés aux abscisses a1 = 2, a2 = 4, a3 = 5.

X −4 X −5 X −2 X −5 X −2 X −4
L1 (X) = , L2 (X) = , L3 (X) = ,
2−4 2−5 4−2 4−5 5−2 5−4
Nous sommes intéressés par les combinaisons linéaires des Li (X). Prenons n réels
b1 , . . . , bn , et formons le polynôme
P (X) = b1 L1 (X) + · · · + bn Ln (X) .
Remplaçons X par ai . Tous les termes Lj (ai ) s’annulent, sauf Li (ai ) qui vaut 1. Donc
P (ai ) = bi . La fonction polynôme x 7→ P (x) passe par les n points (a1 , b1 ), . . . , (an , bn ) :
elle les interpole. Par exemple pour a1 = 2, a2 = 4, a3 = 5 et b1 = 3, b2 = 2, b3 = 4,
5 2 11 32
P (X) = 3 L1 (X) + 2 L2 (X) + 3 L3 (X) = X − X+ .
6 2 3
La figure 3 représente le graphe de P (x).
Le polynôme P ainsi construit est le seul polynôme de degré 6 n − 1 qui interpole les
points (a1 , bn ), . . . , (an , bn ) : on le déduit de la proposition suivante.
Proposition 13. Les n polynômes L1 (X), . . . , Ln (X) forment une base de l’espace
vectoriel des polynômes de degré 6 n − 1.
44
Interpolation de Lagrange
y
4.2
⊕
4.0
3.8
3.6
3.4
3.2
⊕
3.0
2.8
2.6
2.4
2.2
⊕
2.0 x
1.8
1.7 2.0 2.3 2.6 2.9 3.2 3.5 3.8 4.1 4.4 4.7 5.0 5.3
Figure 3 – Interpolation par un polynôme de Lagrange des points d’abscisses (2, 4, 5)

et d’ordonnées (3, 2, 4).
Démonstration
: Comme la dimension de l’espace est n, il suffit de montrer que la
famille L1 (X), . . . , Ln (X) est libre. Considérons une combinaison linéaire, et sup-
posons qu’elle est nulle.
P (X) = b1 L1 (X) + · · · + bn Ln (X) = 0 .
Comme pour tout i = 1, . . . , n, P (ai ) = bi , on doit avoir bi = 0. D’où le résultat.
Les valeurs b1 , . . . , bn sont les coordonnées du polynôme P (X) dans la base

L1 (X), . . . , Ln (X) .
3.5 Transformée de Fourier

D’autres polynômes, à valeurs complexes, vont nous donner l’occasion d’évoquer
l’œuvre de Joseph Fourier 2 (1768 – 1830).
À l’âge de 30 ans, jeune professeur à l’École Polytechnique, il est invité par Bona-
parte à participer à l’expédition d’Égypte. Ce voyage déterminera largement le cours
de sa vie. D’abord sa carrière : ses qualités d’organisateur et de négociateur, louées par
tous là-bas (amis et ennemis), lui vaudront au retour d’être nommé préfet de l’Isère,
où il restera de 1802 à 1815. Elles lui vaudront aussi d’être le coordonnateur de la
publication du rapport de l’expédition (10 volumes de planches gravées, 9 volumes de
texte, et un atlas), dont il rédigera la préface. Fourier n’eut jamais de vie de famille,
et aucune liaison sentimentale connue. Ce n’est pas qu’il n’ait jamais eu d’occasion.
2. voir http ://joseph.fourier.free.fr/
45
Dans une lettre 3 à un de ses anciens professeurs d’Auxerre devenu son ami, il fait part
avec humour de son sentiment sur les accusations portées contre son action pendant la
Terreur.
C’est donc de la terreur que j’ai inspirée. Ma foi je ne vois pas que j’en
aie fait éprouver aux êtres les plus faibles, aux femmes. Et si j’en avais cru
quelques unes, elles me paraissaient fort disposées à d’énormes sacrifices.
On ne lui connaît qu’un seul véritable ami, Jacques-Joseph Champollion. Ce dernier
avait fait venir à Grenoble son jeune frère Jean-François en 1801 : il est probable que
la passion des deux amis pour les antiquités d’Égypte, ait été à l’origine de la vocation
de Jean-François, qui découvrira le secret des hiéroglyphes en 1822.
L’expédition d’Égypte a peut-être eu une autre conséquence, qui pour être plus
indirecte, n’en est pas moins fondamentale. Fourier aurait contracté en Égypte une
fièvre ou un rhumatisme chronique, qui le rendait très sensible au froid. Arago 4 , parlant
de lui vers la fin de sa vie, dit :
Pour se dérober à de légères atteintes rhumatismales, notre confrère se
vêtait, dans la saison la plus chaude de l’année, comme ne le sont même
pas les voyageurs condamnés à hiverner au milieu des glaces polaires. On
me suppose de l’embonpoint, disait-il quelquefois en riant ; soyez assuré
qu’il y a beaucoup à rabattre de cette opinion. Si, à l’exemple des momies
égyptiennes, on me soumettait, ce dont Dieu me préserve ! à l’opération de
désemmaillottement, on ne trouverait pour résidu qu’un corps assez fluet.
Je pourrais ajouter, en choisissant aussi mon terme de comparaison sur les
bords du Nil, que dans les appartements de Fourier, toujours peu spacieux
et fortement chauffés, même en été, les courants d’air auxquels on était
exposé près des portes, ressemblaient quelquefois à ce terrible Seïmoun, à
ce vent brûlant du désert que les caravanes redoutent à l’égal de la peste.
Si la relation particulière que Fourier entretenait avec la chaleur est avérée, l’hypothèse
d’une fièvre contractée en Égypte n’est pas confirmée par le passage suivant de la lettre
qu’il écrivit à son retour.
Je viens enfin, mon cher Bonard, de terminer mon voyage en Égypte, qui
ne me laisse que le plus agréable souvenir. Je suis entré il y a quelques jours
dans le port de Toulon et je suis d’une santé aussi bonne que je puis le
désirer après d’aussi longues fatigues.
Le travail que Fourier a réalisé sur la diffusion de la chaleur entre 1804 et 1807,
se basait entre autres sur une intuition géniale : toute fonction continue peut être
approchée par des polynômes trigonométriques.
3. Lettres de Joseph Fourier Bulletin de la Société des Sciences Historiques et Naturelles de
l’Yonne, Vol. 12, p. 105–134 (1858)
4. F. Arago, Éloge historique de Joseph Fourier, Académie des Sciences, Paris, 1833
46
Considérons la famille de fonctions de R dans C :

e−nix , e−(n−1)ix , . . . , e−ix , 1, eix , . . . , e(n−1)ix , enix .
On peut démontrer que c’est une famille libre dans l’espace vectoriel des fonctions de
R dans C. Elle engendre l’espace vectoriel des fonctions qui s’écrivent :
ϕ(x) = λ−n e−nix + · · · + λ−1 e−ix + λ0 + λ1 eix + · · · + λn enix .
On les appelle des polynômes trigonométriques. Ce sont des fonctions continues, pério-
diques de période 2π. Il suffit de remplacer x par 2πx/T pour obtenir des fonctions de
période T .
Étant donnée une fonction f , continue sur [0, 2π], on définit ses coefficients de
Fourier par :
1 Z 2π
∀k ∈ Z , ck = f (x) e−kix dx .
2π 0
On leur associe les polynômes trigonométriques
n
ck ekix .
X
k=−n
Le théorème suivant n’a pas été démontré par Fourier, mais par Dirichlet.
Théorème 11. Soit f une fonction dérivable sur ]0, 2π[. Pour tout x ∈]0, 2π[,
n
ck ekix .
X
f (x) = lim
n→∞
k=−n
Le passage de la fonction f à la (double) suite (cn )n∈Z s’appelle transformation de

Fourier. De nos jours, la transformation de Fourier est un outil fondamental dans de
nombreux domaines, en particulier le traitement du signal. Elle est à la base du format
JPEG de compression des images.
Parce qu’on le soupçonnait de n’avoir pas établi sa méthode sur des bases suffisam-
ment rigoureuses, Fourier a subi de nombreuses critiques en particulier de la part de
Poisson. Son travail a été finalement reconnu par une élection à l’Académie des Sciences
en 1817, et publié en 1822.
En Égypte, Fourier avait fait l’unanimité par ses qualités humaines. À Grenoble
aussi, il était apprécié de tous pour son travail acharné, sa politesse, son sens de la
diplomatie et son honnêteté rigoureuse. On dit qu’il était très aimé des Grenoblois et
qu’il était même souvent applaudi en ville, par exemple quand il allait au théâtre. Aimé
de tous ? Presque !
Une des sources de mon ennui à Grenoble était le petit savant spirituel
à l’âme parfaitement petite et à la politesse basse de domestique revêtu,
nommé Fourier.
Cette citation venimeuse est signée. . . Stendhal.
47
Déterminants
Luc Rozoy, Bernard Ycart
Les déterminants sont un outil indispensable de l’algèbre linéaire, que vous avez
déjà rencontré en dimensions 2 et 3. Peu de prérequis pour ce chapitre, à part les
notions de base sur les espaces vectoriels de dimension finie, les systèmes linéaires
et le calcul matriciel. Votre objectif minimal est d’apprendre les méthodes de calcul
des déterminants ; comprendre en plus les raisonnements développés ici, ne peut que
renforcer votre culture algébrique.
Table des matières

1 Cours 1
1.1 Permutations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Formes alternées . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Déterminant d’un endomorphisme . . . . . . . . . . . . . . . . . . . . . 12
1.4 Mineurs et cofacteurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.5 Méthodes de calcul . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.6 Interprétation géométrique . . . . . . . . . . . . . . . . . . . . . . . . . 22
2 Entraînement 25
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3 Compléments 44
3.1 Les tâtonnements de Leibniz . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 L’école japonaise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.3 Les excuses de Cramer . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.4 Cauchy raconte l’histoire . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.5 Le dernier honnête homme . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.6 La solidité des pyramides . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.7 Les déterminants de Sylvester . . . . . . . . . . . . . . . . . . . . . . . 53
3.8 La condensation de Dodgson . . . . . . . . . . . . . . . . . . . . . . . . 55
12 septembre 2016
Maths en Ligne Déterminants UJF Grenoble
1 Cours
1.1 Permutations
L’ensemble Sn des permutations de l’ensemble {1, . . . , n}, muni de la composition
des applications est le premier exemple de groupe non commutatif que vous ayez ren-
contré. Vous avez besoin d’en savoir un peu plus pour manipuler des déterminants. La
notion importante de cette section est celle de signature.
Soit s ∈ Sn une bijection de {1, . . . , n} dans lui-même. Nous la noterons
!
1 2 ··· n
s=
s(1) s(2) · · · s(n)
Par exemple pour n = 12 :

!
1 2 3 4 5 6 7 8 9 10 11 12
s=
9 5 3 7 2 12 11 10 4 6 1 8
est la bijection qui à 1 associe 9, à 2 associe 5, etc. On peut se demander pourquoi

imposer une notation aussi redondante, puisque les images sont données par la deuxième
ligne dans l’ordre de la première. La raison est que l’on réserve une notation plus
simple aux cycles. La composition des applications est notée ◦, mais nous noterons sn
la composée de s avec elle-même n fois.
Définition 1. Soit s une permutation de Sn et i un élément de {1, . . . , n}. On appelle
orbite de i pour s l’ensemble (fini) {sn (i) , n ∈ N}.
Dans l’exemple ci-dessus, pour trouver l’orbite de 1, on calcule l’image de 1 qui est
9, puis l’image de 9 qui est 4, etc., jusqu’à retrouver 1 (qui est l’image de 11). L’orbite
de 1 est donc {1, 9, 4, 7, 11}. L’orbite de 2 est {2, 5}, celle de 3 est {3} (on dit que 3
est un point fixe). Observez qu’une orbite est la même pour tous ses éléments : l’orbite
de 9, 4, 7 et 11 est aussi {1, 9, 4, 7, 11}. Le plus petit entier k tel que sk (x) = x est la
longueur de l’orbite {x, s(x), s2 (x), . . . , sk−1 (x)}. Par définition, un ensemble n’est pas
ordonné. Or nous aurons besoin d’un ordre pour écrire des cycles. Nous conviendrons
donc d’écrire une orbite comme la liste ordonnée [x, s(x), . . . , sk−1 (x)], où x est le plus
petit élément de l’orbite.
Définition 2. On appelle décomposition en orbites de la permutation s la séquence
d’orbites disjointes des éléments de {1, . . . , n} pour s, écrite par ordre croissant de leurs
plus petits éléments.
Un algorithme très simple produit la décomposition en orbites d’une permutation.
Tant qu’il reste des éléments de {1, . . . , n} hors des orbites déjà écrites
choisir le plus petit de ces éléments
1
écrire son orbite

Fin Tant que
Dans l’exemple ci-dessus, on commencera donc par écrire l’orbite de 1 : [1, 9, 4, 7, 11].
Le premier élément non rangé est 2. Son orbite est [2, 5]. L’élément 3 n’a pas été rangé,
son orbite est [3]. Le plus petit élément non rangé à ce stade est 6, dont l’orbite est
[6, 12, 8, 10]. Tous les éléments ont alors été rangés, et la décomposition en orbites de s
est :
[1, 9, 4, 7, 11], [2, 5], [3], [6, 12, 8, 10]
Définition 3. Soit s ∈ Sn une permutation et
[1, . . . , sk1 −1 (1)], . . . , [ih , . . . , skh −1 (ih )]
sa décomposition en orbites. On appelle signature de la permutation s et on note ε(s) :
ε(s) = (−1)(k1 −1)+···+(kh −1) ,
où k1 , . . . , kh sont les longueurs des orbites successives dans la décomposition de s.
Toujours sur le même exemple, les longueurs des orbites successives sont 5, 2, 1, 4,
la signature est donc ε(s) = (−1)4+1+0+3 = +1.
Soyons honnêtes : sachant décomposer une permutation en orbites et en déduire sa
signature, vous en savez assez pour calculer des déterminants, ce qui après tout est
bien le but de ce chapitre. Il serait dommage de vous en tenir là, car vous perdriez le
sel algébrique du groupe des permutations. Voici le résultat principal de cette section.
Théorème 1. L’application signature, de (Sn , ◦) dans ({−1, 1}, ×) est l’unique homo-
morphisme surjectif entre ces deux groupes.
La démonstration comporte plusieurs étapes, qui sont autant de résultats intéres-
sants. D’abord, nous allons enrichir les orbites pour donner un sens plus précis à la
notion de décomposition.
Définition 4. Soit k un entier supérieur ou égal à 2, et i1 , . . . , ik k éléments tous
distincts de {1, . . . , n}. On qualifiera de cycle de longueur k et on notera (i1 , . . . , ik ) la
permutation σ telle que :
σ(i1 ) = i2 , ... , σ(ik−1 ) = ik , σ(ik ) = i1 ,
et pour tout i ∈
/ {i1 , . . . , ik }, σ(i) = i .
L’inconvénient de cette notation est que plusieurs écritures différentes peuvent dési-
gner le même cycle : (1, 2, 3) et (2, 3, 1) par exemple. Comme ci-dessus, nous convenons
d’écrire en premier le plus petit élément du cycle. Ceci permet d’associer de manière
unique un cycle à une orbite. Observez que dans la décomposition en orbites du cycle
(i1 , . . . , ik ) on trouve [i1 , . . . , ik ], et n − k points fixes. La signature du cycle (i1 , . . . , ik )
est :
ε((i1 , . . . , ik )) = (−1)k−1 .
2
Proposition 1. Soit s une permutation et
[1, . . . , sk1 −1 (1)], . . . , [ih , . . . , skh −1 (ih )]
sa décomposition en orbites. Alors s est la composée des cycles déduits des orbites de
longueur > 2.
0 0
s = (i1 , . . . , sk1 −1 (1)) ◦ · · · ◦ (ih , . . . , skh −1 (ih )) , k10 , . . . , kh0 > 2 .
La vérification est immédiate. Observez que deux cycles commutent si les ensembles
d’éléments qu’ils concernent sont disjoints :
{i1 , . . . , ik } ∩ {j1 , . . . , jh } = ∅ =⇒ (i1 , . . . , ik ) ◦ (j1 , . . . , jh ) = (j1 , . . . , jh ) ◦ (i1 , . . . , ik )
Dans une décomposition en orbites, oubliez les singletons et ne conservez que les or-
bites de longueur au moins 2, que vous transformez en cycles : si kj > 2, remplacez
[ij , . . . , skj −1 (ij )] par (ij , . . . , skj −1 (ij )). Enfin, remplacez les virgules dans l’énuméra-
tion des orbites, par le signe de composition : votre permutation s est une composée
de cycles. !
1 2 3 4 5 6 7 8 9 10 11 12
s =
9 5 3 7 2 12 11 10 4 6 1 8
= (1, 9, 4, 7, 11) ◦ (2, 5) ◦ (6, 12, 8, 10)
!
1 2 3 4 5 6 7 8 9 10 11 12
=
9 2 3 7 5 6 11 8 4 10 1 12 !
1 2 3 4 5 6 7 8 9 10 11 12
◦
1 5 3 4 2 6 7 8 9 10 11 12 !
1 2 3 4 5 6 7 8 9 10 11 12
◦
1 2 3 4 5 12 7 10 9 6 11 8
Les cycles de longueur 2 jouent un rôle particulier. On les appelle transpositions. Leur
signature vaut −1. Afin de faciliter la lecture, pour i 6= j ∈ {1, . . . , n} nous noterons
τi,j = (i, j) la transposition de i et j :
τi,j (i) = j , τi,j (j) = i , τi,j (k) = k , ∀k 6= i, j .
Proposition 2. Soit s une permutation et
[1, . . . , sk1 −1 (1)], . . . , [ih , . . . , skh −1 (ih )]
sa décomposition en orbites. Alors s est la composée de (k1 − 1) + · · · + (kh − 1) trans-

positions.
Remarquez que le nombre de transpositions dans cette décomposition est exacte-

ment l’exposant de (−1) dans la définition de la signature.
3
Démonstration : Nous avons vu (proposition 1) que toute permutation s’écrit comme

une composée de cycles. Il nous suffit de vérifier qu’un cycle de longueur k est composée
de k − 1 transpositions. Voici une manière de décomposer le cycle (i1 , . . . , ik ) :
(i1 , . . . , ik ) = τi1 ,ik ◦ τi1 ,ik−1 ◦ · · · ◦ τi1 ,i2
(vérifiez-le, par récurrence sur k).

Toute permutation s’écrit donc comme un produit (au sens de la composition des
applications) de transpositions. Une telle écriture n’a rien d’unique : l’ordre de deux
cycles disjoints peut être changé, on peut toujours insérer deux fois la même permuta-
tion dans le produit sans changer le résultat, etc. Le miracle est que si deux produits
de transpositions donnent la même permutation, alors les nombres de permutations
dans ces deux produits ont la même parité : c’est une conséquence du théorème 1. Le
résultat suivant est l’étape clé dans sa démonstration.
Lemme 1. Soit s une permutation et τ une transposition. Alors :
ε(τ ◦ s) = −ε(s) .
Démonstration : L’idée de la démonstration est de montrer que la composée par une

transposition agit sur la décomposition en orbites, soit en cassant une orbite en deux,
soit en regroupant deux orbites. Dans les deux cas l’exposant de la signature est soit
augmenté, soit diminué de 1, et la signature est changée en son opposée.
Considérons la décomposition en orbites de s. Supposons que τ transpose les deux
éléments distincts i et j et examinons la décomposition en orbites de τ ◦ s. De deux
choses l’une : soit i et j appartiennent à la même orbite de s, soit i et j appartiennent
à deux orbites distinctes.
• Si i et j appartiennent à la même orbite de s. Quitte à réordonner les éléments,
nous pouvons supposer sans perte de généralité que l’orbite est [1, . . . , k], et que
les deux éléments à transposer sont 1 et j avec 1 < j 6 k. Pour la permutation
τ ◦ s, l’image d’un entier h est :
? s(h) si h est différent de j − 1 et k,
? 1 si h = j − 1,
? j si h = k.
L’orbite [1, . . . , k] est cassée en [1, . . . , j − 1] et [j, . . . , k]. Le terme k − 1 dans
l’exposant de la signature est remplacé par (j − 2) + (k − j). L’exposant de la
signature est diminué de 1, et celle-ci est changée en son opposée.
• Si i et j appartiennent à deux orbites distinctes de s. Quitte à réordonner les
éléments, nous pouvons supposer sans perte de généralité que les deux orbites
sont [1, . . . , j − 1] et [j, . . . , k], avec 1 < j 6 k 6 n et que les deux éléments à
transposer sont 1 et j. Pour la permutation τ ◦ s, l’image d’un entier h est :
? s(h) si h est différent de j − 1 et k
? j si h = j − 1
4
? 1 si h = k
Les deux orbites [1, . . . , j−1] et [j, . . . , k] sont regroupées en une seule : [1, . . . , k].
Les deux termes j − 2 et k − j dans l’exposant de la signature sont remplacés
par le terme k − 1. L’exposant de la signature est augmenté de 1, et celle-ci est
encore changée en son opposée.

Nous avons maintenant tous les outils pour démontrer le théorème 1.
Démonstration : Nous commençons par démontrer que la signature est un homomor-
phisme de groupes, de (Sn , ◦) dans ({−1, 1}, ×) :
∀s, s0 ∈ Sn , ε(s ◦ s0 ) = ε(s) × ε(s0 ) .
Soient s et s0 deux transpositions quelconques. D’après la proposition 2, s est le produit
de (k1 − 1) + · · · + (kh − 1) transpositions, où k1 , . . . , kh sont les longueurs des orbites
de s. Or d’après le lemme 1, la composée d’une transposition par une permutation
quelconque mutiplie sa signature par (−1). La composée de s0 par (k1 −1)+· · ·+(kh −1)
transpositions successives multiplie la signature par (−1)(k1 −1)+···+(kh −1) = ε(s), d’où le
résultat.
Pour terminer la démonstration du théorème 1, nous devons démontrer l’unicité.
Soit s une permutation quelconque : multiplions la transposition τ1,2 à droite par s−1
et à gauche par s : on obtient la transposition τs(1),s(2) . N’importe quelle transposition
se déduit donc de τ1,2 par une opération de ce type (on dit que les transpositions sont
toutes conjuguées). Considérons maintenant un homomorphisme de groupe ϕ de (Sn , ◦)
dans ({−1, 1}, ×). Comme ϕ est un homomorphisme de groupes,
ϕ(τs(1),s(2) ) = ϕ(s ◦ τ1,2 ◦ s−1 ) = ϕ(s)ϕ(τ1,2 )(ϕ(s))−1 = ϕ(τ1,2 ) .
Toutes les transpositions, puisqu’elles sont conjuguées, doivent avoir la même image par
ϕ. Supposons que cette image commune soit 1. Dans la mesure où toute permutation
s’écrit commme un produit de transpositions (proposition 2), on obtient φ(s) = 1
pour toute permutation s. Dans ce cas, l’homomorphisme φ est constant et donc non
surjectif. Si ϕ est supposé surjectif, alors nécessairement l’image de toute transposition
doit valoir −1. Donc ϕ coïncide avec ε sur toutes les transpositions. Mais puisque
toute permutation est produit de transpositions et que ϕ et ε sont tous les deux des
homorphismes de groupes,
∀s ∈ Sn , ϕ(s) = ε(s) .

1.2 Formes alternées

Le corps de nombres de référence sera R, mais tout ce qui suit vaut aussi pour le
corps des complexes C. Soit E un espace vectoriel de dimension n sur R.
5
Définition 5. On appelle forme n-linéaire alternée toute application f de E n dans R

telle que :
• f est n-linéaire : ∀i = 1, . . . , n, ∀v1 , . . . , vi−1 , vi+1 , . . . , vn ∈ E l’application par-
tielle qui à v ∈ E associe f (v1 , . . . , vi−1 , v, vi+1 , . . . , vn ) est linéaire :
∀u, v ∈ E , ∀λ, µ ∈ R ,
f (v1 , . . . , vi−1 , λu + µv, vi+1 , . . . , vn ) = λf (v1 , . . . , vi−1 , u, vi+1 , . . . , vn )
+µf (v1 , . . . , vi−1 , v, vi+1 , . . . , vn )
• f est alternée : ∀s ∈ Sn , ∀v1 , . . . , vn ∈ E, ∀i 6= j ∈ {1, . . . , n} :
f (v1 , . . . , vj , . . . , vi , . . . , vn ) = −f (v1 , . . . , vi , . . . , vj , . . . , vn ) .
Une forme linéaire associe donc un réel à un n-uplet de vecteurs. Si on remplace un
des n vecteurs par son produit par un réel, le résultat est multiplié par ce même réel.
Si on remplace un vecteur par une somme de deux vecteurs, le résultat est la somme
des deux résultats obtenus avec chacun des vecteurs (forme n-linéaire). De plus si on
échange deux des n vecteurs, le résultat est opposé (forme alternée). Nous aurions aussi
bien pu demander que l’image d’un n-uplet de vecteurs dans lequel deux d’entre eux
sont égaux, soit nulle.
Proposition 3. Soit f une forme n-linéaire. Alors f est une forme alternée si et
seulement si, pour tout n-uplet de vecteurs v1 , . . . , vn et pour tout i 6= j ∈ {1, . . . , n},
vi = vj =⇒ f (v1 , . . . , vn ) = 0 .
Démonstration : Supposons d’abord que f soit une forme alternée :

f (v1 , . . . , vi , . . . , vj , . . . , vn ) = −f (v1 , . . . , vj , . . . , vi , . . . , vn ) .
Si vi = vj , le résultat doit être le même : il ne peut être que nul.
Réciproquement, si f est une forme n-linéaire :
f (v1 , . . . , vi + vj , . . . , vi + vj , . . . , vn ) = f (v1 , . . . , vi , . . . , vi , . . . , vn )
+f (v1 , . . . , vi , . . . , vj , . . . , vn )
+f (v1 , . . . , vj , . . . , vi , . . . , vn )
+f (v1 , . . . , vj , . . . , vj , . . . , vn )
Si l’image d’un n-uplet dans lequel deux des vecteurs sont égaux est nulle, alors la
somme ci-dessus est nulle, et les deux termes dans lesquels vi et vj sont répétés sont
également nuls. Il vient donc :
f (v1 , . . . , vi , . . . , vj , . . . , vn ) = −f (v1 , . . . , vj , . . . , vi , . . . , vn ) .

Toute forme n-linéaire alternée est explicitement déterminée par sa valeur sur une
base.
6
Théorème 2. Soit (e1 , . . . , en ) une base de E. Soit (v1 , . . . , vn ) un n-uplet de vec-

teurs. Pour tout j = 1, . . . , n, on note (ai,j )i=1,...,n les coordonnées de vj dans la base
(e1 , . . . , en ) :
n
X
∀j = 1, . . . , n , vj = ai,j ei .
i=1
Alors :  
X n
Y
f (v1 , . . . , vn ) = f (e1 , . . . , en )  ε(s) as(j),j  ,
s∈Sn j=1
où ε(s) désigne la signature de la permutation s.
Démonstration : Appliquons la n-linéarité à :

n n
!
X X
f (v1 , . . . , vn ) = f ai,1 ei , . . . , ai,n ei .
i=1 i=1
On obtient une somme de facteurs dont chacun est calculé en choisissant l’un des termes
de la somme pour chacune des coordonnées. Un tel terme est défini par une application
de {1, . . . , n} dans lui-même :
 
X n
Y
f (v1 , . . . , vn ) =  aϕ(j),j  f (eϕ(1) , . . . , eϕ(n) ) .
ϕ∈{1,...,n}{1,...,n} j=1
Mais d’après la proposition 3, parmi les termes f (eϕ(1) , . . . , eϕ(n) ) tous ceux qui com-
portent deux fois le même vecteur sont nuls. Seuls peuvent être non nuls les termes
correspondant à une application ϕ de {1, . . . , n} dans lui-même injective. Une telle
application est nécessairement bijective : c’est une permutation.
 
X n
Y
f (v1 , . . . , vn ) =  as(j),j  f (es(1) , . . . , es(n) ) .
s∈Sn j=1
Or toute permutation est un produit de transpositions. Chaque transposition des coor-

données change le signe, donc si une permutation s est le produit de k transpositions :
f (es(1) , . . . , es(n) ) = (−1)k f (e1 , . . . , en ) .
Donc d’après la proposition 2 :
f (es(1) , . . . , es(n) ) = ε(s)f (e1 , . . . , en ) .

Le théorème 2 montre qu’une forme n-linéaire alternée est déterminée de façon
unique par sa valeur sur une base de E.
7
Définition 6. On appelle :
1. déterminant dans la base B l’unique forme linéaire alternée f telle que f (B) = 1 ;
on la note detB .
2. déterminant d’une famille (v1 , . . . , vn ) de n vecteurs de Rn son déterminant dans
la base canonique de Rn ;
3. déterminant d’une matrice carrée A ∈ Mn×n (R), le déterminant de la famille
de ses vecteurs colonnes dans la base canonique de Rn .
Voici comment s’effectuent les changements de base.
Proposition 4. Soient B et B 0 deux bases de E.

detB0 = detB0 (B) detB
Démonstration : Comme conséquence du théorème 2, deux formes n-linéaires alternées

sont toujours proportionnelles. Il existe donc une constante λ telle que detB0 = λdetB .
En prenant l’image par detB et detB0 de la base B, on trouve λ = detB0 (B), puisque
detB (B) = 1 par définition.
La plupart des déterminants que vous aurez à calculer seront des déterminants d’une
famille de vecteurs de Rn ou d’une matrice. On les note entre deux barres droites :
|v1 , . . . , vn | ou |A|
Soit A = (ai,j )i,j=1,...,n une matrice carrée. Le théorème 2 fournit une expression expli-
cite de son déterminant : n
X Y
|A| = ε(s) as(j),j . (1)
s∈Sn j=1
Commencez par vérifier que cette formule coïncide bien avec celles que vous connaissez
en dimensions 2 et 3.
x x
1 2
= x1 y 2 − x2 y 1 .
y1 y2

x x2 x3
1
y1

y2 y3 = x1 y2 z3 + x2 y3 z1 + x3 y1 z2 − z1 y2 x3 − z2 y3 x1 − z3 y1 x2 .

z1 z2 z3
La règle de Sarrus est un moyen mnémotechnique d’appliquer la formule en dimension
3 (et en dimension 3 seulement). On réécrit les deux premières lignes du déterminant
en dessous de celui-ci, puis on effectue tous les produits en diagonale. On affecte du
signe + les diagonales descendantes, du signe − les diagonales montantes, et on ajoute
le tout (figure 1). Par exemple :

1 2 3

2 −1 1
= +(−2) + (−12) + (+6) − (−9) − (−2) − (+8) = −5
3 −2 2

8
− z1 y2 x3
x1 x2 x3 − x1 z2 y3
y1 y2 y3
− y1 x2 z3
z1 z2 z3
x1 x2 x3 + x1 y2 z3
y1 y2 y3 + y1 z2 x3
+ z1 x2 y3
Figure 1 – Règle de Sarrus.
À part en dimensions 2 et 3, la formule (1) ne vous sera pas très utile, et vous ne
devez surtout pas la considérer comme un algorithme de calcul : elle suppose (n−1)(n!)
multiplications et n! − 1 additions, ce qui est prohibitif. Vous devez cependant retenir
les deux conséquences suivantes.
Proposition 5. Le déterminant d’une matrice est égal à celui de sa transposée.
Démonstration : Reprenons la formule explicite.

X n
Y
|A| = ε(s) as(j),j .
s∈Sn j=1
Nous pouvons réindicer le produit correspondant à la permutation s :

n
Y n
Y
as(j),j = ai,s−1 (i) .
j=1 i=1
De plus la signature d’une permutation est égale à celle de son inverse (car ε est un
homomorphisme de groupe).
n
ε(s−1 )
X Y
|A| = ai,s−1 (i) .
s∈Sn i=1
Réindiçons alors la somme :

n
ai,s(i) = |tA| .
X Y
|A| = ε(s)
s∈Sn i=1
9
Proposition 6. Le déterminant d’une matrice triangulaire par blocs est le produit des
déterminants des blocs diagonaux.
Démonstration : Par la proposition précédente il suffit d’examiner le cas d’une matrice

triangulaire par blocs supérieure, c’est-à-dire du type :
 
B1 ? ? ?
...
 
0 ? ?
 
 
A= 
 .. .. ..



 . . . ? 

0 ··· 0 Bd
Nous souhaitons montrer que
|A| = |B1 | . . . |Bd | .
La démonstration s’effectue par récurrence sur le nombre de blocs. Si d = 1, il n’y a

rien à démontrer. Nous affirmons qu’il suffit de démontrer la propriété pour d = 2. En
effet, une matrice diagonale avec d blocs peut être vue comme une matrice à 2 blocs,
dont l’un a lui-même d − 1 blocs. Si la propriété est vraie pour 2 et pour d − 1, elle
sera vraie pour d, d’où le résultat par récurrence. Considérons donc une matrice A du
type :  
B1 ?
A= 
0 B2
Nous supposons donc que pour un certain entier k strictement compris entre 1 et n :
(i > k et j 6 k) =⇒ ai,j = 0 ,
de sorte que
B1 = (ai,j )i,j=1,...,k et B2 = (ai,j )i,j=k+1,...,n .
Utilisons à nouveau la formule explicite.
X n
Y
|A| = ε(s) as(j),j .
s∈Sn j=1
Soit s ∈ Sn une permutation. Le produit nj=1 as(j),j est nul s’il existe j tel que s(j) > k
Q
et j 6 k. Supposons que ce produit soit non nul. Alors nécessairement j 6 k entraîne

s(j) 6 k. Soit s1 la restriction de s à {1, . . . , k} : c’est une permutation de {1, . . . , k}.
Donc la restriction s2 de s à {k + 1, . . . , n} est aussi une permutation de {k + 1, . . . , n}.
On a donc s = s1 ◦ s2 , ce qui entraîne ε(s) = ε(s1 )ε(s2 ). Le produit s’écrit alors :
n
Y k
Y n
Y
as(j),j = as1 (j),j as2 (j),j .
j=1 j=1 j=k+1
10
Notons S l’ensemble des permutations de {1, . . . , k} et S 0 l’ensemble des permutations

de {k + 1, . . . , n}. Si on le débarrasse des termes nuls, le déterminant de A devient :
X X k
Y n
Y
|A| = ε(s1 )ε(s2 ) as1 (j),j as2 (j),j
s1 ∈S s2 ∈S 0 j=1 j=k+1
  
X k
Y X n
Y
=  ε(s1 ) as1 (j),j   ε(s2 ) as2 (j),j 
s1 ∈S j=1 s2 ∈S 0 j=k+1
= |B1 | |B2 | .

L’application la plus fréquente de la proposition 6 concerne les matrices triangu-
laires (n blocs de taille 1 sur la diagonale) : le déterminant d’une matrice triangulaire
est le produit de ses coefficients diagonaux. Comme cas particulier, le déterminant
d’une matrice diagonale est le produit des coefficients diagonaux, et le déterminant de
la matrice identité est 1.
Vous devez également retenir les conséquences suivantes de la définition 6.
Proposition 7. Quelle que soit la base B,
1. une famille de vecteurs est liée si et seulement si son déterminant est nul ;
2. on ne modifie pas le déterminant si on ajoute à l’un des vecteurs une combinai-
son linéaire des autres.
Démonstration :
1. Soit (v1 , . . . , vn ) une famille de n vecteurs de E. Dans un espace vectoriel de
dimension n, si une famille de n vecteurs est libre, alors c’est une base. Par la
proposition 4, le déterminant de cette base dans n’importe quelle autre est non
nul. Réciproquement, si la famille est liée, alors l’un des vecteurs est combinaison
linéaire des autres. Sans perte de généralité, supposons que ce soit le dernier.
En utilisant la linéarité par rapport à la dernière coordonnée :
n−1
X n−1
X
detB (v1 , . . . , vn−1 , λi vi ) = λi detB (v1 , . . . , vn−1 , vi )
i=1 i=1
Or le déterminant d’une famille de vecteurs dont deux sont égaux est nul (pro-
position 3). La somme est donc nulle.
2. Ajoutons au dernier vecteur une combinaison linéaire des autres.
n−1
X
detB (v1 , . . . , vn−1 , vn + λi vi ) = detB (v1 , . . . , vn−1 , vn )
i=1
n−1
X
+detB (v1 , . . . , vn−1 , λi vi ) .
i=1
11
D’après le point précédent, le second déterminant est nul. D’où le résultat.

Voici l’écriture en termes de matrices, combinant la proposition précédente avec la
proposition 5.
Corollaire 1.
1. Le déterminant d’une matrice carrée de taille n × n est nul si et seulement si
son rang est strictement inférieur à n.
2. On ne modifie pas le déterminant d’une matrice en ajoutant à l’un des vecteurs
colonnes une combinaison linéaire des autres.
3. On ne modifie pas le déterminant d’une matrice en ajoutant à l’un des vecteurs
lignes une combinaison linéaire des autres.
1.3 Déterminant d’un endomorphisme

Soit E un espace vectoriel de dimension n, et f un endomorphisme (application
linéaire de E dans E). Le déterminant dans une base de E de l’image par f de cette
même base, ne dépend pas de la base choisie.
Proposition 8. Soient B et B 0 deux bases de E. Alors :
detB (f (B)) = detB0 (f (B 0 )) .
Démonstration : L’application qui à un n-uplet de vecteurs (v1 , . . . , vn ) associe

detB (f (v1 ), . . . , f (vn )) est n-linéaire et alternée. D’après le théorème 2, elle est propor-
tionnelle à l’application detB . Il existe donc une constante λ telle que
detB (f (v1 ), . . . , f (vn )) = λ detB (v1 , . . . , vn ) .
Or par définition :
detB (B) = 1 .
En utilisant le cas particulier où les vecteurs v1 , . . . , vn sont ceux de la base B, la
constante λ est nécessairement detB (f (B)). De même,
detB0 (f (v1 ), . . . , f (vn )) = detB0 (f (B 0 )) detB0 (v1 , . . . , vn ) .
Mais d’après la proposition 4,

detB0 = detB0 (B) detB .
Donc

detB0 (f (v1 ), . . . , f (vn )) = detB0 (B) detB (f (v1 ), . . . , f (vn ))

= detB0 (B) detB (f (B) detB (v1 , . . . , vn ) .
12
Mais aussi :

detB0 (f (v1 ), . . . , f (vn )) = detB0 (f (B 0 )) detB0 (v1 , . . . , vn )

= detB0 (f (B 0 )) detB0 (B) detB (v1 , . . . , vn ) .
Il s’ensuit que
detB (f (B)) = detB0 (f (B 0 )) .

La proposition 8 permet de définir le déterminant d’un endomorphisme.
Définition 7. On appelle déterminant de l’endomorphisme f , et on note det(f ) la

valeur de detB (f (B)), commune à toutes les bases B.
Le déterminant de f est donc égal au déterminant de la matrice de f dans n’importe

quelle base. De plus, si B est une base de E et (v1 , . . . , vn ) un n-uplet quelconque de
vecteurs de E :
detB (f (v1 ), . . . , f (vn )) = det(f ) detB (v1 , . . . , vn ) .
Théorème 3. Soient f et g deux endomorphismes de E. Alors :
det(g ◦ f ) = det(g) det(f ) .
Démonstration : Soit B une base de E. Par définition du déterminant d’un endomor-

phisme,
det(g ◦ f ) = detB (g(f (B)))

= det(g) detB (f (B))
= det(g)det(f ) .

Dans le cas particulier où f est un automorphisme de E, son déterminant est non
nul (l’image par f d’une base est une base). Sa composée avec l’application réciproque
f −1 est l’identité, de déterminant 1. Donc :
1
det(f −1 ) = .
det(f )
La traduction en termes de matrices est la suivante.
Corollaire 2.
13
1. Soient A et B deux matrices de taille n × n.
det(AB) = det(A) det(B) .
2. Une matrice carrée A est inversible si et seulement si son déterminant est non
nul, et alors :

−1 1
A =
|A|
1.4 Mineurs et cofacteurs

Les mineurs sont les déterminants de dimensions inférieures que l’on extrait d’un
déterminant initial en ne conservant que certaines lignes et colonnes.
Définition 8. Soit A = (ai,j )i,j=1,...,n une matrice carrée. Soit k un entier compris
entre 1 et n. Soient l et c deux applications injectives de {1, . . . , k} dans {1, . . . , n}.
On appelle mineur d’ordre k du déterminant |A|, associé aux lignes (l(i))i=1,...,k et aux
colonnes (c(j))j=1,...,k , le déterminant :
|(al(i),c(j) )i,j=1,...,k | .
Le mineur d’ordre 2 extrait d’un

déterminant d’ordre 4 pour l(1) = 1, l(2) = 3,
a a
c(1) = 2, c(2) = 4 est 1,2 1,4 :
a3,2 a3,4

a1,1 a1,2 a1,3 a1,4

a2,1 a2,2 a2,3 a2,4

.

a3,1 a3,2 a3,3 a3,4

a4,1 a4,2 a4,3 a4,4
Nous savons déjà qu’une famille de vecteurs est libre si et seulement si son déterminant
est non nul (proposition 7), ou bien qu’une matrice est de rang maximal si et seulement
si son déterminant est non nul (corollaire 1). Les mineurs permettent de déterminer
exactement le rang d’une matrice quand il n’est pas maximal.
Proposition 9. Soit A une matrice de taille n × n. La matrice A est de rang r < n si
et seulement si :
1. il existe un mineur d’ordre r non nul et
2. tous les mineurs d’ordre r + 1 sont nuls.
Démonstration : Il est équivalent de démontrer que le rang de A est strictement

inférieur à r si et seulement si tous les mineurs d’ordre r sont nuls.
Si le rang de A est strictement inférieur à r, alors toute famille de r vecteurs colonnes est
liée. Considérons une famille de r vecteurs colonnes de A, et supposons qu’elle soit liée.
14
Au moins un des vecteurs est combinaison linéaire des autres : sans perte de généralité,
nous pouvons supposer que c’est le dernier. Considérons un mineur d’ordre r extrait de
A, en choisissant les r colonnes de la famille considérée, et r lignes quelconques. Dans
ce mineur, la dernière colonne est combinaison linéaire des autres et donc le mineur
est nul. Ce qui précède vaut pour toute famille de r vecteurs colonnes, donc tous les
mineurs d’ordre r sont nuls.
Nous montrons ensuite la contraposée de l’implication réciproque. Si le rang de A est
supérieur ou égal à r alors il existe une famille libre de r vecteurs colonnes. Choisissons
r vecteurs colonnes formant une famille libre, et considérons la matrice n × r de ces
r vecteurs colonnes, qui est donc de rang r. Les vecteurs lignes forment une matrice
de n vecteurs de Rr . Or une matrice et sa transposée ont même rang. La famille des
n vecteurs lignes est encore de rang r. On peut donc en extraire une famille libre de
r vecteurs. Les coordonnées de ces r vecteurs forment une matrice r × r de rang r,
extraite de la matrice A. Son déterminant est un mineur de taille r et il est non nul.
Les mineurs d’ordre n − 1 jouent un rôle particulier : affectés de signes alternés, ce sont
les cofacteurs.
Définition 9. Soit A = (ai,j )i,j=1,...,n une matrice carrée. Soient i et j deux entiers
compris entre 1 et n. On appelle cofacteur d’indices i et j et on note Ai,j le produit
par (−1)i+j du mineur d’ordre n − 1 obtenu en supprimant la i-ième ligne et la j-ième
colonne de A.
Ai,j = (−1)i+j |(ah,k )h6=i,k6=j | .
La matrice des cofacteurs est appelée comatrice de A et notée Ae :
Ae = (Ai,j )i,j=1,...,n .
Une première utilisation des cofacteurs est le développement suivant une ligne ou
une colonne.
Proposition 10. Soit A = (ai,j )i,j=1,...,n une matrice carrée. Soient i et j deux entiers
compris entre 1 et n.
n
X n
X
|A| = ai,k Ai,k = ah,j Ah,j .
k=1 h=1
Démonstration : Comme le déterminant d’une matrice est égal à celui de sa transpo-

sée, il suffit de démontrer pour le développement selon la j-ième colonne. Cette j-ième
P
colonne est le vecteur (ah,j ), qui s’écrit h ah,j eh , où les eh sont les vecteurs de la base
canonique. Par la n-linéarité, il suffit de démontrer que le cofacteur Ah,j est le déter-
minant obtenu en remplaçant la j-ième colonne de A par le vecteur eh , dont la h-ième
coordonnée vaut 1 et les autres sont nulles. Considérons cette nouvelle matrice. Appli-
quons aux lignes le cycle (1, . . . , h), dont la signature est (−1)h−1 . Appliquons ensuite
aux colonnes le cycle (1, . . . , j), dont la signature est (−1)j−1 . On obtient une matrice
15
diagonale par blocs : la première colonne est le vecteur (e1 ). D’après la proposition 6, le
déterminant est le produit des déterminants des deux blocs diagonaux. Le premier est
|1|. Le second est le déterminant du mineur extrait de A en supprimant la ligne h et la
colonne j. Pour tenir compte des permutations effectuées sur les lignes et colonnes, il
convient de le multiplier par (−1)h−1 (−1)j−1 = (−1)h+j : on obtient bien le cofacteur
Ah,j .
Proposition 11. Pour toute matrice A de taille n,
A tAe = tAe A = |A| In ,
où Ae est la comatrice de A, tAe sa transposée, et In la matrice identité.
Démonstration : Pour i, j = 1, . . . , n, le coefficient d’indices i, j du produit A tAe est :

n
X
ai,k Aj,k .
k=1
Le coefficient d’indices i, j du produit tAe A est :

n
X
Ah,i ah,j .
h=1
Pour i = j, nous avons déjà vérifié dans la proposition précédente que ces coefficients
valent |A|. Il reste à montrer qu’ils sont nuls pour i 6= j. Nous avons vu dans la
démonstration précédente, que le cofacteur Ah,i est égal au déterminant de la matrice
n × n déduite de A en remplaçant la i-ième colonne de A par le vecteur eh , dont la
h-ième coordonnée vaut 1 et les autres sont nulles. Par la n linéarité, nh=1 Ah,i ah,j est
P
le déterminant déduit de A en remplaçant la i-ième colonne par la j-ième. Mais alors,

la i-ième colonne et la j-ième sont identiques, donc le déterminant est nul. On obtient
l’autre résultat en échangeant le rôle des lignes et des colonnes (proposition 5).
Dans le cas où le déterminant de A est non nul, la proposition 11 fournit une
expression explicite de son inverse.
Corollaire 3. Soit A une matrice carrée inversible. L’inverse de A est :
1 te
A−1 = A.
|A|
On obtient même une résolution explicite du système Ax = b : ce sont les formules
de Cramer.
Corollaire 4. Soit A une matrice carrée inversible. Soit b un vecteur de Rn . Notons
Ab,j la matrice déduite de A en remplaçant la j-ième colonne par b. Soit x = (xi )i=1,...,n
la solution du système Ax = b. Alors :
|Ab,j |
∀j = 1, . . . , n , xj = .
|A|
16
Démonstration : Le vecteur x est le produit A−1 b. En utilisant l’expression de A−1 en

fonction de la comatrice,
n
1 X
xj = Ai,j bj .
|A| i=1
Utilisons à nouveau l’interprétation du cofacteur Ai,j comme le déterminant déduit de
A en remplaçant la j-ième colonne par ei : la somme ni=1 Ai,j bj est bien le déterminant
P
de Ab,j .
Et pour terminer, la mauvaise nouvelle : aucun des résultats de cette section n’est
algorithmiquement utile ! Pour calculer le rang d’une matrice, il est beaucoup plus
rapide d’appliquer la méthode du pivot de Gauss (le rang est le nombre de pivots non
nuls) que de calculer les mineurs. Pour calculer l’inverse d’une matrice, la méthode du
pivot de Gauss est encore la plus efficace (et de loin !) comparée à la comatrice. Et
pour résoudre un système linéaire ? Toujours le pivot de Gauss, plutôt que les formules
de Cramer. Mais au fait quel est le meilleur algorithme pour calculer un déterminant ?
Ben justement : le pivot de Gauss.
1.5 Méthodes de calcul

Nous commençons par extraire des sections précédentes les résultats les plus utiles
pour le calcul pratique.
(R1) Le déterminant d’une matrice triangulaire est le produit des coefficients de la
diagonale.
(R2) On ne modifie pas un déterminant si on ajoute à une ligne (ou une colonne)
une combinaison linéaire des autres lignes (ou des autres colonnes).
(R3) Si on multiplie une ligne ou une colonne par une constante, le déterminant
est multiplié par cette même constante.
(R4) On peut développer un déterminant selon ou une ligne ou une colonne, grâce
aux formules n n
X X
|A| = ai,k Ai,k = ah,j Ah,j ,
k=1 h=1
où les Ai,j sont les cofacteurs.

Attention, il faut appliquer ces résultats un par un et pas simultanément ; en particulier,
il convient d’éviter d’ajouter en même temps des combinaisons linéaires à plusieurs
lignes ou colonnes, ce qui engendre souvent des erreurs. On ne se lance jamais dans
le développement selon ou une ligne ou une colonne, avant d’avoir utilisé les résultats
précédents, pour « faire apparaître des zéros ».
La méthode algorithmique, sans astuce donc conseillée, est la méthode du pivot de
Gauss, qui procède par transformations successives pour faire apparaître des zéros sous
la diagonale. Une petite piqure de rappel sur un exemple n’est peut-être pas superflue.
17
Considérons la matrice suivante.

1 1 0 1
 
 2 1 1 0 
A=
 
1 2 −1 1

 
−1 0 −1 −3
Le coefficient d’indices (1, 1) est non nul, il n’y a donc pas de permutations à effectuer.
Le premier pivot est p1 = 1. Voici les transformations qui annulent la première colonne
au-dessous du pivot.
1 1 0 1
 
L2 ← L2 − 2L1 
 0 −1 1 −2 

L3 ← L3 − L1 0 1 −1 0
 
 
L4 ← L4 + L1 0 1 −1 −2
Le second pivot est −1. Les transformations qui annulent le bas de la seconde colonne
sont les suivantes.
1 1 0 1
 
 0 −1 1 −2 
 
L3 ← L3 + L2  0 0 0 −2
 

L4 ← L4 + L2 0 0 0 −4
Pour obtenir un troisième pivot non nul, il faut échanger les deux dernières colonnes.
1 1 1 0
 

 0 −1 −2 1 

0 0 −2 0
 
 
0 0 −4 0
Le troisième pivot est −2. Il ne reste qu’une ligne à transformer.
1 1 1 0
 

 0 −1 −2 1 

0 0 −2 0
 
 
L4 ← L4 − 2L3 0 0 0 0
Constatez qu’à chaque étape de la méthode, les transformations consistent à :

1. ajouter à une ligne un multiple d’une autre, ce qui ne change pas le déterminant ;
2. permuter deux lignes ou deux colonnes, ce qui change le déterminant en son
opposé.
La matrice obtenue au bout du compte est triangulaire ; son déterminant est le produit
des coefficients diagonaux. Pour en déduire le déterminant initial, il suffit de compter le
nombre de permutations de lignes ou de colonnes, et de changer le signe si ce nombre est
impair. Au bilan, le nombre d’opérations nécessaire au calcul d’un déterminant d’ordre
18
n par la méthode du pivot de Gauss est équivalent à 23 n3 , ce qui est incomparablement

plus rapide que les n(n!) opérations de la formule explicite.
Nous illustrons maintenant les méthodes de calcul sur quelques exemples classiques.
Proposition 12. Le déterminant

0 a1 a2

. . . an
a1 0 a2 . . . an

D(a1 , . . . , an ) = a1 a2 0

. . . an
..
. . . ..
.

.
a1 a2 . . . an 0

est :
n n
! !
n
X Y
D(a1 , . . . , an ) = (−1) ai ai .
i=1 i=1
Démonstration : La somme des éléments de chaque ligne vaut ni=1 ai . On commence

P
donc par ajouter toutes les colonnes à la première, puis on met ni=1 ai en facteur.
P

1 a1 a2 . . . an
1 0 a2 . . . an

n
!

1 a2 0 . . . an
X
D(a1 , . . . , an ) = ai

.. .. .
. ..

i=1
.
1 a2 . . . an 0

On conserve la première ligne, puis on retranche chaque ligne à la suivante :

1 a1 a2 ... ... an

0 −a1 0 ... ... 0

... ..

n −a2
!
X 0 a2 .

D(a1 , . . . , an ) = ai .. ... ... ... ..

i=1

. ...
.
.. ..

. . an−1 −an−1 0
0 ... ... 0 an −an

On développe alors suivant la première colonne :

−a1

0 ... ... 0
..

..
n
!
a2 −a2 . .

D(a1 , . . . , an ) =
X
ai ... ... ..
0 .

i=1 .. ...
. an−1 −an−1 0

0 ... 0 an −an
Ce dernier déterminant est celui d’une matrice triangulaire : il est le produit des élé-
ments de la diagonale.
19
Proposition 13. Le déterminant (dit « de Vandermonde »)

1 a1 a21 . . . an−1

1

1 a2 a22 . . . an−1

2
2 n−1

D(a1 , . . . , an ) = 1 a3 a3 . . . a3

..
..

. .

2 n−1
1 an an . . . an

est : Y
D(a1 , . . . , an ) = (aj − ai ) .
16i<j6n
Démonstration : Considérons le polynôme de degré n − 1 qui a pour racines

a1 , . . . , an−1 :
n−1 n−2
n−1
cj X j .
Y X
P (X) = (X − ai ) = X +
i=1 j=0
Ajoutons à la dernière colonne la première multipliée par c0 , la seconde multipliée par

c1 , etc. Par définition de P , ceci va annuler les éléments de la dernière colonne, sauf le
dernier :
1 a 2
1 a1 . . . 0
1 a2 a22 . . . 0

2

D(a1 , . . . , an ) = 1 a3 a3 . . . 0

.
.. ..
.

1 an a2n . . . P (an )

Si on développe suivant la dernière colonne,
D(a1 , . . . , an ) = P (an ) D(a1 , . . . , an−1 ) .

Qn−1
Or P (an ) = i=1 (an − ai ) : d’où le résultat, par récurrence.
Voici une autre démonstration. Le déterminant D(a1 , . . . , an ) est un polynôme en
a1 , . . . , an . Le développement selon une ligne quelconque, montre que c’est un poly-
nôme de degré n − 1 en chacune des variables. Or il s’annule dès que deux d’entre elles
sont égales (puisqu’alors deux lignes coïncident). Donc D(a1 , . . . , an ) est un multiple
du produit de toutes les différences (aj − ai ) pour 1 6 i < j 6 n. Or ces deux poly-
nômes sont de même degré en chacune des variables. Il ne reste donc qu’à déterminer
la constante de proportionnalité. Pour cela, examinons le terme en ann−1 : il est égal
au mineur d’indices (n, n), qui est D(a1 , . . . , an−1 ), affecté du signe + comme tous les
mineurs diagonaux. Par récurrence, le coefficient de proportionnalité cherché est donc
1.
20
Proposition 14. Le déterminant (dit « circulant »)

a1 a2 . . . an−1 an

an a1 a2 . . . an−1

D(a1 , . . . , an ) = an−1 an a1 . . . an−2

.. ..
.
.

a2 a3 . . . a n a1

est :
n−1
Y
D(a1 , . . . , an ) = P (θk ) ,
k=0
où P est le polynôme
P (X) = a1 + a2 X + · · · + an X n−1 ,
et les θk sont les racines n-ièmes de l’unité :
∀k = 0, . . . , n − 1 , θk = ei(2πk/n) .
Démonstration : Notons A la matrice proposée. Soit θ une racine n-ième de l’unité

(quelconque). Considérons le vecteur (colonne) v(θ) = (θk )k=0,...,n−1 , et multiplions à
droite la matrice A par v(θ). La première coordonnée du produit est
a1 + a2 θ + · · · + an θn−1 = P (θ) .
La seconde coordonnée est :
an + a1 θ1 + · · · + an−1 θk−1 = θP (θ) .
On vérifie de même, que pour i = 1, . . . , n, la i-ième coordonnée est θi−1 P (θ). Donc
Av(θ) = P (θ)v(θ).
Considérons maintenant la famille de vecteurs (v(θ0 ), . . . , v(θn−1 )). Son déterminant
est le déterminant de Vandermonde de la proposition précédente : les θi étant tous
différents, il est non nul. Donc la famille de vecteurs est une base. Notons-la B. Soit f
l’endomorphisme qui a pour matrice A dans la base canonique. Sa matrice dans la base
B est la matrice diagonale dont les coefficients diagonaux sont P (θ0 ), . . . , P (θn−1 ) : son
déterminant est le produit n−1
Q
k=0 P (θk ). Or le déterminant de f est le même quelle que
soit la base dans laquelle on écrit sa matrice. D’où le résultat.
Proposition 15. Le déterminant

−x 0 ... ... 0 a0

... ... ..
1 . a1

... . . . .. ..

0 . .

D(a0 , . . . , an−1 , x) =
.. .. .. ..

. . . 0 .

.. .. ..

. . . −x an−2

0 ... ... 0 1 an−1 − x

21
est :
D(a0 , . . . , an−1 , x) = (−1)n (xn − an−1 xn−1 − · · · − a1 x − a0 ) .
La matrice pour x = 0 est la matrice compagnon du polynôme ci-dessus : vous

comprendrez pourquoi quand vous étudierez la réduction des endomorphismes.
Démonstration : Pour n = 1, la formule donne D(an−1 , x) = −(x − an−1 ), elle est donc
correcte. Développons suivant la première ligne :

−x 0 ... ... 0 a1

... ... ..
1 . a2

.. .. .. ..
0 . . . .

D(a0 , . . . , an−1 , x) = (−x) .. .. .. ..

. . . 0 .

.. .. ..

. . . −x an−2

0 ... ... 0 1 an−1 − x

1 −x . . . . . . 0

..

. .
0 .. ..

.
+(−1)n+1 a0
.. . . .. ..
. . . .
.. .. ..

. . . −x

0 ... ... 0 1
= (−x)D(a1 , . . . , an−1 , x) + (−1)n+1 a0 .
Si D(a1 , . . . , an−1 , x) = (−1)n−1 (xn−1 − an−2 xn−2 − · · · − a1 x − a0 ), alors l’expression

ci-dessus donne bien
D(a0 , . . . , an−1 , x) = (−1)n (xn − an−1 xn−1 − · · · − a1 x − a0 ) ,
d’où le résultat, par récurrence.
1.6 Interprétation géométrique

Vous savez sans doute déjà qu’en géométrie plane, l’aire d’un parallélogramme est
au signe près le déterminant des deux vecteurs qui l’engendrent. C’est vrai en dimension
quelconque.
Définition 10. Soit E un espace vectoriel de dimension n. Soit (v1 , . . . , vn ) un n-uplet

de vecteurs de E. On appelle parallélépipède engendré par (v1 , . . . , vn ) l’ensemble :
P (v1 , . . . , vn ) = { λ1 v1 + · · · + λn vn , (λ1 , . . . , λn ) ∈ [0, 1]n } .
22
B

C

B

O A O A
Figure 2 – Parallélépipèdes en dimension 2 et 3.
En dimension 2, c’est un parallélogramme, en dimension 3 un parallélépipède ordi-

naire (figure 2).
Pour définir une mesure, il faut un étalon qui en donne l’unité. Dans Rn , on convient
que le volume du parallélépipède engendré par les vecteurs de la base canonique est 1.
Dans un espace vectoriel E, on peut choisir une base B quelconque, et décider que le
volume du parallélépipède qu’elle engendre vaut 1.
Une fois fixé l’étalon, comment calculer le volume des autres parallélépipèdes, c’est-
à-dire définir une application V P qui à un n-uplet (v1 , . . . , vn ) associe le volume du
parallélépipède P (v1 , . . . , vn ) ?
VP
E n −→ R
(v1 , . . . , vn ) 7−→ V P (v1 , . . . , vn )
Voici trois propriétés « physiquement raisonnables ».

(P1) Si on remplace un vecteur par la somme de deux autres, le volume est la somme
des deux volumes.
V P (v1 , . . . , v + v 0 , . . . , vn ) = V P (v1 , . . . , v, . . . , vn ) + V P (v1 , . . . , v 0 , . . . , vn ) .
(P2) Si on multiplie un des vecteurs par un réel, le volume doit être multiplié par ce
même réel.
V P (v1 , . . . , λv, . . . , vn ) = λV P (v1 , . . . , v, . . . , vn )
(P3) Si deux des vecteurs sont identiques, alors le volume est nul.
V P (v1 , . . . , v, . . . , v, . . . , vn ) = 0 .
La propriété (P1) est facile à admettre. Pensez à deux boîtes posées l’une sur l’autre :
elles ont une face en commun et la pile forme un nouveau parallélépipède, dont le
volume est bien la somme des volumes des deux boîtes. Attention, si vous l’admettez
pour v + v 0 , vous devez l’admettre aussi pour v − v 0 ; et si on peut soustraire deux
volumes, alors un volume peut être négatif. Effectivement, le volume ici est muni d’un
23
signe. La valeur absolue est la mesure au sens ordinaire, le signe traduit l’orientation
du n-uplet de vecteurs. La propriété (P2) est elle aussi assez naturelle : si vous étirez un
parallélépipède dans une direction, vous multipliez son volume. Mais surtout, elle est
(presque) une conséquence de (P1) : en effet, pour tout λ entier, puis rationnel, (P2)
se déduit de (P1). Il suffit alors de faire l’hypothèse que les applications partielles sont
continues au voisinage de 0 pour en déduire la propriété pour tout λ réel. La propriété
(P3) est aussi très naturelle : si deux des vecteurs qui engendrent le parallélépipède
sont identiques, celui-ci est « aplati », c’est-à-dire qu’il est inclus dans un hyperplan.
Étant inclus dans un sous-espace de dimension inférieure, son volume n-dimensionnel
est nul.
Maintenant, relisez la section 1.2, en particulier la définition 6 et la proposition
3. L’application V P , si elle vérifie les propriétés (P1), (P2) et (P3), est une forme
multilinéaire alternée. Si de plus V P (B) = 1, alors V P est le déterminant dans la base
B. Si (v1 , . . . , vn ) est tel que detB (v1 , . . . , vn ) est non nul, alors (v1 , . . . , vn ) est une base
de E. La valeur absolue du déterminant est le volume du parallélépipède engendré,
au sens ordinaire. Son signe est positif si la nouvelle base a la même orientation que
l’ancienne, négatif dans le cas contraire.
24
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. La signature de la permutation proposée est +1 : vrai ou faux et pour-
quoi ?
!
1 2 3 4 5
1.
1 3 2 4 5
!
1 2 3 4 5
2.
2 1 3 5 4
!
1 2 3 4 5
3.
2 3 4 1 5
!
1 2 3 4 5
4.
4 5 3 2 1
!
1 2 3 4 5
5.
3 5 4 1 2
!
1 2 3 4 5
6.
3 2 4 1 5
!
1 2 3 4 5
7.
3 1 4 5 2
Vrai-Faux 2. Soient v1 , v2 , v3 , v4 4 vecteurs quelconques de R4 . On note det le déter-
minant dans la base canonique de R4 . Parmi les affirmations suivantes lesquelles sont
1. Si v2 = −v4 alors det(v1 , v2 , v3 , v4 ) = 0.
2. Si v3 = −2v4 alors det(v1 , v2 , v3 , v4 ) = −2.
3. det(v1 , v3 , v4 , v2 ) = −det(v1 , v2 , v3 , v4 )
4. det(v1 , 2v2 , 3v4 , 4v4 ) = 24 det(v1 , v2 , v3 , v4 )
5. det(v1 + v3 , v2 , v1 + v3 , v4 ) = 2 det(v1 , v2 , v3 , v4 )
6. det(v1 + 3v3 , v2 , v3 , v4 ) = det(v1 , v2 , v3 , v4 )
7. det(v1 + 3v3 , v2 , v3 , v4 − v2 ) = det(v1 , v2 , v3 , v4 )
8. det(3v1 + v3 , v2 , v3 , v4 − v2 ) = det(v1 , v2 , v3 , v4 )
9. det(2v1 + v3 , v2 , v3 , 2v4 − v2 ) = 4 det(v1 , v2 , v3 , v4 )
Vrai-Faux 3. Soit n un entier supérieur ou égal à 2. On considère un n-uplet de vecteurs
de Rn . Parmi les affirmations suivantes lesquelles sont vraies, lesquelles sont fausses et
pourquoi ?
1. Si on remplace l’un des vecteurs par une combinaison linéaire des autres le
déterminant est inchangé.
25
2. Si on soustrait au premier vecteur la somme de tous les vecteurs, le détermi-

nant est inchangé.
3. Si on soustrait le premier vecteur à chacun des autres, le déterminant est
inchangé.
4. Si on multiplie les deux premiers vecteurs par −1, le déterminant est inchangé.
5. Si on multiplie chacun des vecteurs par 2, le déterminant est multiplié par 2n .
6. Si on ajoute au dernier vecteur la somme de tous les vecteurs, le déterminant
est multiplié par 2.
7. Si on échange deux des vecteurs, le déterminant est changé en son opposé.
Vrai-Faux 4. Soit A une matrice carrée de taille n × n (n > 2). Parmi les affirmations
suivantes lesquelles sont vraies, lesquelles sont fausses et pourquoi ?
1. |A| = |tA|
2. |2A| = 2|A|
3. | − A| = (−1)n |A|
4. |A + tA| = 2|A|
5. Si A est diagonale, son déterminant est le produit des coefficients diagonaux.
6. Si A est triangulaire, son déterminant est le produit des coefficients diagonaux.
7. Si A est diagonale par blocs, son déterminant est le produit des coefficients
diagonaux.
8. Si une des lignes de A est combinaison linéaire des autres, alors |A| = 0.
9. Si on ajoute à la première ligne de A une combinaison linéaire des autres, le
10. Si on soustrait de la dernière ligne de A la somme de toutes les lignes, le
Vrai-Faux 5. Soient r et n deux entiers tels que 1 6 r < n. Soit A une matrice carrée
de taille n × n. Parmi les affirmations suivantes lesquelles sont vraies, lesquelles sont
1. A est inversible si et seulement si son déterminant est non nul.
2. A est de rang r si et seulement si au moins un des mineurs d’ordre r est non
nul.
3. Si A est de rang r alors tous les mineurs d’ordre r sont non nuls.
4. Si A est de rang r alors tous les mineurs d’ordre r + 1 sont nuls.
5. Si tous les mineurs d’ordre r sont nuls, alors A est de rang strictement inférieur
à r.
6. S’il existe un mineur d’ordre r non nul, alors A est de rang r
7. S’il existe un mineur d’ordre r non nul, alors A est de rang au moins r
26
2.2 Exercices
Exercice 1. Pour n = 3, puis n = 4 :
1. Écrire toutes les permutations de Sn
2. Écrire la décomposition en orbites de chaque permutation
3. En déduire une décomposition en produit de cycles, puis en produit de permu-
tations.
4. Calculer la signature.
Exercice 2. On considère les éléments suivants de S10 .

! !
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
; ;
6 7 8 10 3 9 1 2 5 4 5 10 2 6 9 4 7 1 8 3
! !
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
; ;
7 2 8 1 4 10 5 9 6 3 7 8 6 10 2 4 1 5 9 3
! !
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
; ;
8 2 7 4 3 9 5 10 1 6 5 10 6 2 3 1 7 4 9 8
! !
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
; ;
4 3 7 5 2 8 1 6 10 9 7 3 1 8 5 6 2 9 4 10
! !
1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10
; .
2 8 7 1 6 10 4 5 9 3 5 7 6 1 10 9 8 2 4 3
Pour chacune de ces permutations :
1. Écrire sa décomposition en orbites.
2. En déduire sa signature.
3. Calculer la composée de τ1,2 ◦ s. Écrire sa décomposition en orbites et vérifier
que ε(τ1,2 ◦ s) = −ε(s).
4. Calculer la composée de s ◦ τ1,2 . Écrire sa décomposition en orbites et vérifier
que ε(s ◦ τ1,2 ) = −ε(s).
n(n−1)
Exercice 3. Soit s ∈ Sn une permutation. On considère l’ensemble P des 2
paires
d’éléments de {1, . . . , n}. On définit la quantité :
Y s(i) − s(j)
π(s) = .
{i,j}∈P
i−j
1. Montrer que π(s) = ±1.

2. Soient s, s0 ∈ Sn deux permutations. Montrer que π(s ◦ s0 ) = π(s)π(s0 ).
27
3. Soit {i, j} ∈ P une paire d’éléments de {1, . . . , n}. On dit que la paire {i, j} est
en inversion pour la permutation s si i < j et s(i) > s(j). Montrer que π(s) est
égal à +1 si le nombre de paires en inversion est pair, −1 s’il est impair.
4. Montrer que si s est une transposition, alors π(s) = −1.
5. Déduire de ce qui précède que l’application s 7−→ π(s) coïncide avec la signature.
Exercice 4. Soit s ∈ Sn une permutation. Soit B = (v1 , . . . , vn ) une base de Rn . On

définit l’endomorphisme fs de Rn , par :
∀i = 1, . . . , n , fs (vj ) = vs(i) .
Montrer que le déterminant de fs est égal à la signature de s.
Exercice 5. Calculer chacun des déterminants suivants :

1. par la règle de Sarrus,
2. en développant selon la première colonne,
3. en développant selon la seconde ligne,
4. par la méthode du pivot de Gauss.
5. Quelle méthode est la plus rapide ?

0
0 1 2 2 −1 −2 0 1

0 2 −1
−1 0 0 ; 1 −1 −1 ; 0 −1 −1 ; 0 0 2

0 −1 2 −1 −1 0 −1 −2 −2 1 −1

2

−1 −1 0

−1 −2 −1 0 −2 2

1 −2 −1

−1 0 0
;

1 1 2 ; −1 −1 0
;

1 0 0
1 −1 −2 1 −1 −1 −1

0 2 2 2 0
Exercice 6. Calculer chacun des déterminants suivants :
1. en développant selon la première colonne,
2. en développant selon la seconde ligne,
3. par la méthode du pivot de Gauss.
4. Quelle méthode est la plus rapide ?
−1 1 −2 −1 2 2 −2 −1 2 0 −1

2
−2 0 0 0 1 −2 0 0 2 −1 1 −1
; ;

1 −1 1 2 −2 2 1 −1 2 1 0 −2

−1 1 2 0 −1 −1 1 0 −1 1 −2 2
−2 −1 2 −2 −1 −2 −2 −1

0 1

0 2
2 0 −1 −1 2 2 −1 2 −1 1 −1 0
; ;

1 1 0 −1 1 2 1 0 2 2 2 −1

2 1 0 −1 0 1 −1 −1 −1 2 2 −2
28
Exercice 7. Factoriser les déterminants suivants.

1 a a2 1 cos(α) cos(2α) a b b a b c

1 b b2 ; 1 cos(β) cos(2β) ; b a b ; b c a .
1 c c2 1 cos(γ) cos(2γ) b b a c a b

Exercice 8. Factoriser les déterminants suivants.

1 0 1 0

0 1 1 1

a a a a

0 a b 1 1 0 a b a b b b
; ; ;

1 b a 0 1 a 0 c a b c c

0 1 0 1 1 b c 0 a b c d

1 a b ab

a b b b

1 1 1 1

1 c b cb a a b b 1 1 a b

;
;
.
1 a d ad a a a b 1 a 1 c

1 c d cd a a a a 1 b c 0
Exercice 9. Soit n > 2 un entier, et A une matrice carrée de taille n × n dont tous
les coefficients valent ±1. Montrer que le déterminant de A est un entier divisible par
2n−1 . Indication : faire apparaître des zéros dans la première colonne.
Exercice 10. Soit n > 2 un entier et a un réel. Pour chacun des déterminants d’ordre
n suivants :
1. Calculer D2 , D3 .
2. Établir une formule de récurrence reliant Dn et Dn−1
3. En déduire l’expression de Dn en fonction de n et a.

1 a a2 . . . an−2 an−1

... ...
a 1 a an−2

.. .. .. .. .. ..
. . . . . .

Dn =
.. .. ..

a2

. . . 1 a

...

an−2 ... a 1 a

an−1 an−2 . . . . . . a 1

1 1 ... ... 1 1

−1 a 0 ... ... 0

.. ..

−1 a .

0 .
Dn = .. .

.. .. .. .. .

. . . . . .

.. .. ..

. . . a 0

0 . . . . . . 0 −1 a

29

0 . . . . . . 0 an

a

. . .. n−1
1 .. .. . a

.. . . .. ..

0 . . . .

Dn = . .
. .

.. . .
.. 0 ..

.. ... ...

.
a a2

0 ... ... 0 1 a

Exercice 11.
1. Soient a, b, c, d quatre fonctions dérivables de R dans R. On pose :

a(x) b(x)

f (x) = .

c(x) d(x)

Montrer que f est dérivable et que

0 a0 (x) b(x) a(x) b0 (x)

f (x) = 0 +

.
c (x) d(x) c(x) d0 (x)

2. Soit n > 2 un entier. Soient a1 (x), . . . an (x) n fonctions de R dans Rn , dont

chaque coordonnée est une fonction dérivable de R dans R. Soit f la fonction
qui à x associe det(a1 (x), . . . , an (x). Montrer que f est dérivable et que
n
f 0 (x) = det(a1 , . . . , ai−1 , a0i (x), ai+1 (x), . . . , an (x)) .
X
i=1
3. Soient x, α, β trois réels. On considère le déterminant suivant.

1 cos(x) sin(x)

1 cos(x + α) sin(x + α)
.

1 cos(x + β) sin(x + β)
Montrer que c’est une fonction constante de x et calculer cette constante.
Exercice 12. Soit n > 2 un entier. Soient A, B, C, D quatre matrices de taille n × n.

On note ∆ le déterminant d’ordre 2n suivant :

A B

∆=
.
C D

1. Montrer que
D C
∆= .

B A

30
2. Dans le cas particulier où A est la matrice nulle. Montrer que

0 B

∆= = (−1)n det(B)det(C) .

C D

3. Dans le cas particulier C = B et D = A. Montrer que

A B A + B B A + B
B
∆= = = = det(A + B)det(A − B) .

B A A+B A 0 A−B

4. On suppose que C et D commutent (CD = DC) et que D est inversible. Mon-

trer que ∆! = det(AD − BC). Indication : multiplier à droite par la matrice
D 0
.
−C I
5. On suppose toujours que C et D commutent, mais on ne suppose plus que
D est inversible. Pour tout x réel, on note Dx la matrice xI + D, et ∆x le
déterminant obtenu en remplaçant D par Dx dans ∆. Montrer que pour tout
x ∈ R, ∆x = det(ADx − BC). En déduire que ∆ = det(AD − BC).
6. Montrer que si A et C commutent, alors ∆ = det(AD − CB).
7. Montrer que si B et D commutent, alors ∆ = det(DA − BC).
8. Montrer que si A et B commutent, alors ∆ = det(DA − CB).
!
A A
9. À quelle condition la matrice est-elle inversible ? Si c’est le cas, quel
−A A
est son inverse ? !
I B
10. À quelle condition la matrice est-elle inversible ? Si c’est le cas, quel
B I
est son inverse ?
Exercice 13. Soit n > 1 un entier. Soient A et B deux matrices de taille n × n, à
coefficients réels.
1. Montrer que det(A+iB) et det(A−iB) sont deux nombres complexes conjugués.
2. On suppose que A et B commutent (AB = BA). Montrer que det(A2 + B 2 ) > 0.
3. Vérifier que les deux matrices suivantes A et B suivantes ne commutent pas et
calculer det(A2 + B 2 ).
! !
1 1 0 1
A= ; B= .
1 1 −1 0
Exercice 14. Soit n un entier > 2. Soit A ∈ Mn×n (R) une matrice triangulaire. Montrer
que la comatrice Ae est aussi triangulaire.
Exercice 15. Soit n un entier > 2. Soit A ∈ Mn×n (R). On note Ae la comatrice de A.
31
1. On suppose que A est inversible. Quel est le déterminant de Ae ? Montrer que la

comatrice de Ae est (det(A))n−2 A.
2. On suppose que le rang de A est inférieur ou égal à n − 2. Montrer que Ae est la
matrice nulle.
3. On suppose que le rang de A est égal à n − 1. Montrer que le rang de Ae est 1.
Exercice 16. Soient a, b, c, d quatre vecteurs de R3 . Montrer que :
det(d, b, c) a + det(a, d, c) b + det(a, b, d) c = det(a, b, c) d .
Indication : considérer le système ax + by + cz = d.
Exercice 17. Déterminer le rang des matrices suivantes,

1. par la méthode des mineurs,
2. par l’algorithme du pivot de Gauss.
0 1 0 1 0 −1 0 1 2 1 0 −1
     
 −1 0 1 0   0  0 0 0   1 1 1 −1 
 ;  ; 
   
 0 1 0 1   0 1 0 −1 0 −1 2 1 
  
 
−1 0 1 0 0 0 0 0 −1 −1 −1 1
−1 −2 0 −2 0 1 1 −1 0 1 0 0
     
 2 4 1 4   2
  4 2 4   −1
  0 1 0 
 ;   ; 
 
2 3 1 3   1 2 1 2   0 0 0 2
 
 
−2 −3 −1 −3 −1 −2 −1 −2 −1 0 1 0
Exercice 18. Déterminer en fonction du paramètre a le rang des matrices suivantes,
1. par la méthode des mineurs,
2. par l’algorithme du pivot de Gauss.
2 a a a 1 0 1 0 a+1 1 a+1 1
     
 a 2 a a   0 2 a 1   1 a + 1 a+1 a 
 ;   ;  .
     
 a a 2 a   1 a 2 0   a 2a 1 1
 

a a a 2 0 1 0 1 a+1 a a 1
2.3 QCM
rapporte 2 points.
Question 1. La signature de la permutation proposée est +1.
32
!
1 2 3 4 5 6
A
1 3 2 4 6 5
!
1 2 3 4 5 6
B
3 2 6 1 5 4
!
1 2 3 4 5 6
C
4 5 3 6 2 1
!
1 2 3 4 5 6
D
3 5 2 4 6 1
!
1 2 3 4 5 6
E
3 5 6 2 1 4
Question 2. Soient v1 , v2 , v3 , v4 4 vecteurs quelconques de R4 . On note det le détermi-
nant dans la base canonique de R4 .
A det(2v1 + 3v2 , v2 , v3 , v4 ) = 6 det(v1 , v2 , v3 , v4 )
B Si v1 + v2 = v3 + v4 alors det(v1 , v2 , v3 , v4 ) = 0
C det(2v1 + 3v2 , v2 , v3 , 2v4 − 3v3 ) = 4 det(v1 , v2 , v3 , v4 )
D det(v1 + v2 , v2 + v3 , v3 + v4 , v4 + v1 ) = 4 det(v1 , v2 , v3 , v4 )
E det(v1 + v2 , v2 − v1 , v3 + v4 , v3 − v4 ) = 2 det(v1 , v2 , v3 , v4 )
Question 3. Soit n un entier supérieur ou égal à 2. On considère un n-uplet de vecteurs
de Rn .
A Si on remplace le premier vecteur par la somme de tous les autres, le détermi-
nant est inchangé.
B Si on soustrait au dernier vecteur la somme de tous les autres, le déterminant
est inchangé.
C Si on multiplie par 3 chacun des vecteurs, le déterminant est multiplié par 3.
D Si on ajoute au dernier vecteur la somme de tous les vecteurs, le déterminant
est inchangé.
E Si on soustrait au premier vecteur la somme de tous les vecteurs, le déterminant
s’annule.
Question 4. Soit A une matrice carrée de taille n × n (n > 2).
A |tA| = (−1)n |A|
B Si A est triangulaire par blocs, son déterminant est le produit des coefficients
diagonaux.
C Si on ajoute à la première ligne de A la somme de toutes les autres, le déter-
minant est inchangé.
D Si une des lignes de A est combinaison linéaire des autres, alors |A| = 0.
E Si on ajoute à la première ligne le double de la seconde, le déterminant est
doublé.
Question 5. Soient r et n deux entiers tels que 1 6 r < n. Soit A une matrice carrée
de taille n × n.
33
A A est de rang n si et seulement si son déterminant est non nul.

B A est de rang r si et seulement si tous les mineurs d’ordre r sont non nuls.
C Si A est de rang strictement supérieur à r alors tous les mineurs d’ordre r sont
non nuls.
D Si au moins un des mineurs d’ordre r est non nul, alors A est de rang au moins
égal à r.
E Si tous les mineurs d’ordre r sont nuls, alors A est de rang r − 1.

1 2 1
Question 6. On considère le déterminant D = 0 3 2

1 2 0
3 2 2 1
A En développant selon la première colonne, D = −

2 0 3 2

2 1 1 1
B En développant selon la dernière ligne, D = −

3 2 0 2

C En remplaçant

la troisième ligne par la première moins la troisième :
1 2 1

D = 0 3 2

0 0 1

2 1 1

D En permutant les colonnes : D = − 3 2 0

2 0 1
E Par la règle de Sarrus : D = 0 + 0 + 4 − 3 − 4 + 0
Question 7. On considère le système linéaire


 x+ 2y+ z = 2
3y+ 2z = 3


x+ 2y = 1
On note D le déterminant
du système.
2 2 1
1
A x = 3 3 2
D
1 2 0

2 1 1
1
B y=− 3 0 2

D
1 1 0

1 2 2
1
C z = − 0 3 3

D
1 2 1

2 2 1
1
D x = 0 0 1
D
0 1 0
34

1 2 1

1
E y= 0 3 2

D

0 1 1
Question 8. Soit A = (ai,j )i,j=1,...,n une matrice de taille n × n (n > 2). Pour i, j ∈
{1, . . . , n}, on note Ai,j le cofacteur d’indices i et j.
n
X
A Si i 6= j alors ai,k Ak,j = 0
k=1
n
X
B Ai,k ak,i = |A|
k=1
n
X
C Si i 6= j alors Ai,k aj,k = 0
k=1
n
X
D ai,k Ai,k = |A|
k=1
n
X
E Si i 6= j alors ak,i Ai,k = 0
k=1

a b b

Question 9. Soit a et b deux réels. On considère le déterminant D = b a b .

b b a

A D est un polynôme de degré 3 en b
B D est nul si et seulement si a = b
C Si a = 2b, alors D = 0
D D = (a + 2b)(a − b)
E D est multiple de (a − b)2 .

1 1 1

Question 10. Soient a, b, c trois réels. On considère le déterminant D = a b c .

a2 b 2 c 2

A D est un polynôme de degré 2 en a
B Si a = −b alors D = 0
C Si a = 1 alors D = 0
D a2 − b2 divise D
E D = (a − b)(b − c)(c − a)
Réponses : 1–AD 2–BC 3–BE 4–CD 5–AD 6–BE 7–AB 2–AE 9–CD 10–AE
2.4 Devoir
35
répondu.
Questions de cours : Soit n un entier et A = (ai,j )i,j=1,...,n une matrice de taille n×n.
1. Donner l’expression du déterminant de A en fonction de ses coefficients.
2. Démontrer que le déterminant de la transposée de A est égal au déterminant de
A.
3. Donner la définition des cofacteurs de A.
4. Soit r un entier tel que 1 6 r < n. Démontrer que si le rang de A est strictement
inférieur à r alors tous les mineurs d’ordre r de A sont nuls.
5. Démontrer que si le rang de A est supérieur ou égal à r alors il existe un mineur
d’ordre r non nul.
Exercice 1 : Soit n > 2 un entier. Soient a, b, x1 , . . . , xn des réels. On note A la matrice
de taille n × n dont la diagonale est (x1 , . . . , xn ), les termes au-dessus sont tous égaux
à a, les termes au-dessous tous égaux à b.
 
x1 a ... ... a
. ..
x2 . .
 

 b . 

A=
 .. .. .. .. .. 
.

 . . . . . 

 .. ... ... 
. a
 
 
b . . . . . . b xn
1. Dans le cas particulier où a = b et tous les xi sont égaux à x, montrer que

det(A) = (x + (n − 1)a)(x − a)n−1 .
2. On note J la matrice de taille n × n dont tous les coefficients valent 1. Dans le
cas général, montrer que le polynôme det(A + XJ) est de degré 1 en X.
3. Calculer det(A − aJ) et det(A − bJ).
4. On suppose a 6= b. Montrer que
bP (a) − aP (b)
det(A) = ,
b−a
où P désigne le polynôme P (X) = (x1 − X) . . . (xn − X).
5. En déduire que pour a = b, det(A) = P (a) − aP 0 (a).
Exercice 2 : Soit n > 1 un entier. Soient (a1 , . . . , an ) et (b1 , . . . , bn ) deux éléments de
Cn tels que
∀i, j = 1, . . . , n , ai + bj 6= 0 .
36
On appelle matrice de Cauchy et on note An la matrice de taille n×n dont le coefficient

1
d’indices (i, j) est ai +b j
. On note Dn son déterminant.
1 1 1

a1 +b1 a1 +b2
... ... a1 +bn

1 1 1
... ...

a2 +b1 a2 +b2 a2 +bn

.. .. ..
Dn =
. . .

1 1 1

an−1 +b1 an−1 +b2
... ... an−1 +bn

1 1 1
... ...

an +b1 an +b2 an +bn
1. Montrer que si
∃i 6= j , ai = aj ou bi = bj ,
alors Dn = 0.
2. Montrer que

a1 +b1 a1 +b2
... ... a1 +bn


a2 +b1 a2 +b2
... ... a2 +bn

1

Dn =
.. .. ..

(an + b1 ) · · · (an + bn ) . . .


an−1 +b1 an−1 +b2
... ... an−1 +bn

1 1 ... ... 1
3. Montrer que
an −a1 an −a1 an −a1

a1 +b1 a1 +b2
... ... a1 +bn

an −a2 an −a2 an −a2

a2 +b1 a2 +b2
... ... a2 +bn

1

Dn =
.. .. ..

(an + b1 ) · · · (an + bn ) . . .

a −a an −an−1 an −an−1

n n−1 ... ...
an−1 +b1 an−1 +b2 an−1 +bn

1 1 ... ... 1
4. Montrer que

1 1 1

a1 +b1 a1 +b2
... ... a1 +bn

1 1 1

a2 +b1 a2 +b2
... ... a2 +bn

(an − a1 ) · · · (an − an−1 )

Dn = .. .. ..
(an + b1 ) · · · (an + bn ) . . .

1 1 1

an−1 +b1 an−1 +b2
... ... an−1 +bn

1 1 ... ... 1

37
5. Montrer que
(an − a1 ) · · · (an − an−1 )
Dn = ×
(an + b1 ) · · · (an + bn )
bn −b1 bn −b2 bn −bn−1 1

(a1 +b1 )(a1 +bn ) (a1 +b2 )(a1 +bn )
... (a1 +bn−1 )(a1 +bn ) a1 +bn

bn −b1 bn −b2 bn −bn−1 1

(a2 +b1 )(a2 +bn ) (a2 +b2 )(a2 +bn )
... (a2 +bn−1 )(a2 +bn ) a2 +bn

.. .. ..

. . .

bn −bn−1

b −b1 bn −b2 1
(an−1 +bn1 )(an−1

+bn ) (an−1 +b2 )(an−1 +bn )
... (an−1 +bn−1 )(an−1 +bn ) an−1 +bn

0 0 ... 0 1
6. Montrer que
(an − a1 ) · · · (an − an−1 )(bn − b1 ) · · · (bn − bn−1 )

Dn = Dn−1 .
(an + b1 ) · · · (an + bn )(a1 + bn ) · · · (an−1 + bn )
7. En déduire que Y
(ai − aj )(bj − bi )
16i<j6n
Dn = Y .
(ai + bj )
16i,j6n
8. On note Ci,j le cofacteur d’indices (i, j) de la matrice An . On suppose que

Dn 6= 0. Montrer que
Y Y
(ai + bj ) (ai + bk ) (ah + bj )
Ci,j k6=i h6=j
= Y Y .
Dn (ai − ak ) (bj − bh )
k6=i h6=j
9. La matrice de Hilbert est le cas particulier de matrice Cauchy obtenu pour ai = i

et bj = j−1. Pour n = 4, écrire la matrice de Hilbert et calculer son déterminant.
10. Calculer l’inverse de la matrice de Hilbert pour n = 4.

1. L’expression du déterminant de A en fonction de ses coefficients est
X n
Y
|A| = ε(s) as(j),j ,
s∈Sn j=1
où ε(s) désigne la signature de la permutation s.
38
2. Reprenons la formule de la question précédente.

X n
Y
|A| = ε(s) as(j),j .
s∈Sn j=1
Nous pouvons réindicer le produit correspondant à la permutation s :

n
Y n
Y
as(j),j = ai,s−1 (i) .
j=1 i=1
De plus la signature d’une permutation est égale à celle de son inverse (car ε est
un homomorphisme de groupe).
n
−1
X Y
|A| = ε(s ) ai,s−1 (i) .
s∈Sn i=1
Réindiçons alors la somme :

n
ai,s(i) = |tA| .
X Y
|A| = ε(s)
s∈Sn i=1
3. Soient i et j deux entiers compris entre 1 et n. On appelle cofacteur d’indices i

et j et on note Ai,j le produit par (−1)i+j du mineur d’ordre n − 1 obtenu en
supprimant la i-ième ligne et la j-ième colonne de A.
Ai,j = (−1)i+j |(ah,k )h6=i,k6=j | .
4. Considérons une famille de r vecteurs colonnes de A, et supposons qu’elle soit

liée. Au moins un des vecteurs est combinaison linéaire des autres : sans perte de
généralité, nous pouvons supposer que c’est le dernier. Considérons un mineur
d’ordre r extrait de A, en choisissant les r colonnes de la famille considérée, et r
lignes quelconques. Dans ce mineur, la dernière colonne est combinaison linéaire
des autres et donc le mineur est nul. Ce qui précède vaut pour toute famille de
r vecteurs colonnes, donc tous les mineurs d’ordre r sont nuls.
5. Si le rang de A est supérieur ou égal à r alors il existe une famille libre de r
vecteurs colonnes. Choisissons r vecteurs colonnes formant une famille libre, et
considérons la matrice n × r de ces r vecteurs colonnes, qui est donc de rang r.
Les vecteurs lignes forment une matrice de n vecteurs de Rr . Or une matrice et
sa transposée ont même rang. La famille des n vecteurs lignes est encore de rang
r. On peut donc en extraire une famille libre de r vecteurs. Les coordonnées de
ces r vecteurs forment une matrice r × r de rang r, extraite de la matrice A.
Son déterminant est un mineur de taille r et il est non nul.
Exercice 1 :
39
1. Nous devons calculer le déterminant

x a ... ... a
..

..
a
x . .

D = ... .. .. .. ..

. . . .
.
..
... ...
. a

a ... ... a x
La somme des éléments de chaque ligne est égale à x + (n − 1)a. Ajoutons les
colonnes d’indices 2 à n à la première, et mettons x + (n − 1)a en facteur.

1 a . . . . . . a
..

.
1 x ..

.
D=

(x + (n − 1)a) .. . . . . .. .
. a . . .
.. .. . . . .

. . . . a

1 a ... a x
Soustrayons alors la première ligne de chacune des autres.
1 a ... ... a

0 x−a 0 ... 0

.. .. .. .. ..
D= (x + (n − 1)a)

. . . . .
.

.. .. ..

. . . 0

0 ... ... 0 x−a
Le déterminant d’une matrice triangulaire est égal au produit des coefficients

diagonaux, donc D = (x + (n − 1)a)(x − a)n−1 .
2. On ne change pas la valeur de det(A + XJ) si on soustrait la première ligne à
chacune des autres. Si on fait cela, le terme en X disparaît des lignes d’indices
2 à n, et la première ligne reste (x1 + X, a + X, . . . , a + X). En développant
suivant la première ligne :
n
X
det(A + XJ) = (x1 + X)B1,1 + (a + X) B1,j ,
j=2
où les Bi,j sont des cofacteurs extraits des lignes 2 à n, qui ne contiennent donc
pas X. D’où le résultat.
3. Les matrices A − aJ et A − bJ sont diagonales. Leur déterminant est le produit
des coefficients diagonaux.
n
Y n
Y
det(A − aJ) = (xi − a) et det(A − bJ) = (xi − b) .
i=1 i=1
40
4. D’après la question 2, det(A − XJ) est un polynôme de degré 1 en X, disons

αX + β, où α et β sont deux réels. Par la question précédente, nous connaissons
sa valeur en −a et −b :
n
Y n
Y
−α a + β = (xi − a) et − α b + β = (xi − b)
i=1 i=1
Le déterminant de A est la valeur de ce polynôme en X = 0, à savoir β. En

éliminant α entre les deux équations on obtient : β(b − a) = bP (a) − aP (b), où
P désigne le polynôme P (X) = (x1 − X) . . . (xn − X). Si a 6= b,
bP (a) − aP (b)
β = det(A) = ,
b−a
5. Pour a, x1 , . . . , xn fixés, la fonction qui à b associe det(A) est une fonction poly-
nomiale, donc continue. Sa valeur en b = a est la limite de l’expression trouvée
à question précédente lorsque b tend vers a.
bP (a) − aP (b) (b − a)P (a) − a(P (b) − P (a))
lim = lim = P (a) − aP 0 (a) .
b→a b−a b→a b−a
Exercice 2 :
1. Si ai = aj , les deux lignes d’indices i et j sont identiques, donc le déterminant
est nul. De même, si bi = bj , les deux colonnes d’indices i et j sont identiques
et le déterminant est nul.
2. Si on multiplie la j-ième colonne du déterminant par an + bj , le déterminant est
multiplié par an + bj , ce qui donne le résultat annoncé.
3. Le coefficient d’indices (i, j) trouvé à la question précédente est :
an + b j an − ai + ai + bj an − ai
= = +1.
ai + b j ai + b j ai + b j
On vérifie donc le résultat annoncé en soustrayant la dernière ligne aux précé-
dentes.
4. Dans le déterminant de la question précédente, on peut mettre en facteur (an −
ai ) dans tous les termes de la i-ième ligne, ce qui conduit au résultat demandé.
5. Dans le déterminant de la question précédente, soustrayons la dernière colonne
à chacune des précédentes. Pour i, j = 1, . . . , n − 1, le terme d’indices (i, j)
devient :
1 1 ai + b n − ai − b j bn − bj
− = = ,
ai + b j ai + b n (ai + bj )(ai + bn ) (ai + bj )(ai + bn )
41
6. Dans le déterminant de la question précédente, le terme (bn − bj ) est en facteur

1
dans tous les coefficients de la j-ième colonne, et le terme ai +b n
est en facteur
dans tous les termes de la i-ième ligne. Donc :
(an − a1 ) · · · (an − an−1 )(bn − b1 ) · · · (bn − bn−1 )

Dn = ×
(an + b1 ) · · · (an + bn )(a1 + bn ) · · · (an−1 + bn )

1 1 1

a1 +b1 a1 +b2
... ... a1 +bn

1 1 1

a2 +b1 a2 +b2
... ... a2 +bn

.. .. ..

. . .

1 1 1

an−1 +b1 an−1 +b2
... ... an−1 +bn

0 0 ... 0 1

Or si on développe ce dernier déterminant selon la dernière ligne, on trouve le

déterminant de Cauchy d’ordre n − 1, correspondant aux vecteurs (a1 , . . . , an−1 )
et (b1 , . . . , bn−1 ), noté Dn−1 .
1
7. Pour n = 1, D1 = a1 +b 1
. Supposons la formule vraie pour Dn−1 . D’après la
question précédente,
Y Y
(an − ai )(bn − bi ) (ai − aj )(bj − bi )
16i<n 16i<j6n−1
Dn = Y × Y ,
(an + bi )(ai + bn ) (ai + bj )
16i6n 16i,j6n−1
soit Y
(ai − aj )(bj − bi )
16i<j6n
Dn = Y .
(ai + bj )
16i,j6n
8. Le cofacteur d’indices (i, j) de la matrice An est le déterminant de la matrice

obtenue en supprimant la ligne i et la colonne j. Ce faisant, on obtient la matrice
de Cauchy de taille n − 1 × n − 1, associée aux vecteurs
(a1 , . . . , ai−1 , ai+1 . . . , an ) et (b1 , . . . , bj−1 , bj+1 . . . , an ) .
Le cofacteur est donné par la formule de la question précédente, dont on sup-

prime tous les facteurs contenant ai et tous les facteurs contenant bj , et que l’on
pultiplie par (−1)i+j . Le rapport CDi,jn ne conserve donc que les facteurs contenant
ai et bj . Les termes en ai − ak sont affectés du signe + si k < i, − si k > i, idem
pour les termes en bj − bh . D’où le résultat.
42
9. Pour n = 4, la matrice de Hilbert est :

 1 1 1 
1 2 3 4
 
 1 1 1 1 
2 3 4 5
 
H4 = 


 .
 1 1 1 1 

 3 4 5 6 

1 1 1 1
4 5 6 7
D’après la question 7, son déterminant est

3·2·1·2·1·1 1
= .
4·5·6·7·3·4·5·6·2·3·4·5·1·2·3·4 6048000
10. En utilisant le résultat de la question 8, on obtient :
16 −120 240 −140

 
 −120 1200 −2700 1680 
H4−1 =  .
 
240 −2700 6480 −4200

 
−140 1680 −4200 2800
43
3 Compléments
3.1 Les tâtonnements de Leibniz
S’il y a bien un fil directeur dans l’œuvre foisonnante de Leibniz (1646–1716), c’est
son souci constant d’améliorer l’« art d’inventer ». Pour lui, il convient avant tout de
désencombrer l’esprit du savant de tout ce qui peut être automatisé. D’où en particulier
les recherches que Leibniz mènera toute sa vie sur les calculateurs mécaniques. En
outre, Leibniz était parfaitement conscient de l’importance d’un choix judicieux de
notations, permettant d’automatiser les calculs avec des symboles. Il appelle cela l’« art
caractéristique », (du choix des caractères), lui-même soumis à l’art combinatoire (de
combiner ces caractères) 1 . Ce thème était déjà présent dès sa thèse, écrite en 1666
à l’âge de 20 ans : il y inventait un « alphabet de la pensée humaine ». Ce souci
d’automatiser les procédures par un choix de notations judicieux l’a conduit pour le
calcul différentiel, à définir celles que vous utilisez encore. Le même souci préside encore
à ses travaux sur la résolution de systèmes linéaires, et la détermination de solutions
communes aux équations algébriques. C’est ainsi qu’il est amené au fil des années à
développer les déterminants. Il n’est pas l’auteur de la théorie complète, mais plutôt
d’un ensemble de règles empiriques non démontrées, qui préfigurent néanmoins les
propriétés que vous avez apprises dans ce chapitre. D’ailleurs il n’existe pas de traité
publié par Leibniz sur les déterminants. Seulement un corpus de manuscrits et de lettres
en latin, adressées à quelques uns de ses 1100 correspondants recensés. Pourquoi un
tel intérêt pour les systèmes linéaires ? Leibniz pensait que n’importe quelle résolution
d’équation (algébrique, différentielle ou autre) pouvait se ramener à la résolution d’un
système linéaire. Au vu des méthodes numériques développées depuis deux siècles,
c’était singulièrement prémonitoire !
Dans le cadre de son « art caractéristique », Leibniz inventa plus cinquante manières
d’utiliser des nombres fictifs ; deux seulement furent publiées. Voici une de ses façons
d’écrire une équation linéaire quelconque :
10 + 11x + 12y = 0 .
Comprenez : a1,0 +a1,1 x+a1,2 y = 0, ou bien ax+by = c : que préférez-vous ? Paradoxa-

lement, ces multiples choix de notations pour les systèmes linéaires, le fait de ne pas
distinguer premier et second membre, semblent l’avoir handicapé plutôt qu’aidé dans
ses lents tâtonnements vers la définition du déterminant. Ayant perçu assez tôt que les
quantités qui apparaissaient dans les solutions de systèmes linéaires étaient des sommes
de produits de coefficients, il a mis très longtemps à dégager la règle de l’alternance de
signe. Il entrevoit cette règle dès 1678.
Ainsi nous avons une règle de laquelle la valeur d’une inconnue linéaire peut
être écrite sans aucun calcul.
1. M. Eberhard Knobloch : Déterminants et élimination chez Leibniz, Revue d’Histoire des
Sciences, 54(2), pp. 143–164 (2001)
44
C’était trop optimiste. Son heuristique ne se généralise pas encore. Prudent, il écrit :
Ce théorème méritait d’être démontré exactement, ce qui se ferait par cette
subtile analyse-là qui prescrit les lois au calcul même sans calcul.
Voici la règle des signes en 1683.
Soit un terme quelconque positif ou négatif : les termes qui se distinguent
de ce terme par un nombre pair de coefficients sont affectés du signe opposé.
Ceux qui se distinguent par un nombre impair de coefficients sont affectés
du même signe.
Encore une autre, la même année :
Les membres qui n’ont qu’un seul coefficient commun ou un nombre impair
de tels coefficients ont des signes opposés. Ceux qui ont deux ou un nombre
pair de coefficients communs ont le même signe.
Ce n’est toujours pas ça : Leibniz essaie de deviner le résultat en décortiquant les
systèmes 2 × 2 et 3 × 3 qu’il résoud, mais la généralisation n’est pas évidente. Petit à
petit, il parvient à dégager la notion de permutation des indices.
Les permutations des indices droits ont le même signe si elles résultent
l’une de l’autre par un changement cyclique. Les autres permutations ont
un signe opposé.
Enfin en 1684, il tient son succès.
Dans cette tentative, j’ai résolu le problème tandis qu’auparavant j’avais
toujours essuyé un échec. Voici un exemple insigne de l’art combinatoire.
La règle qu’il énonce alors est bien la bonne :
Deux termes qui se distinguent l’un de l’autre seulement par un nombre
impair de transpositions des indices gauches ou droits ont des signes oppo-
sés. Ceux qui se distinguent l’un de l’autre par un nombre pair ont le même
signe.
S’il a fallu autant de temps à Leibniz pour comprendre comment développer un déter-
minant, peut-être n’est-ce pas si évident ?
3.2 L’école japonaise

Les Neuf Chapitres de l’art du Calcul ont joué pour les mathématiques en extrême-
orient, le rôle des éléments d’Euclide pour les mathématiques occidentales. Ce livre de
problèmes écrit en Chine dans les premiers siècles de notre ère, contient en particulier
des problèmes d’équations et la résolution des systèmes linéaires. Ainsi, des siècles
plus tard, les systèmes d’équations étaient toujours pour les mathématiciens japonais
une source d’inspiration. Il n’est donc pas surprenant qu’eux-aussi aient, comme les
mathématiciens européens, dégagé la notion de déterminant des méthodes de résolution
d’équations. Plus surprenant est le fait que les deux découvertes ont été quasiment
45
simultanées. Le premier déterminant a été écrit au Japon par Seki Takakazu (ou Seki
Kowa) (1642–1708) 2 3 . L’ouvrage dans lequel la notion apparaît est daté de 1683, mais il
est probable que son auteur travaillait sur les problèmes d’élimination depuis plusieurs
années. Ce que d’autres ne manquaient pas de lui reprocher.
Il existe aujourd’hui dans notre pays, des mathématiciens qui connaissent
« l’égalisation » mais qui, par goût du secret ou par réelle ignorance, nul ne
sait, ne la révèlent pas. Si bien que nous ne la trouvons dans aucun livre.
Celle-ci va être divulguée par l’école de Nakanishi pour apaiser les esprits.
Désormais les trésors de la résolution des problèmes de mathématiques se
trouveront réunis dans le seul Recueil d’égalisations.
Un des élèves de Takakazu se charge de riposter.
Ces temps derniers, des mathématiciens de la capitale et de la province se
sont mis, soit par ignorance de la subtilité des procédures de Seki, soit parce
qu’ils suspectent ce dernier de camoufler son ignorance des procédures, à le
mettre à l’essai en lui soumettant des problèmes de même nature [que ceux
de Sawagushi] ou à l’accuser de s’être trompé dans les procédures, dévoilant
ainsi leur propre incompétence.
Mais la meilleure manière de répondre est encore de publier.
Déplorant que, parmi le très grand nombre d’ouvrages chinois et japonais
consacrés aux mathématiques, il n’y en ait aucun qui ait pénétré le sens
profond du shakusa, les trois samourai [Seki et les deux frères Takebe]
tinrent conseil, puis, à partir de l’été de la troisième année de Tenna [1683],
se mirent à rédiger sous la conduite de Katahiro l’essentiel des nouveaux
résultats que chacun avait obtenus, firent le point sur les méthodes léguées,
anciennes et récentes ; le tout fut rassemblé au milieu des années Genroku
[1688-1703]. Il y avait au total douze livres, auxquels le nom de Sanpô taisei
[traité accompli de mathématiques] fut donné et que [Katahiro] commença
à mettre au propre.
Seki Takakazu a été la figure de proue des mathématiques japonaises de l’époque Edo,
et ses connaissances attiraient de nombreux disciples.
Jeune homme (à l’âge de seize ans), il [Kataaki] se tourna avec son frère
cadet Katahiro vers les mathématiques. Ils avaient abordé cet art avec une
grande détermination et s’étaient plongés dans les ouvrages chinois et japo-
nais ; et, bien qu’ils en eussent éclairci le contenu, ils ne parvenaient pas à
saisir le principe (ri) des résolutions de problèmes (kainan). Ils entendirent
à cette époque que les mathématiques de Seki Shinzuke Takakazu (vas-
sal du seigneur de Kôfu, Tsunashige) dépassaient de loin ce qui se faisait
2. A. Horiuchi : Les mathématiques japonaises à l’époque d’Edo 1600-1868 Librairie Philosophique
Vrin (1994)
3. Y. Mikami : On the Japanese theory of determinants, Isis, 2(1), pp. 9–36 (1914)
46
dans le monde. Les deux frères le choisirent comme maître et étudièrent

auprès de lui ; ils s’intéressèrent également à la science calendérique et à
l’astronomie, y travaillèrent jour et nuit en oubliant le boire et le manger,
et œuvrèrent patiemment pour explorer la Voie qui gouverne les principes
des procédures.
Mais ce n’était pas la seule école de mathématiques au Japon. Et si la quasi-coïncidence
de la découverte du déterminant par Takakazu et Leibniz est étonnante, le parallèle
entre les controverses de savants en Europe et au Japon ne l’est pas moins.
3.3 Les excuses de Cramer

Il n’a fallu que trois pages à Gabriel Cramer (1704–1752) pour passer à la postérité.
Ces trois pages constituent la première partie de l’Appendice de son livre « Introduction
à l’analyse des lignes courbes algébriques », qui en comprend près de 700. Après avoir
donné la solution générale d’un système linéaire de dimensions 1, 2 et 3, il poursuit :
L’examen de ces Formules fournit cette Règle générale. Le nombre des équa-
tions & des inconnues étant n, on trouvera la valeur de chaque inconnue en
formant n fractions dont le dénominateur commun a autant de termes qu’il
y a de divers arrangements de n choses différentes. . .
Pas de doute, ce sont bien les formules de Cramer qu’il décrit. Ce n’est qu’une « Règle »
marginale dans un ensemble monumental. Voici ce qu’il en dit dans la préface.
L’Appendice contient trois Démonstrations qui auraient trop interrompu
la suite du Discours si on les avait insérées où elles sont citées. Il n’y a
proprement que celle du No . 2. qui soit nécessaire.
Pourtant le succès fut quasi immédiat. Gergonne raconte :
Cette méthode fut tellement en faveur, que les examens aux écoles des
services publics ne roulaient, pour ainsi dire, que sur elle ; on était admis
ou rejeté suivant qu’on la possédait bien ou mal.
Cramer aurait été le premier surpris d’apprendre d’où vient sa célébrité. Il n’en aura
pas eu le temps : il semble que le travail excessif qu’il a fourni pour écrire ce monument
soit à l’origine de la dégradation brutale de sa santé, et à son décès à seulement 48 ans.
Quant à l’ampleur de l’ouvrage, il ne « vous en fera point d’excuses ».
Tel est le plan que je me suis proposé dans cet essai. C’est à mes Lecteurs
à juger si je l’ai rempli. J’ai tant de grâces à leur demander, que je ne leur
ferai point d’excuses, ni sur le style, où je n’ai cherché que la clarté ; ni
sur certains détails, que j’ai crû nécessaires aux jeunes Géomètres en faveur
desquels j’écris ; ni sur la longueur de cet Ouvrage, dont je suis moi-même
surpris. Elle vient principalement du nombre d’Exemples que j’apporte pour
illustrer les Règles que je donne. Je sens fort bien que les Savants en vou-
draient moins, mais en échange les Commençants en désireraient peut-être
47
davantage. Je puis dire aux uns, que je ne crois pas avoir placé un seul
Exemple sans quelque raison particulière ; & j’ose assurer les autres que je
ne pense pas qu’ils trouvent dans les Règles aucune difficulté qui ne soit
éclaircie par quelque Exemple.
3.4 Cauchy raconte l’histoire

Dans quel domaine des mathématiques connues au début du xixe siècle Cauchy
(1789–1857) n’a-t-il pas laissé sa trace ? Euh. . . je n’en connais pas ! Les déterminants,
sont le sujet de l’un de ses premiers travaux : « Mémoire sur les fonctions qui ne peuvent
obtenir que deux valeurs égales et de signes contraires par suite des transpositions
opérées entre les variables qu’elles renferment ». Soixante dix neuf pages magistrales
écrites en 1812 et parues au Journal de l’École Polytechnique en 1815. La première
partie, « Fonctions symétriques alternées » débute comme ce chapitre : décomposition
d’une permutation en cycles, en produits de transpositions, etc. Cauchy en vient ensuite
au vif du sujet. Comme il commence par brosser un historique du domaine, tant vaut
en profiter. Remarquez qu’il ne cite ni Takakazu (nous l’excuserons), ni Leibniz ; mais
Laplace, Vandermonde et Bézout ne semblaient pas non plus conscient de ces travaux,
réalisés plus d’un siècle auparavant, mais peu diffusés.
Je vais maintenant examiner particulièrement une certaine espèce de fonc-
tions symétriques alternées qui s’offrent d’elles-mêmes dans un grand nom-
bre de recherches analytiques. C’est au moyen de ces fonctions qu’on ex-
prime les valeurs générales des inconnues que renferment plusieurs équations
du premier degré. Elles se représentent toutes les fois qu’on a des équations
de condition à former, ainsi que dans la théorie générale de l’élimination.
MM. Laplace et Vandermonde les ont considérées sous ce rapport dans les
Mémoires de l’Académie des Sciences (année 1772) et M. Bézout les a encore
examinées depuis sous le même point de vue dans sa Théorie des équations.
M. Gauss s’en est servi avec avantage dans ses Recherches analytiques pour
découvrir les propriétés générales des formes du second degré, c’est-à-dire
des polynômes du second degré à deux ou à plusieurs variables, et il a dési-
gné ces mêmes fonctions sous le nom de déterminants. Je conserverai cette
dénomination qui fournit un moyen facile d’énoncer les résultats ; j’obser-
verai seulement qu’on donne aussi quelquefois aux fonctions dont il s’agit
le nom de résultantes à deux ou à plusieurs lettres. Ainsi les deux expres-
sions suivantes, déterminant et résultante devront être regardées comme
synonymes.
3.5 Le dernier honnête homme

Dans la correspondance de Lagrange, considéré comme le plus grand mathématicien
de la fin du xviiie, on trouve des appréciations extrêmement louangeuses sur Alexandre
48
Théophile Vandermonde (1735–1796). Voici quelques extraits.

M. de Vandermonde me paraît un très grand analyste, et j’ai été très en-
chanté de son travail sur les équations. Ce que vous me dites de son carac-
tère augmente encore mon estime pour lui, et le désir que j’ai de mériter la
sienne.
[. . . ]
Je vous prie de remercier de ma part M. de Vandermonde de la lettre dont
il m’a honoré. Les théorèmes qu’elle contient sont très beaux ; et je ne puis
assez admirer avec combien de sagacité il traite ces sortes de matières si
difficiles et si compliquées. Tout ce que j’ai vu de lui jusqu’ici me donne
l’idée d’un génie bien rare, et je le crois destiné à faire les plus grandes
découvertes dans l’Analyse.
[. . . ]
Le Mémoire de M. de Vandermonde sur l’élimination m’a surtout frappé.
Tout ce qui sort de sa plume me plaît singulièrement ; j’y trouve un air de
simplicité, de généralité et d’originalité qui m’enchante.
Pourtant quand Lebesgue expose en 1937 ses vues sur l’œuvre mathématique de
Vandermonde, l’appréciation est plus mitigée.
La grande notoriété n’est assurée en Mathématiques qu’aux noms associés
à une méthode, à un théorème, à une notation. Peu importe d’ailleurs que
l’attribution soit fondée ou non, et le nom de Vandermonde serait ignoré
de l’immense majorité des mathématiciens si on ne lui avait attribué ce
déterminant que vous connaissez bien, et qui n’est pas de lui !
[. . . ]
Vandermonde n’a pas senti l’importance de ses propres recherches, faute
d’y avoir suffisamment réfléchi. S’il eut réellement du génie et dépassa son
époque, ses travaux ne peuvent néanmoins être compris qu’à la lumière des
recherches contemporaines de Lagrange, et postérieures de Gauss, Abel ou
Galois.
Et Lebesgue d’expliquer que la fausse attribution à Vandermonde de ce fameux déter-
minant est une méprise due à sa convention d’écriture des indices.
Un retour aux sources s’impose. Dans son « Mémoire sur l’élimination » de 1772, le
moins que l’on puisse dire est que les notations ne sont pas faciles. Voici comment il
commence.
1 2 3 1 2 3 1 2 3
Je suppose que l’on représente par 1, 1, 1, &c. 2, 2, 2, &c. 3, 3, 3, &c. autant
α
de différentes quantités générales, dont l’une quelconque soit a, une autre
β
quelconque soit b, &c. & que le produit des deux soit désigné à l’ordinaire
α β
par a · b. Des deux nombres ordinaux α & a, le premier, par exemple,
49
α
désignera de quelle équation est pris le coëfficient a, & le second désignera
le rang que tient ce coëfficient dans l’équation, comme on le verra ci-après.
Je suppose encore le système suivant d’abréviations, & que l’on fasse
α β α β α β
=a·b−b·a
a b
α β γ α β γ α β γ α β γ
=a· +b· +c·
a b c b c c a a b
α β γ δ α β γ δ α β γ δ α β γ δ α β γ δ
=a· −b· +c· −d·
a b c d b c d c d a d a b a b c
[. . . ]
. . . Inutile d’en reproduire plus, vous aurez compris d’une part que Vandermonde est
bien décidé à traiter par sa notation des déterminants tout à fait généraux, d’autre part
que ce ne sera pas de la tarte de comprendre ce qu’il veut dire. De fait, une fois franchi
l’obstacle des notations, le mémoire contient bien une définition des déterminants par
récurrence, et l’énoncé de leurs principales propriétés, . . . mais pas le déterminant de
Vandermonde. Du moins en apparence.
Voici comment Cauchy, dans son mémoire de 1815, présente les déterminants.
Soient a1 , a2 , . . . , an plusieurs quantités différentes en nombre égal à n. On
a fait voir ci-dessus que, en multipliant le produit de ces quantités ou
a1 a2 a3 . . . an
par le produit de leurs différences respectives, ou par
(a2 − a1 )(a3 − a1 ) . . . (an − a1 )(a3 − a2 ) . . . (an − a2 ) . . . (an − an−1 )
on obtenait pour résultat la fonction symétrique alternée
S(±a1 a22 . . . ann )
qui, par conséquent, se trouve toujours être égale au produit
a1 a2 . . . an (a2 − a1 )(a3 − a1 ) . . . (an − a1 )(a3 − a2 ) . . . (an − a2 ) . . . (an − an−1 ) .
Supposons maintenant que l’on développe ce dernier produit et que, dans

chaque terme du développement, on remplace l’exposant de chaque lettre
par un second indice égal à l’exposant dont il s’agit : en écrivant, par
exemple, ar,i au lieu de air et ai,r au lieu de ari , on obtiendra pour résultat
une nouvelle fonction symétrique alternée qui, au lieu d’être représentée par
S(±a11 a22 . . . ann ) ,
50
sera représentée par

S(±a1,1 a2,2 . . . an,n ) ,
le signe S étant relatif aux premiers indices de chaque lettre. Telle est la
forme la plus générale des fonctions que je désignerai dans la suite sous le
nom de déterminants.
[. . . ]
Supposons ces quantités disposées en carré, comme on vient de le voir,
sur un nombre égal à n de lignes horizontales et sur autant de colonnes
verticales, de manière que, des deux indices qui affectent chaque quantité,
le premier varie seul dans chaque colonne verticale et que le second varie
seul dans chaque ligne horizontale, l’ensemble des quantités dont il s’agit
formera un système que j’appellerai système symétrique de l’ordre n.
[. . . ]
Pour obtenir le déterminant du système (1) il suffit, comme on l’a dit ci-
dessus, de remplacer les exposants des lettres par des indices dans le déve-
loppement du produit
a1 a2 . . . an (a2 − a1 )(a3 − a1 ) . . . (an − a1 )(a3 − a2 ) . . . (an − a2 ) . . . (an − an−1 ) .
Il existe donc bien une méthode, consistant à écrire un « déterminant de Vandermonde »

à n variables comme un produit de facteurs, pour ensuite faire descendre les exposants
de chacune des variables en indices. Pour n = 3 :
a a2 a3

2 3 2 3 2 3 2 3 2 3 2 3
abc(b − a)(c − a)(c − b) = ab c + bc a + ca b − cb a − ac b − ba a = b b2 b3 ,

c c2 c3

tandis que

a1 a2 a3

b1 b2 b3 = a1 b2 c3 + b1 c2 a3 + c1 a2 b3 − c1 b2 a3 − a1 c2 b3 − b1 a2 a3 .

c1 c2 c3
Cauchy utilise abondamment cette méthode pour démontrer les propriétés des déter-
minants, et la préconise comme méthode de calcul, dans son cours d’Analyse de l’École
Polytechnique. L’algèbre linéaire étant encore inconnue, il fallait bien se débrouiller
autrement ! Loin d’être un exemple particulier (comme nous vous l’avons présenté), le
déterminant de Vandermonde était donc un moyen commode d’écrire les déterminants
généraux et d’étudier leurs propriétés. Vandermonde en était-il conscient ? Voici ce qu’il
dit dans son mémoire sur l’élimination (c’est nous qui soulignons).
Ceux qui ont connaissance des symboles abrégés que j’ai nommés types
partiels de combinaison dans mon Mémoire sur la résolution des équations,
reconnaîtront ici la formation du type partiel dépendant du second degré,
51
pour un nombre quelconque de lettres ; ils verront sans peine qu’en prenant
ici nos α, β, γ, δ, &c. par exemple, pour des exposants, tous les termes
de même signe, dans le développement de l’une de nos abréviations ; se-
ront aussi le développement du type partiel dépendant du second degré,
& formé d’un pareil nombre de lettres ; ce que démontrent nos opérations
précédentes.
Le Mémoire sur la résolution des équations, publié l’année précédente, a été lu à l’aca-
démie en novembre 1770, soit 2 mois seulement avant celui sur l’élimination. Vander-
monde y introduit une classification des fonctions symétriques, qu’il appelle « types
partiels ». Or que trouve-t-on à la page 4 de ce mémoire, à l’occasion d’un exemple ?
« Or (a2 b + b2 c + c2 a − a2 c − b2 a − c2 b), qui égale (a − b)(a − c)(b − c) a pour carré. . . ».
Au vu des textes, les conclusions suivantes nous semblent s’imposer.
1. Il n’y aucune méprise due à la convention d’écriture des indices ; il a au contraire
une méthode reconnue comme telle, consistant à échanger le rôle des indices et
des exposants, afin de tirer parti de la factorisation du déterminant de Vander-
monde. Cauchy en fait un usage important, tant dans son mémoire de 1812, que
dans son cours d’analyse de l’école Polytechnique de 1821.
2. Vandermonde était parfaitement conscient de cette méthode, puisqu’il le dit
explicitement dans le mémoire sur l’élimination, et qu’il donne la factorisation
dans le mémoire sur la résolution des équations.
3. Même si Cauchy a véritablement développé la théorie, et tiré toutes les consé-
quences de la méthode, il est juste de donner le nom de Vandermonde à la fois
au déterminant et à la méthode.
Pourquoi alors la place de Vandermonde dans l’Histoire est-elle si étriquée ? Il ne semble

pas avoir aimé attirer l’attention. L’astronome suédois Lexell écrivait en 1780 4 :
M. Vandermonde passe pour être un homme de talent, quoiqu’il n’en a pas
la mine. Sa manière de s’exprimer n’est pas trop claire. Il est petit et son
front ne passerait jamais pour le front d’un mathématicien.
Comme on dit dans ces cas-là : Napoléon aussi était petit. La modestie de Vandermonde
le conduisait à s’effacer volontiers, plutôt que de rentrer dans ces polémiques qui ont
toujours émaillé les relations entre savants. Le mémoire sur l’élimination mentionne :
Ce mémoire a été lu pour la première fois à l’Académie le 12 janvier 1771.
Il contenait différentes choses que j’ai supprimées ici, parce qu’elles ont été
publiées depuis par d’autres géomètres.
L’autre géomètre dont il s’agit est Laplace, dont le mémoire, publié dans le même
volume, n’allait pas aussi loin sur le plan théorique que celui de Vandermonde. Même s’il
a été justement reconnu comme le fondateur de la théorie des déterminants, son activité
4. A. Birembaut : L’Académie royale des Sciences en 1780 vue par l’astronome suédois Lexell
(1740–1784) Revue d’Histoire des Sciences et de leurs applications, 10(2), pp. 148–166 (1957)
52
mathématique réduite (seulement 3 ans) ne lui a pas laissé le temps de développer

une œuvre d’envergure. Qu’a-t-il donc fait d’autre ? Ami de Vaucanson, Lavoisier et
Berthollet, Vandermonde s’intéressa au moins autant à la mécanique (il a dirigé le
Conservatoire National des Arts et Métiers) ou à la chimie, qu’aux mathématiques.
Mais aussi à la musique, et sur la fin de sa vie à l’économie politique 5 . À ce tournant
de siècle où les scientifiques commençaient à se spécialiser de plus en plus, peut-être
Vandermonde a-t-il souffert d’être un des derniers touche-à-tout, un « honnête homme »
comme on disait au siècle des lumières.
3.6 La solidité des pyramides

L’interprétation d’un déterminant comme un volume est attribuée à Joseph-Louis
Lagrange (1736–1813). Voici ce qu’il écrit dans « Nouvelle solution du problème du
mouvement de rotation d’un corps de figure quelconque qui n’est animé par aucune
force accélératrice », paru aux « Nouveaux mémoires de l’Académie Royale des Sciences
et Belles-Lettres de Berlin », en 1773.
Imaginons maintenant une pyramide triangulaire qui ait ses quatre angles,
l’un au centre des coordonnées, les autres aux points M , M 0 , M 00 , il n’est
pas difficile de prouver que la solidité de cette pyramide sera exprimée par
les coordonnées x, y, z, x0 , y 0 , z 0 , . . . de cette manière.
z(x0 y 00 − y 0 x00 ) + z 0 (yx00 − xy 00 ) + z 00 (xy 0 − yx0 )

,
6
[. . . ]
Ainsi cette quantité sera nulle toutes les fois que la pyramide en question
s’évanouira, ce qui arrive lorsque les trois points M , M 0 , M 00 sont dans un
même plan passant par le centre des coordonnées.
3.7 Les déterminants de Sylvester

Pour Takakazu, comme pour Leibniz, Cramer ou Vandermonde, la résolution d’un
système linéaire n’était qu’un cas particulier du problème général de l’élimination des
variables entre des équations polynomiales. Il consiste à trouver des solutions communes
à un système d’équations polynomiales à plusieurs variables. Le système est linéaire si
les degrés des polynômes en chacune des variables est 1. L’autre cas particulier facile
est celui où il n’y a qu’une variable et deux équations polynomiales. Il s’agit donc de
déterminer une racine commune à deux polynômes, disons
P = a0 + a1 X + · · · + an X n et Q = b0 + b1 X + · · · + bm X m .
5. J. Hecht : Un exemple de multidisciplinarité : Alexandre Vandermonde (1735–1796), Population,
4, pp. 641–676 (1971)
53
Quelle condition doivent satisfaire les coefficients pour que P et Q aient une racine
commune ? Commençons par former la matrice de Sylvester, S(P, Q), en écrivant m+n
colonnes obtenues en répétant de façon décalée les deux vecteurs de coefficients. Pour
n = 2 et m = 3 :  
a0 0 0 b 0 0 0 0
 a1 a0 0 b 1 b 0 0 0 
 
 
 a a a b b b
 2 1 0 2 1 0 0  
S(P, Q) = 

0 a2 a1 b 3 b 2 b 1 b 0  
 
 0 0 a 2 0 b 3 b 2 b 1 


 0 0 0 0 0 b3 b2 
 
0 0 0 0 0 0 b3
Théorème 4. Le degré du pgcd de P et Q et le rang de la matrice S(P, Q) sont liés
par :
deg pgcd(P, Q) = n + m − rang S(P, Q) .
Vous pouvez démontrer vous-mêmes ce résultat : il suffit de comprendre quel est
le rapport entre l’arithmétique des polynômes et le noyau de la matrice de Sylvester.
Notons R le pgcd de P et Q et supposons qu’il soit de degré supérieur ou égal à 1.
Notons A et B les quotients de P et Q par R : ils sont tels que P = AR et Q = BR,
donc BP − AQ = 0. Les polynômes A et B sont de degrés au plus n − 1 et m − 1.
Écrivons :
A = α0 + α1 X + · · · + αn−1 X n−1 et B = β0 + β1 X + · · · + βm−1 X m−1 .
Soit v le vecteur de Rn+m obtenu en concaténant les coefficients de B puis de −A.
v = (β0 , β1 , . . . , βm−1 , −α0 , −α1 , . . . , −αn−1 ) .
Convainquez-vous que le produit de la matrice S(P, G) par le vecteur colonne tv est le

vecteur des coefficients de BP − AQ. Le reste devrait être facile.
Le déterminant de la matrice de Sylvester s’appelait au début le résultant. Il était déjà
implicitement présent chez Takakazu comme chez Leibniz, et avait été explicité par
Euler, puis Bézout. Pourquoi donc lui a-t-on donné le nom de James Joseph Sylvester
(1814–1897) ?
Certainement pas à l’initiative de ses étudiants de l’Université de Virginie. Il était
pourtant prévenu : en tant que juif, et anglais de surcroît, il n’allait pas être facilement
accepté par les « White Anglo-Saxon Protestants » de l’état esclavagiste qu’était encore
la Virginie d’avant la guerre de sécession (l’histoire se déroule début 1842). 6 .
Unless Sylvester is content to sink into a mere cypher, and submit to all
sorts of imposition from the students, he will have difficulties. They will try
6. L. S. Feuer : America’s First Jewish Professor : James Joseph Sylvester at the University of
Virginia, American Jewish Archives 36, p.151-201 (1984)
54
him, and when they do so, he will [. . . ] commit some sort of blunder, and
compromise his dignity in some way. I reckon our London cockney knows
about as much about Virginian manners and character as a horse would
about differential calculus.
Effectivement, la provocation des étudiants et la gaffe de Sylvester ne s’étaient pas
faites attendre.
The cause of his sudden abandonment of the University of Virginia is often
related by the Rev. R.L. Dabney, as follows : In Sylvester’s class were a
pair of brothers, stupid and excruciatingly pompous. When Sylvester poin-
ted out the blunders made in a recitation by the younger of the pair, this
individual felt his honor and family pride aggrieved, and sent word to Pro-
fessor Sylvester that he must apologize or be chastised.
Sylvester bought a sword-cane, which he was carrying when way-laid by
the brothers, the younger armed with a heavy bludgeon.
An intimate friend of Dr. Dabney’s happened to be approaching at the mo-
ment of the encounter. The younger brother stepped up in front of Professor
Sylvester and demanded an instant and humble apology.
Almost immediately he struck at Sylvester, knocking off his hat, and then
delivered with his heavy bludgeon a crushing blow upon Sylvester’s bare
head.
Sylvester drew his sword-cane and lunged straight at him, striking him
just over the heart. With a despairing howl, the student fell back into his
brother’s arms screaming out, “I am killed ! !” “He has killed me !” Sylvester
was urged away from the spot by Dr. Dabney’s friend, and without even
waiting to collect his books, he left for New York, and took ship back to
England.
Meanwhile, a surgeon was summoned to the student, who was lividly pale,
bathed in cold sweat, in complete collapse, seemingly dying, whispering his
last prayers. The surgeon tore open his vest, cut open his shirt, and at once
declared him not in the least injured. The fine point of the sword-cane had
struck a rib fair, and caught against it, not penetrating.
When assured that the wound was not much more than a mosquito-bite,
the dying man arose, adjusted his shirt, buttoned his vest, and walked off,
though still trembling from the nervous shock.
3.8 La condensation de Dodgson

Soit à calculer un déterminant A = |ai,j |i,j=1,...,n . Il convient d’abord de le réarranger
par combinaison de lignes et de colonnes, de manière à ce que ses coefficients d’indices
compris entre 2 et n−1 soient non nuls. La « condensation de Dodgson » se déroule en
3 étapes :
55
1. former tous les déterminants 2 × 2 possibles avec des termes contigus, que l’on
place dans un déterminant de taille (n−1) × (n−1),
2. répéter l’opération de manière à obtenir un déterminant de taille (n−2) × (n−2),
disons C = |ci,j |i,j=1,...,n−2 ,
3. diviser chaque terme ci,j par le terme ai+1,j+1 du déterminant initial.
On itère ensuite jusqu’à atteindre la taille 1 × 1, et diviser par le terme central du
déterminant 3 × 3 obtenu antérieurement : le résultat est le déterminant cherché. Vous
n’êtes pas convaincu que l’algorithme fait bien ce qui est annoncé ? Il n’est peut-être
pas utile de s’acharner à en savoir plus : il faut bien avouer qu’il n’a aucun intérêt ni
pour le calcul à la main, ni pour l’implémentation sur machine. Le nombre d’opérations,
certes plus réduit que pour le développement par lignes, reste très supérieur à celui de
la méthode du pivot de Gauss.
Charles Dodgson (1832–1898) a publié cette méthode en 1866 sous le titre « Conden-
sation of Determinants, Being a New and Brief Method for Computing their Arithme-
tical Values ». Pas plus que sa méthode, il n’a laissé de souvenir impérissable, ni comme
enseignant (il était professeur au Christ Church College d’Oxford mais avait des pro-
blèmes d’élocution), ni comme mathématicien.
An inveterate publisher of triffles [who] was forever putting up pamphlets,
papers, broadsheets, and books on mathematical topics [that] earned him no
reputation beyond that of a crochety, if sometimes amusing controversialist,
a compiler of puzzles and curiosities, and a busy yet ineffective reformer on
elementary points of computation and instructional methods. In the higher
reaches of the subject he made no mark at all, and has left none since.
Voilà ce qui s’appelle habiller quelqu’un pour l’hiver. N’y a-t-il vraiment rien d’autre
pour le sauver ? La religion ? Il n’alla pas jusqu’à être ordonné prêtre, mais il fut tout de
même diacre et il prononçait régulièrement des sermons et servait des offices religieux.
Ou bien la photographie ? Il laissa une collection de 3000 clichés. Rien de tout cela
ne suffit à expliquer pourquoi Charles L. Dodgson est plus célèbre que n’importe quel
autre mathématicien.
Vous le connaissez sous le pseudonyme de Lewis Carroll : « Alice in Wonderland »
est paru en 1865, un an avant la méthode de condensation. Profitons en pour tordre
le cou une fois de plus à une rumeur tenace, qui a commencé à circuler peu après. La
voici reprise dans une biographie datant de 1910.
A funny tale is told about Queen Victoria. It seems that Lewis Carroll sent
the second presentation copy of “Alice in Wonderland” to Princess Beatrice,
the Queen’s youngest daughter. Her mother was so pleased with the book
that she asked to have the author’s other works sent to her, and we can
imagine her surprise when she received a large package of learned treatises
by the mathematical lecturer of Christ Church College.
56
L’anecdote est piquante, mais complètement imaginaire et d’ailleurs incompatible avec

le caractère de Dodgson et le soin qu’il prit à se démarquer de Lewis Carroll. Il se crut
tout de même obligé de publier un démenti trente ans plus tard.
I take this opportunity of giving what publicity I can to my contradiction of
a silly story, which has been going the round of the papers, about my having
presented certain books to Her Majesty the Queen. It is so constantly re-
peated, and is such absolute fiction, that I think it worthwhile to state, once
for all, that it is utterly false in every particular : nothing even resembling
it has occured.
57
Réduction des endomorphismes

Luc Rozoy, Bernard Ycart
Ceci est votre premier pas vers l’analyse spectrale qui vous accompagnera, dans ses
diverses généralisations, tout au long de vos études de mathématiques. Votre objec-
tif minimal est d’apprendre à diagonaliser les matrices carrées lorsque c’est possible,
et c’est déjà un enjeu majeur pour une foule d’applications, de la physique à l’infor-
matique, en passant par la statistique et l’analyse numérique. Vous aurez besoin des
espaces vectoriels de dimension finie, systèmes linéaires, calcul matriciel et détermi-
nants.
Table des matières

1 Cours 1
1.1 Matrices diagonalisables . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Pratique de la diagonalisation . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Polynômes d’endomorphismes . . . . . . . . . . . . . . . . . . . . . . . 13
1.4 Réduction de Jordan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.5 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2 Entraînement 39
2.1 Vrai ou Faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3 Compléments 65
3.1 Tout à l’envers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.2 Racines lambdaïques ou latentes ? . . . . . . . . . . . . . . . . . . . . . 66
3.3 Le théorème de Perron-Frobenius . . . . . . . . . . . . . . . . . . . . . 67
3.4 Jordan contre Kronecker . . . . . . . . . . . . . . . . . . . . . . . . . . 70
16 mai 2014
Maths en Ligne Réduction des endomorphismes UJF Grenoble
1 Cours
1.1 Matrices diagonalisables
Toutes les matrices considérées sont des matrices carrées à n lignes et n colonnes,
à coefficients dans R ou C. Les vecteurs sont identifiés à des matrices à n lignes et 1
colonne.
Une matrice A = (ai,j )i,j=1,...,n est diagonale si tous ses coefficients en dehors de la
diagonale sont nuls.
∀i 6= j , ai,j = 0 .
Elle est donc de la forme :
 
λ1 0 ... ... 0

... .. 
0 λ2 .
 
 

.. ... ...

.
 
 
A= 
 .. .. ..



 . . . 

 .. .. 

 . . λn−1 0 

0 ... ... 0 λn
Pour comprendre le rôle des coefficients diagonaux, supposons tout d’abord qu’ils sont
tous égaux à λ. Dans ce cas, A est proportionnelle à la matrice identité : A = λI. Pour
tout vecteur x de Rn , le vecteur Ax est proportionnel à x : Ax = λx. Multiplier le
vecteur x par la matrice A revient à le multiplier par le facteur λ. Géométriquement,
c’est effectuer une homothétie de rapport λ.
Supposons maintenant que les coefficients diagonaux soient quelconques. Considérons
une base (e1 , . . . , en ) de Rn , et examinons l’endomorphisme f de Rn , de matrice A dans
cette base. Dire que A est diagonale, c’est dire que l’image du vecteur ei de la base est
λi ei . Si on restreint f à la direction ei , f est une homothétie de rapport λi . Si x est un
vecteur quelconque de Rn , x s’écrit xi ei . Son image par f est :
P
n
X n
X
f (x) = xi f (ei ) = xi λi ei .
i=1 i=1
Les matrices diagonales sont particulièrement simples à manipuler. Voici les pro-
priétés principales :
• Le déterminant d’une matrice diagonale est le produit des coefficients diagonaux.
|A| = λ1 . . . λn .
• Multiplier à gauche par une matrice diagonale revient à multiplier la i-ième ligne
par λi : si B = (bi,j ) est une matrice quelconque, alors
AB = (λi bi,j )i,j=1,...,d .
1
• Multiplier à droite par une matrice diagonale revient à multiplier la j-ième co-
lonne par λj : si B = (bi,j ) est une matrice quelconque, alors
BA = (bi,j λj )i,j=1,...,d .
• Le produit de deux matrices diagonales est une matrice diagonale.

    
λ1 0 ... 0 µ1 0 ... 0 λ1 µ1 0 ... 0
 . . . . . . ..  . . . . . . ..   ... ... .. 
 0 .  0 .   0 . 

 .. ... ...

 .. ... ...

 = 
 .. ... ...


. 0 . 0 . 0
    
    
0 . . . 0 λn 0 . . . 0 µn 0 . . . 0 λn µn
• Si tous les coefficients diagonaux sont non nuls, la matrice est inversible :
−1  1
0 ... 0
 
λ1 0 ... 0 λ
.. .. .  1 .. .. .. 
. ..
 
 0 .   0 . . . 
=
   
 .. .. ..   .
 . .. .. 

 . . . 0 
  . . . 0 

1
0 . . . 0 λn 0 ... 0 λn
• La puissance k-ième d’une matrice diagonale est :

k
λk1
  
λ1 0 ... 0 0 ... 0
.. .. . .. .. .
. .. . ..
   
 0 .   0 . 
=
   
 .. .. ..   .. .. .. 

 . . . 0 


 . . . 0 

0 . . . 0 λn 0 . . . 0 λkn
Pour une matrice A quelconque, les calculs se simplifient à partir du moment où elle est
semblable à une matrice diagonale. Deux matrices A et D sont semblables, lorsqu’elles
représentent le même endomorphisme dans deux bases différentes, ou encore, quand il
existe une matrice de passage P telle que P −1 AP = D. Par exemple :
 1 1 1 
0 1 1 1 −1 0 1 0 0
    
2 2 2
      
− 12 1 1  
 
− 21 3
− 21
    

 2 2  

2



 1 0 1 


 0 −1 0 

=
      
− 12 1
− 12 3
− 32 1
0 1 −1 0 0 2
| {z2 }| 2
{z 2
} | {z } | {z }
P −1 A P D
Définition 1. Une matrice A est dite diagonalisable si elle est semblable à une matrice
diagonale.
L’objectif des deux premières sections de ce chapitre est d’apprendre à diagonaliser
une matrice, quand c’est possible.
2
Définition 2. Diagonaliser une matrice A, c’est trouver une matrice de passage P et

une matrice diagonale D telles que :
P −1 AP = D ⇐⇒ A = P DP −1 .
Si D = P −1 AP , alors AP = P D. Mais si D est une matrice diagonale, multiplier

P à droite par D revient à multiplier les vecteurs colonnes de P par les coefficients
diagonaux de D. Notons vi le i-ième vecteur colonne de la matrice P et λi le i-ième
coefficient diagonal de D. Pour tout i = 1, . . . , d, on doit avoir :
Avi = λi vi ⇐⇒ (A − λi I)vi = 0 ,
en notant I la matrice identité de dimension n. On dit que vi est un vecteur propre de

A associé à la valeur propre λi .
Définition 3. On dit que v est un vecteur propre de A associé à la valeur propre λ si

v est un vecteur non nul et :
Av = λv ⇐⇒ (A − λI)v = 0 .
Observons que λ est une valeur propre de A si et seulement si le système (A−λI)v =

0 a une solution non nulle. Voici deux manières équivalentes de l’exprimer.
Proposition 1. Un nombre complexe λ est valeur propre de la matrice A si et seule-

ment si l’une des conditions équivalentes suivantes est vérifiée.
1. Le rang de la matrice A − λI est strictement inférieur à n.
2. Le déterminant de la matrice A − λI est nul :
|A − λI| = 0 .
Définition 4. On appelle polynôme caractéristique de la matrice A, et on note PA (X)

le déterminant de la matrice A − XI.

a1,1 − X a1,2 . . . ... a1,n

.. ..

a2,1 . .

..
.

PA (X) = |A − XI| =
..

.

.. ...

. an−1,n

an,1 ... . . . an,n−1 an,n − X

D’après la forme développée d’un déterminant, PA (X) est une somme de produits
des termes de la matrice. Chaque produit est constitué de n facteurs qui sont des
termes pris dans des lignes et des colonnes différentes. Le terme de plus haut degré
3
en X dans le déterminant |A − XI| provient du produit des termes qui contiennent

tous X, à savoir les coefficients diagonaux : ni=1 (ai,i −X). Le polynôme caractéristique
Q
PA (X) est donc de degré n : son terme de plus haut degré est (−1)n X n . Tant que nous
y sommes, observons que le terme constant de PA (X) est le déterminant de A ; c’est
aussi le produit des valeurs propres (comptées avec leurs multiplicités). Le coefficient
du terme de degré X n−1 dans PA (X) est la somme des termes diagonaux, que l’on
appelle la trace de la matrice A ; c’est aussi la somme des valeurs propres (toujours
comptées avec leurs multiplicités).
Comme les valeurs propres sont racines du polynôme caractéristique, une matrice de
dimensions n × n admet au plus n valeurs propres distinctes. Pour qu’une matrice soit
diagonalisable, il faut déjà que son polynôme caractéristique admette effectivement
n racines (comptées avec leurs ordres de multiplicité), donc qu’il soit scindé. C’est
toujours le cas dans C, pas toujours dans R.
Si λ est une valeur propre, l’ensemble des vecteurs v tels que (A−λI)v = 0, est un sous-
espace vectoriel. Par définition, il contient le vecteur nul, et tous les vecteurs propres
de A associés à λ. On l’appelle le « sous-espace propre » associé à λ.
Définition 5. Soit λ une valeur propre, on appelle sous-espace propre associé à λ
l’espace vectoriel
{ v ∈ Rn , Av = λv } = Ker(A − λI) .
Théorème 1. Soit A une matrice, dont le polynôme caractéristique PA (λ) est scindé.
Soient λ1 , . . . , λk les racines de PA (X) et m1 , . . . , mk leurs multiplicités respectives
(m1 + · · · + mk = n). La matrice A est diagonalisable si et seulement si pour tout
i = 1, . . . , k, le sous-espace propre associé à la valeur propre λi est de dimension mi .
∀i = 1, . . . , k , dim(Ker(A − λi I)) = mi .
Démonstration : Remarquons qu’un même vecteur propre ne peut être associé qu’à
une seule valeur propre. Par conséquent, deux sous-espaces propres associés à deux
valeurs propres distinctes ont une intersection réduite au vecteur nul : les sous-espaces
propres sont en somme directe.
Supposons que A soit diagonalisable : P −1 AP = D, mais aussi P −1 (A − XI)P =
(D − XI). Les propriétés générales des déterminants font que |A − XI| = |D − XI| :
le polynôme caractéristique de A et celui de D sont les mêmes :
k
PA (X) = PD (X) = (−1)n (X − λi )mi .
Y
i=1
Or le polynôme caractéristique de D est le produit des termes diagonaux. Cela signifie

que pour tout i = 1, . . . , k, exactement mi termes diagonaux de D sont égaux à λi .
Il existe donc mi vecteurs colonnes de P qui sont des vecteurs propres de A, associés
à la valeur propre λi . Comme ces vecteurs forment une famille libre, la dimension du
4
sous-espace propre associé est au moins égale à mi . Comme m1 + · · · + mk = n, et que

les sous-espaces propres sont en somme directe, chacun est de dimension exactement
mi et leur somme directe est Rn .
Réciproquement, si pour tout i le sous-espace propre associé à λi est de dimension mi ,
alors leur somme directe est Rn : on peut constituer une base de Rn en choisissant une
base de vecteurs dans chaque sous-espace propre.
La mauvaise nouvelle est que toutes les matrices ne sont pas diagonalisables. La
bonne nouvelle est que celles que vous rencontrerez, entreront souvent dans l’une des
catégories couvertes par les deux théorèmes suivants : valeurs propres toutes distinctes,
ou bien matrices symétriques.
Théorème 2. Soit A une matrice admettant n valeurs propres toutes distinctes. Alors
A est diagonalisable.
Démonstration : Nous allons montrer par récurrence sur k que si v1 , . . . , vk sont des vec-
teurs propres associés à des valeurs propres λ1 , . . . , λk toutes distinctes, alors (v1 , . . . , vk )
est une famille libre :
k
X
αi vi = 0 =⇒ αi = 0 , ∀i = 1, . . . , k .
i=1
C’est vrai pour k = 1, puisque par définition un vecteur propre est non nul. Supposons
la propriété vraie à l’ordre k −1. Soient λ1 , . . . , λk des valeurs propres distinctes deux
à deux et v1 , . . . , vk des vecteurs propres associés. Supposons :
k
X k−1
X
αi vi = 0 ⇐⇒ αi vi = −αk vk .
i=1 i=1
En multipliant à gauche par la matrice A, on obtient :

k−1
X
αi λi vi = −αk λk vk .
i=1
Mais aussi :
k−1
X
αi λk vi = −αk λk vk .
i=1
Soit en soustrayant les deux équations :
k−1
X
αi (λi − λk )vi = 0 .
i=1
D’après l’hypothèse de récurrence à l’ordre k − 1, ceci entraîne que pour tout i =

1, . . . , k −1, αi (λi − λk ) = 0, donc αi = 0, puisque λi 6= λk . Mais alors nécessairement
αk vk est nul, donc αk = 0 puisque le vecteur propre vk est non nul.
5
Supposons qu’une matrice A admette n valeurs propres toutes distinctes λ1 , . . . , λn .

Pour i = 1, . . . , n, choisissons un vecteur propre vi associé à λi . D’après ce qui précède
(v1 , . . . , vn ) est une famille libre de Rn , donc une base.
Théorème 3. Soit A = (ai,j )i,j=1,...,d ∈ Mn×n (R) une matrice symétrique : A = tA.
Alors :
1. toutes les valeurs propres de A sont réelles ;
2. A est diagonalisable ;
3. on peut choisir comme base de vecteurs propres une base telle que la matrice de
passage P vérifie P −1 = tP (une telle base est dite orthonormée).
Le fait d’avoir une base orthonormée permet d’écrire l’inverse de la matrice de

passage sans calcul supplémentaire (car P −1 = tP ). Ce théorème est un cas particulier
d’un résultat plus général, pour une matrice A à valeurs complexes qui est hermitienne,
c’est-à-dire telle que A = tA, soit aj,i = ai,j , où z désigne le conjugué du nombre
complexe z. Les valeurs propres d’une matrice hermitienne sont réelles, la matrice est
diagonalisable et il existe une matrice de vecteurs propres unitaire, à savoir telle que
P −1 = tP .
Démonstration : Soit v un vecteur non nul de Cn . Considérons le produit : t vv. C’est
la somme des modules des coordonnées de v, à savoir un réel strictement positif. Soit
λ une racine (dans C) de PA (X), et soit v un vecteur propre associé à la valeur propre
λ. Donc :
t
vAv = λt vv
Prenons le conjugué de la transposée de ce même produit (rappelons que t(AB) = tB tA).
λ(t vv) = t (t vAv) = t v tA v = t v A v = λ(t vv) ,
puisque A est symétrique. Donc λ = λ : la valeur propre λ est réelle.

Considérons l’ensemble des vecteurs orthogonaux à v :
E = { u ∈ Rn , t uv = t vu = 0 } .
L’ensemble E est le noyau d’une application linéaire de rang 1 (car v est non nul).
C’est donc un sous-espace vectoriel de Rn , de dimension n−1. Soit u un vecteur de E :
t
vAu = t (t vAu) = t u tA v = t uAv = λt uv = 0 .
Donc Au ∈ E (on dit que E est stable par A). Nous admettrons ici que dans tout
espace vectoriel de dimension finie, il est possible de choisir une base orthormale (par
exemple grâce au procédé d’orthogonalisation de Gram-Schmidt, vu dans un √ autre
chapitre). Soit u1 , . . . , un−1 une base orthonormale de E. Quitte à diviser v par t vv,
on peut supposer que t vv = 1. Par construction, (v, u1 , . . . , un−1 ) est donc une base
6
orthonormale de Rn . Notons P la matrice de ses vecteurs colonnes : P −1 = tP . Au

travers du changement de base de matrice de passage P , A est transformée en une
matrice diagonale par blocs :
!
λ 0
P −1 AP = .
0 B
En effet, la première colonne est nulle après le premier terme car v est un vecteur
propre associé à λ. La première ligne est nulle après le premier terme car E est stable
par A : les images de u1 , . . . , un−1 appartiennent à E. De plus :
t
(P −1 AP ) = tP tA tP −1 = P −1 AP ,
de sorte que P −1 AP est symétrique, donc B l’est aussi. D’où le résultat, par récurrence
sur n.
1.2 Pratique de la diagonalisation

La procédure est un peu longue à appliquer, mais assez simple.
1. Factoriser le polynôme caractéristique
Attention au calcul du déterminant : le but étant de factoriser, vous avez intérêt à
combiner des lignes ou des colonnes, plutôt que de développer, même en dimension
3. Si le polynôme caractéristique a des racines complexes, la matrice n’est pas
diagonalisable dans R, mais elle peut l’être dans C. Nous supposons désormais
que le polynôme caractéristique est scindé :
k
n
(X − λ1 )mi .
Y
PA (X) = (−1)
i=1
2. Trouver une base de chaque sous-espace propre

Vous avez k systèmes linéaires à résoudre. Si pour l’une des valeurs propres λi ,
le système (A − λi I)x = 0 est de rang strictement supérieur à n − mi (l’ensemble
des solutions est de dimension strictement inférieure à mi ), alors la matrice n’est
pas diagonalisable. Supposons que vous ayez bien trouvé une base de mi vecteurs
propres pour chaque valeur propre λi . Rassemblez les vecteurs que vous avez
trouvés pour chaque valeur propre, il y en a n en tout. La matrice dont les
colonnes sont ces n vecteurs est la matrice de passage P de la base canonique à
la nouvelle base.
3. Calculer l’inverse de P
Vous avez alors explicité la diagonalisation : P −1 AP = D. Attention à respecter
le même ordre dans l’écriture des valeurs propres, et dans celle des colonnes de P .
Le calcul de P −1 n’est pas indispensable, sauf si vous avez explicitement besoin
du changement de base.
7
4. Vérifiez vos calculs

Le plus simple est de calculer P DP −1 : vous devez retrouver A. Vous pouvez
aussi vérifier pour chacun des vecteurs que vous avez trouvés qu’il est bien vecteur
propre.
Pour le cas des valeurs propres de multiplicité 1, signalons comme alternative à la

résolution du système linéaire, la « méthode des cofacteurs », à utiliser uniquement en
dimensions 2 et 3.
Proposition 2. Soit λ une valeur propre de A, de multiplicité 1. Considérons une ligne

de A − λI, choisie de façon que la matrice formée des autres lignes de A − λI soit de
rang n−1. Le vecteur formé des cofacteurs associés à cette ligne (les n−1 déterminants
extraits en barrant la ligne choisie et une colonne, avec alternance de signe) est un
vecteur propre de A associé à λ.
Démonstration : Si λ est de multiplicité 1, alors le sous-espace propre associé est de

dimension 1, et il suffit d’en trouver un vecteur non nul. Soit Ae la comatrice de A : c’est
la matrice des cofacteurs de A, à savoir les déterminants mineurs d’ordre n − 1, extraits
en supprimant une ligne et une colonne, affectés de signes alternés. Il se trouve que
A tAe = |A|I. Appliquons ce résultat à A − λI, qui est de rang n − 1 : (A − λI) t(A^ − λI)
est la matrice nulle. Cela signifie que les lignes de A − λI sont soit nulles, soit vecteur
^
propre de A associé à λ.
Nous détaillons d’abord l’exemple suivant, donné en introduction.
 1 1 1 
0 1 1 1 −1 0 1 0 0
    
2 2 2
      
− 12 1 1  
 
− 21 3
− 21
    

 2 2  

2



 1 0 1 


 0 −1 0 

=
      
− 12 1
2
− 12 3
− 32 1
0 1 −1 0 0 2
| {z }| 2 2
{z } | {z } | {z }
P −1 A P D
Commençons par écrire la matrice A − XI.
−X 1 1
 
 
1 3
− 21 
 
 −2
A − XI =  2
−X 
 
3
2
− 32 1
2
−X
Il faut ensuite calculer son déterminant. Il serait maladroit d’utiliser la règle de Sarrus
pour développer le déterminant et le factoriser ensuite. Il vaut mieux le factoriser en
faisant apparaître des zéros par combinaison de lignes et de colonnes. Ajoutons d’abord
8
la seconde colonne à la première :
−X 1−X

1 1
1 1

=
− 12 3
− 12 3
− 12

PA (X) =
2
−X
C1 ←C1 +C2 1−X 2
−X

3
− 32 1
− 32 1

2 2
−X 0 2
−X
On peut alors factoriser (1 − X) dans la première colonne :

1 1 1

3
− 21

PA (X) = (1−X) 1 2
−X

− 23 1

0 2
−X
Soustrayons ensuite la première ligne à la seconde :

1 1 1
1 1 1

3 =
− 12 1
− 32

PA (X) = (1−X) 1 2
−X
L2 ←L2 −L1 (1−X) 0 2
−X

− 32 1
− 23 1

0 2
−X 0 2
−X
En développant selon la première colonne, il reste un déterminant d’ordre 2 qui est

facile à factoriser.
1
−X − 32

2 2 2
PA (X) = (1−X) = (1−X) ( −X) −( ) 1
2
3
2
= (1−X)(−1−X)(2−X)
− 23 1

2
−X
Les valeurs propres de A sont donc 1, −1 et 2. Comme elles sont distinctes, il suffit de
trouver un vecteur propre pour chacune.
Commençons par la valeur propre 1.
−1 1 1
 
 
− 12 1
− 12
 
A−I = 
 2


 
3
2
− 32 − 12
Observons que la matrice A − I est bien de rang 2, comme prévu : la somme des trois
lignes est nulle et les deux premières lignes sont indépendantes. Nous allons calculer les
cofacteurs associés à la troisième ligne. Ils valent (attention à l’alternance de signe) :
−1 −1 1

1 1 1

A3,1 = + = −1 , A3,2 = − = −1 , A3,3 = + =0.
1 − 12 − 21 − 12 − 12 1

2 2
9
Tous les vecteurs non nuls, proportionnels au vecteur t (−1, −1, 0) sont vecteurs propres
de A, associés à la valeur propre 1. Il est conseillé de choisir le plus simple, ici :
1
 
 
 
v1 = 
 1 

 
0
Le choix de la troisième ligne, pour calculer les cofacteurs, est arbitraire. Il suffit que les
deux lignes qui restent ne soient pas proportionnelles (car tous les cofacteurs seraient
nuls). Voici par exemple les cofacteurs associés à la deuxième ligne.
−1 −1

1 1
1
1
A2,1 = − = −1 , A2,2 = + = −1 , A2,3 = − =0.
− 32 − 12 3
− 12 3
− 32

2 2
On pourra trouver un vecteur différent, mais il sera forcément proportionnel à celui

qu’on trouve avec une autre ligne. Cela ne change rien au choix du vecteur propre.
Passons maintenant à la valeur propre −1.
1 1 1
 
 
− 12 5
− 21
 
A − (−1)I = 
 2


 
3
2
− 23 3
2
Les cofacteurs associés à la troisième ligne sont :

1 1 1 1 1 1

A3,1 = + = −3 , A3,2 = − = 0 , A3,3 = + =3.
5 − 12 − 12 − 12 − 12 5

2 2
Ici encore, nous choisirons un vecteur plus simple, proportionnel au vecteur des cofac-
teurs.
−1
 
 
 
v2 = 
 0 

 
1
Voici le calcul pour la valeur propre 2 :
−2 1 1
 
 
1 1 1 
 
 −2 −2 −2 
A − 2I = 
 
3
2
− 23 − 32
10
Les cofacteurs associés à la troisième ligne sont :
−2 −2

1 1
1 3 1
3
A3,1 = + = 0 , A3,2 = − = − , A3,3 = + = .
− 12 − 1

− 21 − 21

2 −1 −1

2
2 2 2
Nous choisirons un vecteur plus simple, proportionnel au vecteur des cofacteurs.
0
 
 
 
v3 = 
 1 

 
−1
La matrice de passage P sera constituée en juxtaposant les trois vecteurs v1 , v2 , v3 (en

colonnes).
1 −1 0
 
 
 
P = 
 1 0 1 

 
0 1 −1
La matrice diagonale D a pour coefficients diagonaux les trois valeurs propres (atten-
tion : l’ordre des valeurs propres et des vecteurs propres doit être le même).
1 0 0
 
 
 
D= 
 0 −1 0 

 
0 0 2
Nous n’insisterons pas sur le calcul de P −1 . Observons que la diagonalisation trouvée

est loin d’être unique. On peut choisir un ordre différent pour les valeurs propres, et
pour chaque valeur propre, n’importe quel vecteur non nul proportionnel à celui qui a
été trouvé. On pourra vérifier par exemple, pour la même matrice A que les matrices
P et D ci-dessous vérifient également P −1 AP = D.
0 −1 3 2 0 0
   
   
   
P =
 2 −1 0 
  0
D= 1 0 

   
−2 0 −3 0 0 −1
Dans l’exemple ci-dessous, la matrice A est symétrique. Pour le choix des vecteurs
propres, nous avons fait en sorte que P −1 = tP . La technique est la même. Il faut sim-
plement prendre garde à choisir des vecteurs propres tels que t vv = 1, ce qui dispensera
11
du calcul de P −1 .
 
√1 √1 − √13   
1 −1 0 √1 √1 √1 0 0 0
  
 3 3  3 2 6
       
 √1 1   
 2 0 √ 
2 


 −1 2 1   √1 0 2
− √6 

 0 1 0


  3
    
     
=  
√1 − √26 − √16
 
6 0 1 1 − √13 √1
2
− √16 0 0 3
| {z }| {z } | {z } | {z }
P −1 A P D
Voici un exemple en dimension 2, où les valeurs propres sont des nombres complexes
(la matrice A n’est donc pas diagonalisable dans R). C’est la matrice de la rotation
vectorielle d’angle π2 dans le plan.
 1 i 
0 −1
    
2 2 1 1 i 0
= 
     
1
2
− 2i 1 0 −i i 0 −i
| {z }| {z } | {z } | {z }
P −1 A P D
Voici maintenant un exemple où la valeur propre 1 est double. La méthode des cofac-
teurs ne s’applique pas pour trouver les vecteurs propres correspondants. Vous devez
déterminer une base de Ker(A − I), en résolvant le système par la méthode du pivot
de Gauss comme vous avez appris à le faire. Ici la matrice A − I a une ligne nulle
et deux lignes proportionnelles. Elle est donc de rang 1 et le système se réduit à une
seule équation, x = z. Les deux vecteurs non proportionnels les plus simples solution
du système sont obtenus pour x = 0, y = 1, z = 0 et x = 1, y = 0, z = 1.
0 1 0
 
0 0 1 0 1 1 1 0 0
    
      
 1 1  


 2 0 2  
 0 1 0



 1 0 0



 0 1 0


    
=
      
1
2
0 − 12 1 0 0 0 1 −1 0 0 −1
| {z }| {z } | {z } | {z }
P −1 A P D
Vous vérifierez que les deux matrices suivantes, qui ont une valeur propre double, ne
sont pas diagonalisables, car le sous-espace propre associé à la valeur propre double est
de dimension 1 et non pas 2.
1 1 0
 
 
1 2 



A=   A= 
 −1 0 −1 

−2 −3  
0 −1 1
Que faire dans ce cas ? Les sections suivantes répondent, entre autres, à cette question.
12
1.3 Polynômes d’endomorphismes

Dans cette section, nous allons raisonner en termes d’endomorphismes plutôt que de
matrices. Les changements de base correspondent à des écritures matricielles différentes
d’un même endomorphisme. Réduire un endomorphisme consiste à chercher une base
dans laquelle sa matrice soit simple (dans l’idéal, diagonale). Nous commençons par
réécrire les définitions que vous connaissez déjà.
Définition 6. Soit E un espace vectoriel de dimension n et f un endomorphisme de

E.
1. Un nombre complexe λ est une valeur propre de f s’il existe un vecteur v ∈ E
non nul, tel que f (v) = λv.
2. Un vecteur v ∈ E est un vecteur propre de f associé à la valeur propre λ de f si
v est non nul et f (v) = λv.
3. Le sous-espace propre associé à la valeur propre λ est l’ensemble des vecteurs v
tels que f (v) = λv, à savoir le noyau de l’endomorphisme f − λI, où I désigne
l’identité de E.
4. On dit que f est diagonalisable s’il existe une base de E formée de vecteurs
propres pour f , ou encore si E est la somme directe des sous-espaces propres de
f :
k
M
E= Ker(f − λi I) .
i=1
5. On appelle polynôme caractéristique de f le polynôme
Pf (X) = det(f − XI) ,
dont les racines sont les valeurs propres de f .
Rappelons que le déterminant d’un endomorphisme est celui de sa matrice dans une
base quelconque de E, et qu’il ne dépend pas de la base. Pour votre culture générale,
le spectre d’un endomorphisme est l’ensemble de ses valeurs propres.
Justifions maintenant le titre de cette section.
Notation 1. Soit P (X) = a0 + a1 X + · · · + ad X d ∈ R[X] un polynôme.

1. Si f est un endomorphisme de E, on note P (f ) l’endomorphisme :
d
a0 I + a1 f + · · · + ad f d = ai f i ,
X
i=0
où f 0 = I et pour tout i > 1, f i = f i−1 ◦ f .
13
2. Si A ∈ Mn×n (R) est une matrice, on note P (A) la matrice :

d
a0 I + a1 A + · · · + ad Ad = ai Ai ,
X
i=0
où A0 = I et pour tout i > 1, Ai = Ai−1 A.
Observez la cohérence des deux notations : si A est la matrice de f dans une

certaine base, alors P (A) est celle de P (f ) dans la même base. Remarquez aussi que
deux polynômes du même endomorphisme commutent.
∀P, Q ∈ R[X] , P (f ) ◦ Q(f ) = Q(f ) ◦ P (f ) .
Les sous-espaces propres sont stables par f , au sens de la définition suivante :
Définition 7. Soit f un endomorphisme de E et F un sous-espace vectoriel de E. On

dit que F est stable par f si f (F ) ⊂ F .
Proposition 3. Soient f et g deux endomorphismes qui commutent : f ◦ g = g ◦ f .

Alors Im(f ) et Ker(f ) sont stables par g.
Démonstration : Soit v un élément de Im(f ) : il existe u ∈ E tel que v = f (u). Alors

g(v) = g(f (u)) = f (g(u)), donc g(v) ∈ Im(f ).
Soit maintenant v ∈ Ker(f ) : f (g(v)) = g(f (v)) = g(0) = 0, donc g(v) ∈ Ker(f).
La conséquence est que les sous-espaces propres de f sont stables non seulement par
f , mais aussi par tous les P (f ), quel que soit le polynôme P . Les polynômes qui nous
intéressent ici ont pour racines les valeurs propres de f : en premier lieu le polynôme
caractéristique.
Théorème 4 (de Cayley-Hamilton). Soit f un endomorphisme de Rn et Pf son poly-

nôme caractéristique. Alors Pf (f ) est identiquement nul.
Démonstration : Choisissons une base quelconque de Rn . Soit A la matrice de f dans

cette base. Nous allons démontrer que Pf (A) est la matrice nulle. Considérons la matrice
A − XI, dont Pf est le déterminant. Soit A^ − XI sa comatrice, à savoir la matrice des
cofacteurs (mineurs d’ordre n−1 avec alternance de signe). On rappelle que :
(A − XI) t(A^
− XI) = Pf (X) I .
Posons Pf (X) = a0 + a1 X + · · · + an X n . Développons également t(A^

− XI), comme un
polynôme de degré n−1, dont les coefficients sont des matrices :
t
− XI) = C0 + C1 X + · · · + Cn−1 X n−1 ,
(A^
14
où C0 , . . . , Cn−1 ∈ Mn×n (R). L’identité rappelée ci-dessus devient :
(A − XI)(C0 + C1 X + · · · + Cn−1 X n−1 ) = a0 I + (a1 I)X + · · · + (an I)X n .
Identifions alors les coefficients des deux polynômes :
AC0 = a0 I
AC1 − C0 = a1 I
..
.
ACi − Ci−1 = ai I
..
.
ACn−1 − Cn−2 = an−1 I
−Cn−1 = an I
Pour i = 0, . . . , n, multiplions la i-ième équation par Ai et ajoutons le tout. Le membre

de gauche s’annule, et le membre de droite est Pf (A).
Définition 8. Soit P ∈ R[X] un polynôme. On dit que P est un polynôme annulateur
de f si l’endomorphisme P (f ) est identiquement nul.
Observons que tous les multiples d’un polynôme annulateur sont encore des poly-
nômes annulateurs. D’après le théorème de Cayley-Hamilton, le polynôme caractéris-
tique et tous ses multiples sont des polynômes annulateurs. Mais ce n’est pas tout.
Proposition 4. Il existe un polynôme unitaire unique, appelé polynôme minimal de f
et noté πf , tel que tout polynôme annulateur de f est un multiple de πf .
Démonstration : Mettons que vous savez déjà que R[X] est un anneau principal : les
polynômes annulateurs forment un idéal propre. Cet idéal est donc engendré par un
élément unique, fin de l’histoire.
Euh. . . vous ne seriez pas contre une démonstration élémentaire ? Considérons l’en-
semble des degrés des polynômes annulateurs non nuls :
{ deg(P ) , P ∈ R[X] , P 6= 0 , P (f ) = 0 } .
C’est une partie de N non vide : elle contient au moins n, puisque le polynôme carac-
téristique est annulateur. Soit m son plus petit élément, et considérons un polynôme
annulateur π de degré m. Montrons que tout polynôme annulateur P est multiple de
π. Pour cela considérons la division euclidienne de P par π :
P = πQ + R ,
où deg(R) 6 m−1. Mais si P (f ) = 0 et π(f ) = 0, alors R(f ) = 0. Si R était non nul, ce

serait un polynôme annulateur de degré strictement inférieur à m, ce qui contredirait la
15
définition de m. Donc R est nul et P est multiple de π. Si π1 et π2 sont deux polynômes

annulateurs de même degré m, ils sont multiples l’un de l’autre. Ils diffèrent donc par
une constante multiplicative. D’où l’unicité, si on suppose que le coefficient du terme
de plus haut degré est 1 (polynôme unitaire).
Proposition 5. Soit f un endomorphisme, dont le polynôme caractéristique est scindé.

k
Pf (X) = (−1)k (X − λi )mi .
Y
i=1
Son polynôme minimal est :

k
(X − λi )li ,
Y
πf =
i=1
où pour tout i = 1, . . . , k, 1 6 li 6 mi .
Démonstration : D’après le théorème de Cayley-Hamilton et la définition du polynôme

minimal, celui-ci divise le polynôme caractéristique. Puisque les polynômes de degré 1
sont irréductibles,
k
(X − λi )li ,
Y
πf =
i=1
où pour tout i = 1, . . . , k, 0 6 li 6 mi . Nous devons simplement démontrer que

li > 0 pour tout i. Soit v un vecteur propre de f associé à la valeur propre λi . Alors
(f − λj I)(v) = (λi − λj )v, qui est nul si i = j, non nul i 6= j. Donc
 
k
(λi − λj )lj  v .
Y
πf (v) = 
j=1
Or par définition πf (v) doit être nul, donc l’exposant li est bien strictement positif (s’il
était nul, πf (v) serait égal à v multiplié par un produit de termes non nuls).
Un exemple élémentaire vous aidera à comprendre la différence entre polynôme
minimal et polynôme caractéristique. Supposons que f soit l’homothétie de rapport
λ, soit f = λI. La matrice de f dans n’importe quelle base est diagonale, avec des λ
sur la diagonale. Le polynôme caractéristique de f est Pf = (λ − X)n , alors que son
polynôme minimal est πf = (X − λ), puisque f = λI. Or justement, la diagonalisation
consiste à écrire une somme directe de sous-espaces propres, pour chacun desquels la
restriction de f est une homothétie.
Théorème 5. Soit f un endomorphisme, dont le polynôme caractéristique est scindé.

k
Pf (X) = (−1)k (X − λi )mi .
Y
i=1
16
L’endomorphisme est diagonalisable si et seulement si ses valeurs propres λ1 , . . . , λk

sont racines simples de son polynôme minimal.
k
Y
πf = (X − λi ) .
i=1
Démonstration : Considérons le polynôme π = kj=1 (X − λj ). Soit v un vecteur propre

Q
de f , associé à la valeur propre λi . L’image de v par π(f ) est :

 
k
Y
π(f )(v) =  (λi − λj ) v = 0 .
j=1
Si f est diagonalisable, alors il existe une base de vecteurs propres. Si un endomor-

phisme s’annule sur tous les éléments d’une base, il est identiquement nul. Donc le
polynôme π est annulateur, donc multiple de πf . Or par la proposition précédente, π
divise πf . Donc π = πf .
Réciproquement, supposons que le polynôme minimal de f soit
k
Y
πf = (X − λi ) .
i=1
Notons Ei le sous-espace propre de f associé à la valeur propre λi : Ei = Ker(f −

λi I). Nous voulons démontrer que E = ki=1 Ei . Nous avons déjà observé qu’un même
L
vecteur ne peut pas être dans deux sous-espaces propres différents : les intersections
deux à deux des sous-espaces propres sont réduites à {0}, donc la somme des Ei est
directe. Nous devons simplement démontrer que tout vecteur de E est une somme de
vecteurs propres. Écrivons :
k
!
1 X 1 1
Qk = .
i=1 (X − λi ) j6=i (λi − λj ) X − λi
Q
i=1
C’est la décomposition en éléments simples de la fraction rationnelle 1/ ki=1 (X − λi )

Q
(juste pour que vous sachiez d’où vient cette formule parachutée). En multipliant par
le dénominateur du membre de gauche :
k
!
X 1 Y
1= (X − λj ) .
j6=i (λi − λj ) j6=i
Q
i=1
Ceci est l’écriture du polynôme constant 1 sur la base des polynômes interpolateurs
de Lagrange (vous n’avez pas besoin de le savoir pour comprendre la suite, c’est beau
voilà tout). Posons alors pour tout i = 1, . . . , k :
1 Y
αi = Q et Pi (X) = (X − λj ) .
17
Ainsi :
k
X
1= αi Pi (X) .
i=1
Composons par f (cf. notation 1) :

k
X
I= αi Pi (f ) .
i=1
Donc pour tout vecteur v ∈ E :

k
X
v= αi Pi (f )(v) .
i=1
Il nous reste à démontrer que pour tout i = 1, . . . , n, Pi (f )(v) ∈ Ei . Par hypothèse,

πf (X) = (X − λi )Pi (X). Donc :
πf (f )(v) = (f − λi I)(Pi (f )(v)) = 0 .
Nous avons démontré que tout vecteur de E s’écrit comme somme de vecteurs des sous-
espaces propres. Donc E est la somme des sous-espaces propres. Nous savions déjà que
la somme des Ei est directe, donc E = ki=1 Ei .
L

Voici quelques exemples pour terminer cette section.
Définition 9. Soient F et G deux sous-espaces vectoriels de E, tels que E = F ⊕ G :

tout vecteur v ∈ E s’écrit de manière unique comme la somme d’un vecteur de F et
d’un vecteur de G.
∀u ∈ E , ∃!(v, w) ∈ F × G , u=v+w .
• La projection sur F parallèlement à G est l’application p qui à u associe p(u) = v.

• La symétrie par rapport à F parallèlement à G est l’application s qui à u associe
s(u) = v − w.
La figure 1 vous aidera à visualiser cette définition.
Proposition 6. Soient F et G deux sous-espaces vectoriels de E, de dimensions respec-

tives k et n−k, tels que E = F ⊕G. La projection p et la symétrie s sur F parallèlement
à G sont diagonalisables. Leurs polynômes minimaux et caractéristiques sont :
Pp (X) = (−1)n X n−k (X − 1)k et πp (X) = X(X − 1)
Ps (X) = (−1)n (X + 1)n−k (X − 1)k et πs (X) = (X + 1)(X − 1)
18
w u
p(u)
−w s(u)
F
Figure 1 – Somme directe E = F ⊕ G, projection sur F , et symétrie par rapport à F .
Démonstration : Formons une base de E en concaténant une base de F et une base

de G. Les matrices de p et s dans cette base sont diagonales :
   
1 0 ... ... 0 1 0 ... ... 0

.. .. ..  
.. .. .. 

 0 . . . 
 
 0 . . . 


.. ..
 
.. ..

. . 1 . . 1
   
   

.. ..
 et 
. ..

−1 . .
   

 0 . . 


 . 

 .. ... ...   .. ... ... 

 . 0 


 . 0 

0 ... ... 0 0 0 ... ... 0 −1
Les polynômes caractéristiques s’en déduisent immédiatement. Les polynômes mini-

maux aussi, en utilisant le théorème précédent : il n’y a que deux valeurs propres, 1 et
0 pour la projection, 1 et −1 pour la symétrie. On peut aussi observer que la projection
vérifie p ◦ p = p, soit p2 − p = 0 ; la symétrie vérifie s ◦ s = I, soit s2 − I = 0.
Définition 10. On dit qu’un endomorphisme f est nilpotent d’indice k si f k = 0 et

f k−1 6= 0.
Proposition 7. Soit f un endomorphisme nilpotent d’indice k. Son polynôme carac-

téristique est (−1)n X n , son polynôme minimal est X k . Si k > 1, f n’est pas diagona-
lisable.
Démonstration : Puisque X k est un polynôme annulateur, le polynôme minimal di-

vise X k . Mais comme f k−1 6= 0, πf ne peut pas être de degré inférieur à k. Donc
πf = X k . L’endomorphisme f n’a pas d’autre valeur propre que 0, donc le polynôme
caractéristique est multiple de X n .
19
Proposition 8. Soit f un endomorphisme tel que sa matrice dans une certaine base
soit :  
0 0 ... . . . 0 a0

... ... .. 
 1 . a1
 

... . . . .. ..
 
 0 . .
 

A=  . . .. ..

 .. .. 
 . 0 . 

 . .. ..
 ..

 . . 0 an−2 

0 . . . . . . 0 1 an−1
Son polynôme caractéristique est :
Pf (X) = (−1)n (X n − an−1 X n−1 − · · · − a1 X − a0 ) .
Son polynôme minimal est :
πf (X) = (−1)n Pf (X) = X n − an−1 X n−1 − · · · − a1 X − a0 .
La matrice A est appelée matrice de Frobenius ou matrice compagnon du polynôme

Pf = (−1)n πf .
Démonstration : Le calcul du polynôme caractéristique s’effectue en développant selon
la première ligne pour faire apparaître une formule de récurrence ; nous vous le laissons
en exercice, si vous ne l’avez pas déjà vu dans le chapitre « Déterminants ». Considérons
la base (e1 , . . . , en ) dans laquelle la matrice de f est A. Par définition,
f (e1 ) = e2 , f (e2 ) = f 2 (e1 ) = e3 , . . . , f (en−1 ) = f n−1 (e1 ) = en .
Soit P (X) = b0 + b1 X + · · · + bn−1 X n−1 un polynôme quelconque, de degré au plus

n−1. Alors :
P (f )(e1 ) = b0 e1 + b1 f (e1 ) + · · · + bn−1 f n−1 (e1 ) = b0 e1 + b1 e2 + · · · + bn−1 en .
Si P est un polynôme annulateur de f , alors P (f )(e1 ) = 0, mais comme (e1 , . . . , en )

est une base, ceci entraîne que b0 = . . . = bn−1 = 0. Un polynôme annulateur de degré
strictement inférieur à n est nul. Tout polynôme annulateur non nul est donc de degré
supérieur ou égal à n, donc multiple de Pf (cf. proposition 4).
1.4 Réduction de Jordan

Cette section dépasse nettement le niveau de ce cours, et nous vous demandons
d’admettre les résultats principaux. La réduction de Jordan est ce qu’on peut faire
de mieux pour une matrice non diagonalisable. Même si elle est difficile à décrire
précisément, et si les justifications théoriques sont hors de votre portée pour l’instant,
il est bon de savoir que derrière la fonction « Jordan » des logiciels de calcul formel se
20
cache une méthode utile et puissante. Soyons réalistes : nous ne vous demanderons pas
de calculer à la main une forme réduite de Jordan en dimension supérieure à 4, il y a
des logiciels pour cela. Nous nous contenterons donc de vous indiquer la démarche sur
des exemples en dimension réduite.
Nous avons vu précédemment que les endomorphismes nilpotents ne sont pas diagona-
lisables. Le théorème suivant (admis) montre que tout endomorphisme se décompose
en une partie diagonalisable et une partie nilpotente.
Théorème 6 (décomposition de Dunford). Soit f un endomorphisme d’un espace

vectoriel E. Il existe un couple (g, h) unique d’endomorphismes de E tels que :
• g est diagonalisable et h est nilpotent,
• g et h commutent,
• f = g + h.
C’est donc dans les endomorphismes nilpotents que réside la difficulté. Certes, ils
ne sont pas diagonalisables, mais on peut néanmoins simplifier leur forme matricielle.
La proposition suivante vous explique comment, pour le cas particulier où l’indice est
maximal.
Proposition 9. Soit f un endomorphisme nilpotent d’indice n dans un espace vectoriel

E de dimension n. Il existe une base de E dans laquelle la matrice de f est trangulaire
supérieure, les termes au-dessus de la diagonale valant 1, les autres étant nuls. Cette
matrice s’appelle « bloc de Jordan » d’ordre n.
 
0 1 0 ... ... 0

... ... ... .. 
0 .
 
 

.. .. .. .. 
. . . .
 
 
Jn = 
 ..



 . 0 

 .. ... ... 

 . 1 

0 ... ... 0 0
Démonstration : Par hypothèse, f n−1 est non nul, donc il existe v ∈ E tel que f n−1 (v) 6=
0. Nécessairement les n vecteurs f n−1 (v), f n−2 (v), . . . , f (v), v sont tous non nuls. Nous
allons montrer qu’ils forment une famille libre. Soient α1 , . . . , αn des réels tels que
α1 f n−1 (v) + α2 f n−2 (v) + · · · + αn−1 f (v) + αn v = 0
Prenons l’image par f n−1 , et utilisons le fait que f m = 0 pour m > n : αn f n−1 (v) = 0,
donc αn = 0. On itère alors en composant avec f n−i−1 pour obtenir que αi = 0 pour
tout i = 1, . . . , n. Les n vecteurs f n−1 (v), f n−2 (v), . . . , f (v), v forment une famille libre,
donc une base puisque l’espace est de dimension n. La matrice de f dans cette base
est bien Jn .
21
Dans le cas général, un endomorphisme nilpotent admet une réduction du même

type, mais il est beaucoup plus difficile de l’écrire précisément : c’est encore une matrice
triangulaire supérieure, les termes au-dessus de la diagonale valent 1 ou 0, les autres
termes sont nuls.
 
0 b1 0 . . . . . . 0

... ... ... .. 
0 .
 
 

.. .. .. .. 
. . . .
 
 

 ..

 , ∀i = 1, . . . , n − 1 , bi = 0 ou 1 .

 . 0 
 .. ... ... 

 . bn−1 

0 ... ... 0 0
Proposition 10. Soit f un endomorphisme nilpotent d’indice k dans un espace vec-

toriel E de dimension n. Il existe des entiers n1 , . . . , nh tels que n1 + · · · + nh = n, et
une base de E dans laquelle la matrice de f est la matrice diagonale par blocs dont les
blocs sont Jn1 , . . . , Jnh .
Démonstration : Nous allons le démontrer par récurrence sur l’indice de f . Pour k = 1,

f est identiquement nul, et il n’y a rien à démontrer. Supposons que la propriété soit
vraie pour k et démontrons-la si f est un endomorphisme d’indice k + 1. L’endo-
morphisme f de E dans E induit un endomorphisme de f (E) dans f (E). C’est un
L
endomorphisme nilpotent d’indice k. Par hypothèse de récurrence f (E) = i∈I Fi :
chaque Fi admet une base de la forme vi , f (vi ), . . . , f ki −1 (vi ) où vi est un vecteur de
f (E) d’indice
ki , et donc vi = f (wi ) pour un vecteur wi de E de d’indice ki +
1. La
δ ki
famille f (vi ) est une base de f (E) et donc la sous-famille f (wi ) est
i∈I,0≤δ≤ki −1 i∈I
libre. Mais elle est constituée de vecteurs qui appartiennent au noyau de f . Ajoutons à
cette famille de nouveaux vecteurs notés wj pour j ∈ J (avec J ∩ I = ∅) de sorte que la
famille (wµ )µ∈I∪J soit une base du noyau de f . Décidons que kµ = 0 si µ ∈ J et posons

L = I ∪ J. Alors la famille f δ (wµ ) est une base de E par construction.
µ∈L,0≤δ≤kµ
Dans cette base, la matrice qui représente f a la forme correspondante à l’énoncé pour
k + 1, d’où le résultat par récurrence.
La décomposition de Dunford et la forme réduite des endomorphismes nilpotents
conduisent à la réduction de Jordan (théorème admis).
Théorème 7 (réduction de Jordan). Soit f un endomorphisme d’un espace vectoriel

E de dimension n, dont le polynôme caractéristique est scindé. Il existe des entiers
n1 , . . . , nh tels que n1 + · · · + nh = n, et une base de E dans laquelle la matrice de f est
diagonale par blocs, chaque bloc étant de la forme λI + Jni , où λ est une valeur propre
de f .
L’algorithme de calcul de la réduction de Jordan est le suivant.
22
1. Factoriser le polynôme caractéristique

2. Trouver une base de chaque sous-espace propre
3. Compléter cette base s’il y a lieu
Si la multiplicité de la valeur propre λ est m alors qu’il n’y a que l < m vecteurs
propres indépendants, il faut trouver encore m − l vecteurs. Pour chaque vecteur
propre v déjà trouvé, vous allez résoudre le système (A − λI)w = v, où v est un
vecteur propre déjà écrit. Vous devrez vérifier que la solution w est linéairement
indépendante des vecteurs déjà écrits. S’il manque encore des vecteurs, vous ré-
soudrez le système (A − λI)u = w. . . Rassurez-vous, vous n’aurez pas à itérer
trop longtemps pour obtenir une base de E.
4. Calculer l’inverse de P
5. Vérifier vos calculs
Considérons la matrice  
1 2
A= 
−2 −3
Son polynôme caractéristique est (X + 1)2 . Il a une racine double λ = −1, et la matrice
A − λI = A + I est de rang 1.
 
2 2
A+I = 
−2 −2
Le sous-espace propre associé

! à la valeur propre −1 est la droite vectorielle engendrée
1
par le vecteur v1 = . Pour compléter en une base de R2 , cherchons v2 , indépen-
−1
!
0
dant de v1 , et tel que (A + I)v2 = v1 : par exemple v1 = . Comme Av1 = −v1
1/2
et Av2 = v1 − v2 , la matrice dans la base (v1 , v2 ) a bien la forme souhaitée.
−1
     
1 0 1 2 1 0 1
    = 
2 2 −2 −3 −1 1/2 0 −1
Considérons la matrice
1 1 0
 
 
 
A= 
 −1 0 −1 

 
0 −1 1
Son polynôme caractéristique est X(X − 1)2 . Trouver un vecteur propre v1 associé à la
valeur propre 0, puis un vecteur propre v2 associé à la valeur propre 1. Le sous-espace
23
propre associé à 1 est de dimension 1. Pour trouver v3 , il faut chercher une solution de
(A − I)v3 = v2 , et s’assurer que (v1 , v2 , v3 ) forme bien une base.
−1 −1 −1 1 1 0 1 1 −1 0 0 0
     
     
     
1 1   −1
0    −1
0 −1  0 = 0
1  1 1 
   
 
     
−1 0 −1 0 −1 1 −1 −1 0 0 0 1
Un dernier exemple pour la route ?
4 1 −1
 
 
 
 −2
A= 1 1 

 
1 0 1
Son polynôme caractéristique est (2 − X)3 . Le sous-espace propre associé la valeur

propre 2 est engendré par v1 = t(1, −1, 1). Une solution du système (A − 2I)v2 = v1 est
v2 = t(1, −1, 0). Une solution du système (A − 2I)v3 = v2 est v3 = t(1, 0, 1). Les trois
vecteurs (v1 , v2 , v3 ) forment bien une base de R3 .
−1 −1 1 4 1 −1 1 1 1 2 1 0
     
     
     

 1 0 −1 
  −2
 1   −1 −1
1   0 
= 0
 2 1 

     
1 1 0 1 0 1 1 0 1 0 0 2
1.5 Applications
Puissances d’une matrice.
Si deux matrices A et B représentent le même endomorphisme dans deux bases diffé-
rentes, alors il en est de même de An et B n , pour tout n ∈ N, et également de A−n et
B −n si cet endomorphisme est inversible.
P −1 AP = B =⇒ P −1 An P = B n , ∀n ∈ N .
La puissance n-ième d’une matrice diagonale s’écrit immédiatement. Pour un bloc de

Jordan, ce n’est pas beaucoup plus compliqué. Nous vous laissons vérifier que pour
k = 1, . . . , n−1, Jnk est la matrice dont les termes de la forme ai,i+k sont égaux à 1,
les autres étant nuls. Pour k > n, J k = 0. Par la formule du binôme de Newton, on en
déduit l’expression de (λI + J)k . On peut donc écrire explicitement la puissance k-ième
d’une réduction de Jordan. Cependant, nous ne vous conseillons pas cette méthode,
car il est plus facile d’utiliser le théorème de Cayley-Hamilton : PA (A) = 0. Reprenons
notre premier exemple, une matrice A dont les 3 valeurs propres sont 1, −1, 2. Le
polynôme caractéristique est −X 3 − 2X 2 + X + 2. Vous en déduisez donc que −A3 −
24
2A2 + A + 2I est la matrice nulle. Non seulement A3 , mais toutes les puissances de A
sont des combinaisons linéaires des trois matrices I, A, A2 . En effet :
A3 = −2A2 + A + 2I =⇒ A4 = −2A3 + A2 + 2A = 5A2 − 4I .
Ainsi vous pouvez calculer de proche en proche toutes les puissances positives de A.
Mais aussi :
1
A(A2 + 2A − I) = 2I =⇒ A−1 = (A2 + 2A − I) ,
2
donc toutes les puissances négatives de A sont aussi des combinaisons linéaires de
I, A, A2 .
Algorithme de calcul du polynôme minimal.
Il y a deux manières de voir un polynôme annulateur : comme un polynôme de ma-
trices qui s’annule pour X = A, ou bien comme une combinaison linéaire nulle des
puissances de A : le théorème de Cayley-Hamilton affirme que la famille des (n + 1)
matrices (I, A, A2 , . . . , An ), considérée comme famille dans un espace vectoriel de di-
mension n2 , est une famille liée. Ceci est la base de l’algorithme de calcul du polynôme
minimal par la méthode du pivot de Gauss, qui est utilisé dans les logiciels. Toute
combinaison linéaire nulle et non triviale des matrices (I, A, A2 , . . . , An ) correpond à
un polynôme annulateur de A. Si nous effectuons cette recherche avec des puissances
de A les plus petites possibles, comme il existe un et un seul polynôme annulateur uni-
taire de degré minimal (proposition 4), nous en déduisons un moyen systématique pour
trouver le polynôme minimal de A. Une manière naturelle de procéder est de considé-
2
rer les matrices I, A . . . , An comme vecteurs de Rn , de les disposer en ordre croissant
des puissances et d’effectuer la mise sous forme échelonnée de ces (n + 1) vecteurs,
en s’interdisant de permuter des lignes, en ne s’autorisant que des permutations de
colonnes pour pouvoir avancer dans la recherche de pivots non nuls par la méthode de
Gauss. Quand la mise sous forme échelonnée est faite, la première ligne qui ne présente
que des 0, (à un coefficient scalaire multiplicatif près) contient la combinaison linéaire
des vecteurs de départ faisant intervenir les plus basses puissances possibles de A. Elle
contient donc le polynôme minimal. Pour mémoriser les opérations effectuées pendant
la mise sous forme échelonnée par la méthode de Gauss, ajoutons une dernière colonne
contenant 1, X, X 2 . . . et effectuons aussi sur cette colonne les opérations élémentaires
de la méthode de Gauss. Nous aurons alors dans cette colonne pour la première ligne
ne contenant que des 0, à un coefficient multiplicatif près, l’expression du polynôme
minimal de A, non factorisé.
Voici un exemple. Soit
     
0 1 0 −1 2 0 −2 3 0
2 3
A =  −1 2 0 

 A =  −2 3 0 

 A =  −3 4 0 

 .
−1 1 1 −2 2 1 −3 3 1
Formons le premier tableau de la méthode. Pour i allant de 0 à 3, on trouve sur la ligne
25
i les 9 coefficients de la matrice Ai , suivis de X i .
1 0 0 0 1 0 0 0 1 1
0 1 0 −1 2 0 −1 1 1 X
−1 2 0 −2 3 0 −2 2 1 X2
−2 3 0 −3 4 0 −3 3 1 X3
Dans le second tableau, des combinaisons linéaires de lignes annulent les coefficients
de la première colonne après le premier.
1 0 0 0 1 0 0 0 1 1
0 1 0 −1 2 0 −1 1 1 X
2
0 2 0 −2 4 0 −2 2 2 X +1
0 3 0 −3 6 0 −3 3 3 X3 + 2
Dans le troisième tableau, on annule les coefficients de la seconde colonne, après les 2
premiers.
1 0 0 0 1 0 0 0 1 1
0 1 0 −1 2 0 −1 1 1 X
0 0 0 0 0 0 0 0 0 (X 2 + 1) − 2X
0 0 0 0 0 0 0 0 0 (X 3 + 2) − 3X
Donc π(X) = X 2 − 2X + 1 = (X − 1)2 est le polynôme minimal de A. Nous obtenons

aussi que X 3 − 3X + 2 = (X + 2)(X − 1)2 est annulateur, ce qui n’est pas très utile :
le facteur (X + 2) est parasite et nous ne cherchons pas à utiliser l’information (sans
intérêt pour nous) associée. Au vu du polynôme minimal, nous voyons que A admet
1 comme seule valeur propre et la réduction de Jordan de A fera intervenir un bloc
J2 et un bloc J1 . La mise sous forme de Jordan est particulièrement simple ici parce
que Ker(A − λI)2 pour λ = 1 est E = R3 toutentier. Prenons 
donc un vecteur

dans

−1 1 0 1
E, « au hasard » (1, 0, 0), formons A − I =  −1 1 0  d’où (A − I)  0  =
   
−1 1 0 0
   
−1 −1
 −1  et (A − I)  −1  = 0. Donc ((−1, −1, −1), (1, 0, 0)) peut être choisi pour
   
−1 −1
constituer la base associée au bloc de longueur 2. En lui ajoutant le vecteur (0, 0, 1),
vecteur propre évident, non colinéaire à (−1, −1, −1), nous savons que dans la base
((−1, −1, −1), (1, 0, 0), (0, 0, 1)) l’endomorphisme associé à A dans la base canonique
de R3 sera représenté par
   
1 1 0 −1 1 0
T = P −1 AP = 
 0 1 0 

 −1 0 0  .
où P =  
0 0 1 −1 0 1
26
Systèmes différentiels linéaires.

La réduction des endomorphismes est très utilisée dans la résolution des systèmes
linéaires d’équations différentielles :
Y 0 (t) = A Y (t) , (E)
où Y est une fonction (inconnue) de R dans Rn , A ∈ Mn×n (R) est une matrice de réels,
carrée de taille n. Nous allons voir comment, d’abord d’un point de vue théorique.
Dans le cas particulier n = 1, la matrice est réduite à un scalaire a, et la solution de
y 0 (t) = ay(t), partant de y0 à l’instant 0 est :
y(t) = eat y0 .
On peut définir eat comme la somme de la série entière, de rayon de convergence infini,
P n n
a t /n!. Sa dérivée est :
tn−1 n X tm
am .
X
a =a
n>1 (n−1)! m>0 m!
Cette écriture formelle reste valable en dimension n. Pour trouver une solution à l’équa-
tion (E), il suffit d’écrire de manière analogue
Y (t) = ( (tn /n!)An )Y (0). Encore faut-il s’assurer que cette série entière, à coefficients
P
matriciels, converge, ce que nous admettrons.

Proposition 11. Soit M ∈ Mn×n (R) une matrice carrée. La série suivante converge
dans Mn×n (R) :
1 1
I + M + M2 + · · · + Mk + · · · .
2! k!
La somme de cette série est appelée exponentielle de la matrice M et notée exp(M ).
L’exponentielle de matrice a des propriétés comparables à l’exponentielle ordinaire.
En particulier :
Proposition 12. Si deux matrices M1 et M2 commutent, alors :
exp(M1 + M2 ) = exp(M1 ) exp(M2 ) .
La propriété qui nous intéresse est la suivante :

Proposition 13. Soit A ∈ Md×d (R). Alors :
d
exp(tA) = A exp(tA) .
dt
Il s’ensuit immédiatement que Y (t) = exp(tA)y0 est solution de (E), pour Y (0) = y0 .
Le résultat suivant relie les coefficients de exp(tA) aux valeurs propres de la matrice
A.
27
Théorème 8. Soit A ∈ Mn×n (R). Notons λ1 , . . . , λk les valeurs propres de A (réel-

les ou complexes), et pour tout i = 1, . . . , k, notons mi la multiplicité de λi dans le
polynôme minimal de A. Pour tout j = 0, . . . , mi −1, notons fi,j la fonction (réelle ou
complexe), définie par :
fi,j (t) = tj eλi t .
Alors tous les coefficients de la matrice exp(tA), de même que ceux de toute solution
de (E) sont combinaison linéaire des fi,j (t) , i = 1, . . . , k , j = 0, . . . , mi −1.
Démonstration : Nous utiliserons la réduction de Jordan de la matrice A :
J(A) = P −1 AP .
La matrice J(A) est une matrice diagonale par blocs. À chaque valeur propre λi de
A est associé un bloc Bi , qui est la somme de λi I et d’un bloc nilpotent Ni dont la
puissance mi -ième est nulle. Sur la définition de l’exponentielle, il est facile de vérifier
que :
exp(P M P −1 ) = P exp(M )P −1 .
De plus si M est diagonale par blocs, alors exp(M ) l’est aussi et ses blocs sont les
exponentielles des blocs de M . Ces observations montrent que les coefficients de exp(tA)
sont des combinaisons linéaires des coefficients des exp(tBi ). Or :
exp(tBi ) = exp(λi tI + tNi ) = exp(λi tI) exp(tNi ) = eλi t exp(tNi ) .
La matrice Ni est constituée de blocs de Jordan Jm de dimension m 6 mi . On obtient :

t2 tm−1
 
1 t ...
2 (m−1)!
... ...
 
0 1
 
 
..
 
exp(tJm ) =  .. .. t2
 ,

 . . . 2



 t 

0 ... 0 1
Exemple 1.
Considérons la matrice A suivante :
 
5 1 −1
A =  1 3 −1  .
 
2 0 2
Sa forme de Jordan est :  

2 0 0
 0 4 1  .
J(A) =  
0 0 4
28
L’exponentielle de tJ(A) est :
e2t 0
 
0
exp(tJ(A)) =  0 e4t te4t 

 .
4t
0 0 e
Si (y1 (t), y2 (t), y3 (t)) est solution du système ci-dessous, les fonctions y1 (t), y2 (t), y3 (t)
sont nécessairement des combinaisons linéaires de e2t , e4t et te4t .
y10 (t) = 5y1 (t) + y2 (t) − y3 (t)




y20 (t) = y1 (t) + 3y2 (t) − y3 (t)
 0

y3 (t) = 2y1 (t) + 2y3 (t) .
Par exemple la solution du système pour y1 (0) = y2 (0) = y3 (0) = 1 est :
y1 (t) = e4t + te4t




y2 (t) = (1/2)e2t + (1/2)e4t
y3 (t) = (1/2)e2t + (1/2)e4t + te4t .


Après avoir résolu un système différentiel linéaire à coefficient constants avec une dé-
marche théorique utilisant l’exponentielle de la matrice du système, voyons comment
dans la pratique on effectue cette recherche, et refaisons le chemin sur des exemples.
(Les répétitions avec ce qui précède sont volontaires).
Exemple 2.
Nous voulons résoudre le système différentiel (réel)
(
x0 (t) = x(t) + 3y(t)
y 0 (t) = x(t) − y(t)
où t 7→ x(t) et t 7→ y(t) sont deux fonctions inconnues

! de R+ dans R et cela connaissant
1 3
x0 = x(0) et y0 = y(0). Posons A = et cherchons à diagonaliser A. Calculons
1 −1
donc son polynôme caractéristique

1−λ 3
PA (λ) = = (λ − 2)(λ + 2) .

1 −1 − λ

Comme ce polynôme caractéristique admet deux racines distinctes (de multiplicité 1),
nous savons que nous pourrons diagonaliser A.
Recherchons le sous espace propre associé à λ1 = 2. Il faut résoudre
! ! !
1−2 3 x 0
= ,
1 −1 − 2 y 0
d’où x = 3y et donc (x, y) = y(3, 1) et donc {(3, 1)} est une base de Ker(A − 2I).
29
Recherchons le sous espace propre associé à λ1 = −2. Il faut résoudre

! ! !
1+2 3 x 0
= ,
1 −1 + 2 y 0
! = x(1, −1) et donc {(1, −1)} est !une base de Ker(A + 2I).
d’où x + y = 0 et donc (x, y)
3 1 2 0
Posons P = , alors D = P −1 AP = . En termes de système
1 −1 0 −2
différentiel :
! ! ! ! !
d x x d −1 x −1 x −1 x
=A ⇐⇒ P =P A = DP
dt y y dt y y y
! !
X −1 x
Posons donc =P :
Y y
! ! (
d X X X 0 (t) = 2X(t)
=D ⇐⇒
dt Y Y Y 0 (t) = −2Y (t)
Ainsi la diagonalisation a découplé les nouvelles fonctions inconnues. Il existe deux

constantes réelles k1 et k2 telles que X(t) = k1 e2t et Y (t) = k2 e−2t . En revenant à la
définition de X et de Y
! ! ! !
x(t) X(t) 3 1 k1 e2t
=P =
y(t) Y (t) 1 −1 k2 e−2t
Pour t = 0 il reste ! !
x0 k1
=P
y0 k2
et donc ! ! ! !
k1 −1 x0 1 1 1 x0
=P =
k2 y0 4 1 −3 y0
La solution du système est

3x0 + 3y0 2t x0 − 3y0 −2t

 x(t) = e + e
4 4

 x0 + y0 2t x0 − 3y0 −2t
 y(t) =

e − e
4 4
Ou encore : ! ! !
x(t) 4
e + 41 e−2t
3 2t
4
(e − e−2t )
3 2t
x0
= .
y(t) 4
(e − e−2t )
1 2t
4
e + 34 e−2t
1 2t
y0
La matrice !
4
e + 14 e−2t
3 2t
(e − e−2t )
3 2t
4
R(t) =
4
(e − e−2t )
1 2t
e + 34 e−2t
1 2t
4
30
d
vérifie dt R(t) = A R(t) et R(0) = I. C’est l’exponentielle de At. On la nomme résolvante
du problème de Cauchy consistant à trouver la solution du système connaissant sa valeur
en t = 0. Cette solution du système est donnée explicitement en fonction des conditions
initiales (x0 , y0 ). Au passage, nous avons obtenu une solution définie sur R tout entier,
et nous pourrions démontrer ainsi l’existence et l’unicité de la solution au problème de
Cauchy. Cela ne survient que parce que le système est linéaire à coefficients constants
(sinon le domaine de définition de la solution n’est pas R, a priori). Noter que les
coefficients constants interviennent de manière cruciale dans
" !# !
d x d x
P −1 =P −1
.
dt y dt y
Si les coefficients de la matrice A ne sont pas constants n’utilisez pas la diagonalisation !

Exemple 3.
Considérons le système (
x0 (t) = 2x(t) − y(t)
x0 (t) = x(t) − y(t)
où t 7→ x(t) et t 7→ y(t) sont deux fonctions inconnues
! de R+ dans R et cela connaissant
2 −1
x0 = x(0) et y0 = y(0). Posons A = et cherchons à diagonaliser A. Calculons
1 2
donc son polynôme caractéristique

2 − λ −1

PA (λ) =
= (λ − 2)2 + 1 .
1 2−λ

Comme le polynôme caractéristique n’admet pas de racines dans R, la méthode

précédente semble tomber à l’eau.
Nous pourrions décider de passer dans C. Pour cela factorisons PA (λ) comme po-
lynôme à coefficients complexes.
PA (λ) = (λ − 2 − i)(λ − 2 + i)
et nous obtenons deux racines complexes λ1 = 2 + i et λ2 = 2 − i de multiplicité 1. Nous

pourrions donc diagonaliser comme dans l’exemple de la rotation en passant dans C2 .
Qu’obtiendrait-on ? Une fois tous les calculs faits nous aurions
(
x(t) = Ae(2+i)t + Be(2−i)t
y(t) = Ce(2+i)t + De(2−i)t
où A, B, C et D sont des constantes complexes reliées par deux relations.

Comme nous manquons de courage pour ces calculs, nous allons procéder à l’envers,
en faisant la remarque suivante : oui il y a bien un moyen de soutirer de la résolution
complexe la résolution réelle, en regroupant de manière astucieuse les vecteurs propres
complexes associés à une valeur propre complexe et à sa conjuguée (comme le polynôme
31
caractéristique est à coefficients réels, si un complexe est racine, alors son complexe
conjugué aussi). Cela aura comme conséquence de choisir A et B de sorte que x devienne
réel et aussi C et D de sorte que y deviennent réel. Autrement dit la solution réelle
sera de la forme (
x(t) = ae2t cos t + be2t sin t
y(t) = ce2t cos t + de2t sin t
où a, b, c et d sont des constantes réelles reliées par deux relations. (Attention a n’est
pas la partie réelle de A. . . ) Concrètement il y a deux racines complexes 2 + i et 2 − i,
il faut séparer la partie réelle donnant e2t et la partie imaginaire pure donnant cos t
et sin t). Mais je n’ai toujours pas les relations en question puisque je n’ai pas fait les
calculs, direz vous ! Oui, mais puisque nous savons que la solution sera de cette forme,
pourquoi ne pas faire les calculs à l’envers et reporter la forme ci-dessus dans le système
de départ ? Ainsi, nous aurons les relations recherchées, et nous n’aurons pas besoin
d’effectuer la diagonalisation complexe ! De fait les calculs sont beaucoup plus rapides
et simples, et conduisent bien au résultat.
Nous utilisons donc la diagonalisation complexe uniquement pour connaître la forme
de la solution, mais ce passage est crucial.
Si a, b, c et d sont 4 constantes réelles, reportons donc la forme indiquée dans le
système initial brut.
(
x0 (t) = e2t ((2a + b) cos t + (2b − a) sin t)
y 0 (t) = e2t ((2c + d) cos t + (2d − c) sin t)
devrait donner
(
x0 (t) = 2x − y = e2t ((2a − c) cos t + (2b − d) sin t)
y 0 (t) = x + 2y = e2t ((a + 2c) cos t + (b + 2d) sin t)
et nous obtenons
2a + b = 2a − c



2b − a = 2b − d




 2c + d = a + 2c
2d − c = b + 2d

ou encore b = −c, a = d donc

(
x(t) = ae2t cos t + be2t sin t
y(t) = −be2t cos t + ae2t sin t
(
x0 = a
et pour t = 0, . La solution du système est donc
y0 = −b
(
x(t) = e2t (x0 cos t − y0 sin t)
y(t) = e2t (y0 cos t + x0 sin t)
32
ou encore mieux
! ! !
x(t) e2t cos t −e2t sin t x0
= .
y(t) e2t sin t e2t cos t y0
La matrice !
e2t cos t −e2t sin t
R(t) =
e2t sin t e2t cos t
vérifie dR
dt
= AR et R(0) = I. Elle est la résolvante du problème de Cauchy posé
initialement.
Comme vous l’avez constaté sur l’exemple ci dessus, la réduction à la forme diago-
nale a été cruciale pour connaître la forme de la solution d’un système réel dY
dt
= AY ,
où A est une matrice constante. Et si la matrice A n’est pas diagonalisable ? Comme
nous disposons de la réduction de Jordan et que nous avons compris théoriquement
la démarche à effectuer nous avons (sans nous en rendre compte) justifié la démarche
pratique proposée souvent par les physiciens.
Recette pratique.
Soit à résoudre dY
dt
= AY , où Y (t) = (y1 (t), . . . , yn (t) est un n-uplet de fonctions
inconnues et A est une matrice constante.
1. Trouver les valeurs propres réelles ou complexes et leurs multiplicités : mettons
λ1 , . . . , λk de multiplicités m1 , . . . , mk sont les racines du polynôme caractéris-
tique PA (x) = det(A − XI) (avec n = m1 + · · · + mk ).
2. Trouver les dimensions des sous espaces propres 1 6 si = dim Ker(A − λi I) 6 mi .
3. Séparer les valeurs propres réelles des valeurs propres complexes.
4. À une valeur propre réelle, mettons λj , on associe t 7→ eλj t Γj (t) où Γj (t) est un
polynôme réel de degré mj − sj .
5. Chaque valeur propre complexe doit être associée à la valeur propre complexe
conjuguée (qui est aussi valeur propre puisque le polynôme caractéristique est à
coefficients réels). Disons λj = aj + ibj et λj = aj − ibj : à ce couple on associe
les fonctions t 7→ (Γj (t) cos bj t + ∆j (t) sin bj t)eaj t où Γj et ∆j sont des polynômes
réels de degré mj − sj . Ce faisant on introduit trop de constantes réelles !
6. On reporte dans le système initial la somme des fonctions génériques introduites
dans 4) et 5), mais pour chaque fonction inconnue, on introduit des constantes
différentes. (Comme on ne possède pas la matrice de passage de la base cano-
nique à une base qui réduit l’endomorphisme, cela revient à prendre les coefficients
de la matrice P −1 T P où T est la forme réduite de l’endomorphisme de manière
quelconque, en ne retenant que l’idée que chaque élément sera une combinaison li-
néaire des fonctions génériques de 4) et 5) et donc chaque fonction inconnue aussi).
On en introduit donc beaucoup trop ! On constate que le nombre de constantes
introduites est bien n la dimension du système, une fois toutes les équations du
système vérifiées. La recette dit que cela marche sans expliquer pourquoi ! Il faut
33
pour cela résoudre les systèmes linéaires obtenus (en identifiant les coefficients
des fonctions génériques qui forment un système libre dans l’espace vectoriel des
fonctions réelles d’une variable réelle) et ramener le nombre de constantes à n.
7. On a obtenu la forme de la solution générale dépendant de n constantes réelles, on
y fait t = 0 et on extrait l’expression de ces constantes en fonction des conditions
initiales (cela peut être redoutable si n est grand, uniquement possible numéri-
quement et/ou de manière approchée !).
(fin de la recette)
Dans la recette précédente, rien n’est démontré, on affirme simplement que cela
marche, mais c’est une conséquence du théorème 8 comme expliqué au dessus ! En fait
la recette reste dans la base canonique de Rn , introduit beaucoup trop de constantes,
puis en vérifiant le système « à l’envers », calcule directement le produit P −1 T P qui
donne la solution générale, et cela dans la base canonique de Rn , sans avoir besoin
de calculer la matrice de passage P , ni T ni P −1 , ni la solution générale dans la
nouvelle base, ni le retour à l’ancienne base ! C’est pour cela que la recette est rapide
et efficace. Pour la justifier il faut simplement démonter la formule A = P −1 T P avec
T sous forme de Jordan (pensez à triangulaire supérieure avec des coefficients non nuls
uniquement sur la diagonale et sur la « diagonale juste au dessus »), puis refaire le
passage réels→complexes→réels comme expliqué dans l’exemple 3.
De plus on peut aussi sauter l’étape 2 et prendre les polynômes Γj et ∆j de degré
mj − 1 > mj − sj . On introduit alors encore d’autres constantes inutiles. Les systèmes
linéaires obtenus, de taille plus grande, vont rendre nulles ces constantes inutiles, ce qui
embrouille souvent la compréhension de ce que l’on fait. C’est souvent la méthode pré-
sentée par les physiciens. Cela revient à utiliser P −1 T P avec T sous forme triangulaire
supérieure, sans essayer à savoir si T peut être mise sous une forme plus intrinsèque,
décomposant Rn en sous espaces stables par A. Comme le comportement du système
différentiel, localement et globalement est profondément lié à cette décomposition en
sous espaces stables, décortiquer le comportement du système différentiel demande de
comprendre la décomposition de Jordan. Cela revient à décomposer le système en un
certain nombre de sous-systèmes indépendants et analyser le comportement de chacun
des sous-systèmes possibles, ceux qui correspondent à la découverte de Jordan.
Exemple 4.
On veut résoudre le problème de Cauchy, consistant à trouver
(x(t), y(t), z(t)) définies sur [0, tmax [, telles que (x(0), y(0), z(0)) = (x0 , y0 , z0 ) et
    
x(t) 2 2 3 x(t)
d 
y(t) 
=  0

2 −1 
  y(t) 
 
dt
 
z(t) 0 0 1 z(t)
On pose  
2 2 3
 0 2 −1 
A= 
0 0 1
34
Le polynôme caractéristique est PA (X) = (2 − X)2 (1 − X). Recherchons donc les

fonctions inconnues comme combinaisons linéaires proposées par la recette
x = e2t (at + b) + cet




y = e2t (dt + e) + f et
z = e2t (gt + h) + ket


D’une part  dx
 dt
 = e2t (2at + 2b + a) + cet
dy
dt
= e2t (2dt + 2e + d) + f et
dz
= e2t (2gt + 2h + g) + ket


dt
d’autre part
2x + 2y + 3z = (2at + 2b + 2dt + 2e + 3gt + 3h)e2t + (2c + 2f + 3k)et




2y − z = (2dt + 2e − gt − h)e2t + (2f − k)et
z = e2t (gt + h) + ket


Nous avons donc un système linéaire de trois équations. L’identification des coefficients
de et et e2t dans la troisième, puis la seconde, puis la première équation donne :
  

 2g = g 
 2d = 2d − g 
 2a = 2a + 2d + 3g
2h + g = h 2e + d = 2e − h 2b + a = 2b + 2e + 3h
= 2f − k
  

k = k 
f 
c = 2c + 2f + 3k
On en déduit g = h = 0, (ces constantes sont nulles parce que le système initial était
triangulaire supérieur, pas parce que l’on avait sauté l’étape deux, qui donnerait ici le
même nombre de constantes) puis f = k puis d = 0 , a = 2e et c = −5k. Il vient :
x(t) = e2t (2et + b) − 5ket




y(t) = e2t (e) + ket
z(t) = ket


Pour t = 0 on obtient 

 x0 = b − 5k
y0 = e + k


z0 = k
Finalement,
x(t) = e2t (2(y0 − z0 )t + (x0 + 5z0 )) − 5z0 et



y(t) = e2t (y0 − z0 ) + z0 et


z(t) = z0 e
La solution est donc
e2t 2te2t (−2e2t + 5e2t − 5et )
    
x(t) x0
   2t
 y(t)  =  0 (te + e )2t
(−te2t − e2t + et )   y0  .
 
z(t) 0 0 et z0
35
La matrice
e2t 2te2t (−2e2t + 5e2t − 5et )
 
R(t) =  0 (te2t + e2t ) (−te2t − e2t + et ) 

 
0 0 et
vérifie dR(t)
dt
= A.R et R(0) = I. C’est la résolvante du problème posé. Difficile de faire
plus rapide pour l’obtenir !
Équations aux différences.
Pour terminer, nous allons démontrer deux résultats très proches, portant l’un sur les
équations de récurrence, l’autre sur les équations différentielles. Vous connaissez déjà
ces résultats dans le cas n = 2. Soient a0 , . . . , an−1 n réels. Notons Q le polynôme
Q = X n − (an−1 X n−1 + · · · + a1 X + a0 ) .
Notons λ1 , . . . , λk les racines de Q, et m1 , . . . , mk leurs multiplicités.

k
(X − λi )mi .
Y
Q=
i=1
Théorème 9. Considérons l’équation :
(Er ) ∀k ∈ N , uk+n = a0 uk + a1 uk+1 + · · · + an−1 uk+n−1 .
Toute solution de (Er ) s’écrit :

i −1
k mX
αi,j nj λni ,
X
un =
i=1 j=0
où les n coefficients αi,j , i = 1, . . . , k , j = 0, . . . , mi −1 sont réels ou complexes.
Théorème 10. Considérons l’équation :
(Ed ) y (n) (t) = a0 y(t) + a1 y 0 (t) + · · · + an−1 y (n−1) (t) ,
Toute solution de (Ed ) s’écrit :

i −1
k mX
αi,j tj eλi t ,
X
y(t) =
i=1 j=0
où les n coefficients αi,j , i = 1, . . . , k , j = 0, . . . , mi −1 sont réels ou complexes.
Démonstration : Les deux problèmes ont en commun leur écriture matricielle. Posons
pour tout k ∈ N
Uk = (uk , uk+1 , . . . , un−1+k ) et Y (t) = (y(t), y 0 (t), . . . , y (n−1) (t))
36
Les deux équations (Er ) et (Ed ) s’écrivent :

Uk+1 = Uk A et Y 0 (t) = Y (t) A ,
où A est la matrice compagnon du polynôme Q.
 
0 0 . . . . . . 0 a0

.. .. .. 

 1 . . . a1


.. . . .. ..
 
0 . . . .
 
 
A= 
 .. ... ... ..



 . 0 . 

 .. ... ... 

 . 0 an−2 

0 . . . . . . 0 1 an−1
Les solutions sont :
Uk = U0 Ak et Y (t) = Y (0) exp(tA) .
Nous avons déjà vu que le polynôme minimal et le polynôme caractéristique de la
matrice A sont tous les deux égaux à Q, au signe près. La réduction de Jordan de A
est de la forme
P −1 AP = J(A) ,
où J(A) est une matrice diagonale par blocs. À chaque valeur propre λi de A est
associé un bloc Bi . Ce bloc a pour taille la multiplicité mi de λi dans le polynôme
caractéristique. Il est la somme de λi I et d’un bloc nilpotent Ni dont la puissance
mi -ième est nulle.
Pour le théorème 9,
An = P (J(A))n P −1 .
Si une matrice M est diagonale par blocs, alors M n l’est aussi et ses blocs sont les
puissances n-ièmes des blocs de M . Ces observations montrent que les coefficients de
An sont des combinaisons linéaires des coefficients des Bin . Or les puissances successives
de Ni sont nulles à partir de la mi -ième. On a :
Bin = (λi Idi + Ni )n
n
!
X n n−j j
= λi Ni
j=0 j
n(n−1) n−2 2
= λni Idi + nλn−1
i Ni + λi Ni
2
n(n−1) . . . (n−mi + 2) n−mi +1 mi −1
+··· + λi Ni .
(mi −1)!
Tous les coefficients de Bin sont donc des combinaisons linéaires de
λni , nλni , . . . , nmi −1 λni .
37
C’est donc aussi le cas pour les coefficients de An .

Pour exp(tA), le raisonnement est celui de la démonstration du théorème 8.
38
2 Entraînement
2.1 Vrai ou Faux
Vrai-Faux 1. Parmi les affirmations suivantes lesquelles sont vraies, lesquelles sont
1. Toute matrice admet au moins une valeur propre, réelle ou complexe.
2. Toute matrice admet une infinité de vecteurs propres, à coordonnées réelles ou
complexes.
3. Toute matrice réelle 2 × 2 admet une valeur propre réelle.
4. Toute matrice réelle 3 × 3 admet une valeur propre réelle.
5. Toute matrice réelle 2 × 2 admet un vecteur propre à coordonnées réelles.
6. Toute matrice réelle 3 × 3 admet un vecteur propre à coordonnées réelles.
7. Si une matrice 2 × 2 n’est pas diagonalisable dans C, alors elle admet une seule
valeur propre.
8. Si une matrice est triangulaire, alors ses valeurs propres sont ses éléments
diagonaux.
9. Toute matrice a au moins deux valeurs propres distinctes.
10. Deux matrices semblables ont les mêmes valeurs propres.
11. Les valeurs propres du produit de deux matrices sont les produits des valeurs
propres des deux matrices.
12. Si un vecteur est vecteur propre pour deux matrices, il est vecteur propre de
leur produit.
13. Les valeurs propres d’une matrice et celles de sa transposée sont les mêmes.
14. Les vecteurs propres d’une matrice et ceux de sa transposée sont les mêmes.
15. Le produit d’une matrice par un de ses vecteurs propres ne peut pas être le
vecteur nul.
16. Si une matrice a toutes ses valeurs propres réelles, alors elle est diagonalisable.
17. Si une matrice n×n a n valeurs propres distinctes, alors elle est diagonalisable.
18. La somme des valeurs propres d’une matrice est égale au produit de ses élé-
ments diagonaux.
19. Le produit des valeurs propres d’une matrice est égal à son déterminant.
π
20. La matrice de la rotation vectorielle d’angle 6
dans le plan admet des valeurs
propres réelles.
21. La matrice d’une symétrie vectorielle dans le plan a pour valeurs propres +1
et −1.
39
22. Si v est vecteur propre d’une matrice, alors −v est aussi vecteur propre de
cette matrice.
23. Si v et w sont vecteurs propres d’une même matrice, alors v + w est toujours
vecteur propre de cette matrice.
Vrai-Faux 2. Soit A une matrice de taille n et λ une de ses valeurs propres. Parmi les
1. 0 est valeur propre de (A − λI)(A + λI).
2. 0 et 1 sont valeurs propres de A2 − A.
3. (λ2 − 1) est valeur propre de (A − I)(A + I).
4. Le rang de la matrice A − λI est égal à n − 1.
5. L’ensemble des solutions x du système (A − λI)x = 0 n’est pas réduit au
vecteur nul.
6. Le système linéaire Ax = λy admet une solution x non nulle, pour tout y.
7. Le système linéaire Ax = λx admet une solution x non nulle.
8. La matrice des cofacteurs de A − λI a toutes ses lignes proportionnelles.
9. La matrice des cofacteurs de A − λI ne peut pas être nulle.
10. Si A est diagonalisable, la dimension du sous-espace propre associé à λ est
égale à la multiplicité de λ.
11. La dimension du sous-espace propre associé à λ est 1 si et seulement si la
multiplicité de λ est 1.
12. Si la multiplicité de λ est 1, alors toutes les lignes de la matrice des cofacteurs
appartiennent au sous-espace propre de A associé à λ.
13. Si la multiplicité de λ est 1, alors toutes les lignes de la matrice des cofacteurs
sont des vecteurs propres de A associés à λ.
1
− 12 3
 
2 2
Vrai-Faux 3. On considère la matrice A = 

− 21 1
2
1
.
Parmi les affirmations
2

0 0 2
1. Les colonnes de A sont des vecteurs indépendants.
2. A admet 0 pour valeur propre.
4. La somme des valeurs propres de A vaut 2.
5. Tout vecteur propre de A associé à la valeur propre 0 a sa troisième coordonnée
nulle.
6. La matrice A + I est de rang 2.
40
7. Le déterminant de A − I est nul.

 
1
 0  est vecteur propre de A.
8. Le vecteur 

−1
 
−1
9. Le vecteur  0  est vecteur propre de A.
 
−1
 
−1
 1  est vecteur propre de A.
10. Le vecteur 

0
 
0
 
0
 
1 0 0
12. A est semblable à la matrice  0 2 0 .
 
0 0 0
 
1 0 0
13. A est semblable à la matrice  0 2 0  .
 
0 0 1
 
0 0 0
5
14. A est semblable à la matrice  0 1 0 

.
0 0 25
1
− 12 3
 
2 2
Vrai-Faux 4. On considère la matrice A = 
 − 21 1
2
− 12 .

0 0 1
4. A n’admet pas d’autre valeur propre que 0 et 1.
nulle.
nulle.
7. La matrice A − I est de rang 2.
8. 1 est valeur propre simple de A.
9. A est diagonalisable.
41
 
1
 
−1
 
0 0 0
11. A est semblable à la matrice  0 1 1 

.
0 0 1
 
0 0 0
∗ n
12. Pour tout n ∈ N , A est semblable à la matrice  0 1 n .
 
0 0 1
1
− 12 1
 
2 2
Vrai-Faux 5. On considère la matrice A = 

− 21 1
2
1
2 .

0 0 1
4. A n’admet pas d’autre valeur propre que 0 et 1.
nulle.
nulle.
7. La matrice A − I est de rang 2.
8. 1 est valeur propre simple.
9. A est diagonalisable.
 
−1
 
−1
 
0 0 0
 0 1 0 .
11. A est semblable à la matrice  
0 0 1
∗ n
12. Pour tout n ∈ N , A = A.
!
1 −1
Vrai-Faux 6. On considère la matrice A = . Parmi les affirmations suivantes
1 1
1. Le produit des valeurs propres de A est 2.
2. A admet une valeur propre réelle.
42
!
1
3. Le vecteur est vecteur propre de A.
i
!
i
1
!
−i
1
π
6. 2ei 4 est valeur propre de A.
√ 7π
7. 2ei 4 est valeur propre de A.
!
2i 0
8. Le carré de A est semblable à la matrice .
0 2i
!
i
2
0
9. Le carré de l’inverse de A est semblable à la matrice .
0 − 2i
un+1 = un − vn


10. Si les suites (un ) et (vn ) sont solution du système alors
vn+1 = un + vn

elles sont périodiques, de période 8.
un+1 = un − vn


11. Si les suites (un ) et (vn ) sont solution du système alors les
vn+1 = un + vn

n/2 n/2
suites (un /2 ) et (vn /2 ) sont périodiques, de période 8.
2.2 Exercices
Exercice 1. Pour chacune des matrices A suivantes.
1. Déterminer son polynôme caractéristique.
2. Diagonaliser la matrice A.
3. Déterminer son polynôme minimal.
4. Pour n > 2, donner une expression de An en fonction de An−1 et An−2 .
! ! ! ! ! !
1 −1 1 −2 −1 2 4 1 0 1 −3 2
; ; ; ; ;
0 0 0 −1 4 1 2 5 −2 3 −4 3

4. Pour n > 3, donner une expression de An en fonction de An−1 , An−2 , An−3 .
43
       
3 1 1 3 1 1 −1 −2 −2 1 −2 −2
 2

3 2  ;  1 3
 
1  ;  −3 −1 −3  ;  2
   
1 2 

−2 −1 0 −1 1 1 3 2 4 −2 2 1
       
1 0 0 1 0 0 1 −1 −1 4 −3 −2
 0 1 0 
 ;  0 1  ;  −2
0  0  ;  2 −1 −2 
1 
    
2 0 −1 2 −4 −1 2 2 1 3 −3 −1
       
1 −1 −1 3 −2 −1 −1 2 0 1 2 2
 −1 1 1  ;  1 0 −1  ;  0 1 0  ;  0 −1 −2 
      

1 1 1 2 −2 0 −2 2 1 0 0 1
3. Déterminer le polynôme minimal de A.
4. Pour n > 4, donner une expression de An en fonction de An−1 , An−2 , An−3 , An−4 .
−2 −3 0 −3 −1 −2 0 −2 −1 −2 0 −2
     
 3 4 −1 2 
  2
 3 0 2 
  2
 3 1 3 
 ;   ; 
 
 3 3 1 3 2 2 1 2 2 2 1 2 
 
   
−3 −3 1 −1 −2 −2 0 −1 −2 −2 1 −2
1 −1 −1 −1 −1 1 0 1 2 1 0 −1
     
 0 0 1 1   0 0 0 1   2 1 0 −1 
 ;  ; 
     
0 0 −1 0   2 −2 1 0 2 −2 2 0 
  
  
0 −1 −1 0 0 1 0 0 −2 1 0 3
0 1 0 0 −1 2 0 0 0 1 1 1
     
 0 1 0 0   0 1 0 0   −2 1 2 0 
;  ; 
     
3 −2 1 −1 5 −4 1 −1 1 1 0 1
   
     
−2 1 0 2 −3 2 0 2 −1 1 1 2
Exercice 4. Diagonaliser les matrices symétriques suivantes, en trouvant pour chacune
une base orthonormée de vecteurs propres.
       √ 
0 1 0 1 0 0 2 −2 2 √ 1 − 2 0
 1

0 0   ;  0

0 −1   ;  −2 −1 −5  ;  − 2
  
2 0 

0 0 2 0 −1 0 2 −5 −1 0 0 0
       
0 0 1 3 −1 0 1 4 1 7 4 −5

 0 1 0  ;  −1
 
3 0 
 ; 

4 −2 4  ;  4 −2
 
4 

1 0 0 0 0 −2 1 4 1 −5 4 7
44
Exercice 5. Diagonaliser les matrices symétriques suivantes, en trouvant pour chacune

une base orthonormée de vecteurs propres.
1 1 −1 1 0 1 1 0 1 1 −1 1
     
 1 −1 1 1   1 0 0 −1   1
  1 1 −1 
;   ; 
   
−1 1 1 1 1 0 0 1   −1 1 1 1 
  
  
1 1 1 −1 0 −1 1 0 1 −1 1 1
1 −1 5 −1 −1 1 3 1 1 1 1 1
     
 −1 3 −1 3   1 −1 1 3   1 −1 1 3 
;  ; 
     
5 −1 1 −1 3 1 −1 1 1 1 1 1
   
     
−1 3 −1 3 1 3 1 −1 1 3 1 −1
3. Montrer que A n’est pas diagonalisable
4. Calculer une décomposition de Jordan de A.
! ! ! ! ! !
−3 1 −1 1 3 −1 1 −1 0 −1 5 1
; ; ; ; ;
−1 −1 −1 −3 1 1 1 3 1 2 −1 3
       
3 1 1 0 −1 −1 0 −1 −1 1 0 0
 1 2 0   ;  −1 1 −1   ;  0 0 −1 
 ;  0 0 −1 
   

−1 0 2 2 1 3 1 2 3 0 1 2
       
1 1 1 2 −1 −1 −1 4 2 1 0 1
 −1 0 0  ;  2 −1 −1  ;  1 −1 −1  ;  0 1 1 
      

1 0 0 1 −1 0 0 4 1 1 −1 1
       
−1 0 1 3 −3 −2 2 0 1 1 −3 −2

 0 −1 1 ;
 
  1 −1 −1 ;
 
  0 2 1  ;
 

1 −3 −1 

1 −1 −1 0 1 1 1 −1 2 0 1 −1
45

−1 −2 0 −2 0 −1 0 −1 0 −1 1 0
     
 2 4 1 4   2 4 1 4   2 4 −1 2 
 ;   ; 
     
 2 3 1 3   1 2 1 2   1 2 0 1
 

−2 −3 −1 −3 −1 −2 −1 −2 −1 −2 1 0
0 −1 0 −1 0 −1 1 0 1 0 1 1
     
 2 4 0 3   2 3 −1 1   0 2 −1 0 
 ;  ; 
     
1 2 1 2   1 1 0 0 0 1 0 0
  
   
−1 −2 0 −1 −1 −1 1 1 0 −1 1 1
1 −1 0 −1 −3 −1 1 0 −1 1 0 0
     
 1 4 1 3   2 1 −1 2   −1 −3 0 0 
 ;  ; 
     
1 2 2 2   1 2 −3 1 0 1 −1 1
  
   
−1 −2 −1 −1 −1 −2 1 −3 1 0 −1 −3
0 2 2 0 −2 2 2 1 −1 1 0 1
     
 0 3 −1 1   1 1 −1 0   −2 0 −1 0 
;  ; 
     
0 −2 2 −2 −4 2 4 1 3 −2 1 −1
   
     
0 −1 −1 1 1 −1 −1 0 −1 1 0 1
−1 1 1 1 0 1 3 −1 0 2 1 2
     
 −3 2 2 1   0 1 1 −1   −2 2 0 1 
;   ; 
     
2 −1 −1 0 0 −1 1 −1   3 −5 −1 −4
  
   
0 0 0 0 0 0 −2 2 −1 2 1 3
Exercice 9. On considère la matrice A suivante.
 
3 1 1
A =  −2 0 −2 
 .

3 3 5
1. Diagonaliser A.
2. En utilisant la forme diagonale de A, calculer les coefficients de An pour tout
n ∈ Z.
3. Déterminer le polynôme minimal de A. En déduire l’expression de A2 et de A−1
en fonction de A et I.
4. Déduire de la question précédente l’expression de An en fonction de A et I pour
tout n ∈ Z.
 
1 0 −1
A= 1

1 −2 
 .
1 −1 0
46
1. Déterminer le noyau de la matrice A.

2. Calculer le polynôme caractéristique de A.
3. Montrer que A n’est pas diagonalisable et donner son polynôme minimal.
4. Donner une décomposition de Jordan de A.
5. Donner l’expression de An en fonction de n.
Exercice 11. Soit A une matrice 2 × 2 à coefficients dans R. On suppose que A admet
une valeur propre complexe λ ∈ C \ R.
1. Montrer que A est diagonalisable dans C.
2. On suppose qu’il existe n ∈ N et a ∈ R tel que a soit valeur propre de An .
(a) Montrer que An = aI.
2π
(b) Montrer que l’argument de λ est un multiple de n
.
Exercice 12. Soit A une matrice 2×2 à coefficients dans C. Montrer que la suite (An )n∈N
converge vers la matrice nulle, si et seulement si les modules des valeurs propres de A
sont strictement inférieurs à 1.

 
4 −1 −2
1
A=  2 1 −2 
 .
3
1 −1 1
1. Déterminer les valeurs propres de A.

2. Soit v un vecteur quelconque de R3 . Montrer que la suite (An v)n∈N converge soit
vers le vecteur nul, soit vers un vecteur propre de A associé à la valeur propre 1.
3. Montrer que  
1 0 −1
n
lim A =  1

0 −1 
 .
n→+∞
0 0 0
Exercice 14. On considère la matrice symétrique suivante, à coefficients dans C :
!
a c
A= .
c b
1. On suppose
quea = b. Montrer que A est diagonalisable dans la base formée des
1 1
vecteurs 1 et −1 .
2. On suppose a = 1, b = −1, c = i. Déterminer le polynôme caractéristique et le
polynôme minimal de A. Montrer que A n’est pas diagonalisable. Déterminer une
décomposition de Jordan de A.
47
3. Dans le cas général, montrer que le polynôme caractéristique admet une racine
double si et seulement si c = ± a−b
2i
.
4. Pour a 6= b et c = ± a−b
2i
, montrer que la matrice A n’est pas diagonalisable.
Exercice 15. Soit A ∈ Mn×n (R) une matrice symétrique. On suppose que Ak = I,
pour un certain entier k. Montrer que A2 = I.
Exercice 16. Soient A et B deux matrices symétriques à coefficients réels. On suppose

que A3 = B 3 . Montrer que A et B ont les mêmes valeurs propres, les mêmes vecteurs
propres. En déduire que A = B.
Exercice 17. Soit a un réel non nul. On considère la matrice A suivante.

a a2
 
0
 1
A= a
0 a  .
1 1
a2 a
0
1. Vérifier que A2 = A + 2I. En déduire le polynôme minimal de A. Montrer que A

est diagonalisable.
2. Déterminer les sous-espaces propres de A.
3. Donner l’expression de An en fonction de A et I. En déduire l’expression de
exp(A) en fonction de A et I.

!
0 0
A= .
−1 0
1. Calculer A2 . En déduire An , pour tout n ∈ N.

2. Quel est le polynôme caractéristique de A ? Est-elle diagonalisable ?
3. Calculer exp(A).

 
5 −4 1
A =  8 −7 2 
 .

12 −12 4
1. Vérifier que A2 = A. En déduire le polynôme minimal de A.

2. Déterminer les sous-espaces propres de A. Quel est son polynôme caractéristique ?
3. Calculer exp(A).
Exercice 20. Soit A ∈ Mn,n (R) une matrice carrée inversible, différente de la matrice
identité et telle que A = A−1 .
48
1. Quel est le polynôme minimal de A ? Est-elle diagonalisable ?

2. Donner en fonction de A et I l’expression de An pour tout n ∈ N, puis celle de
exp(A).
Exercice 21. Soit a un réel. On considère la matrice A suivante.
 
−1 a + 1 0
A= 1 a 1 
 .

3 −a − 1 2
1. Vérifier que −1 est valeur propre de A.
2. Factoriser le polynôme caractéristique de A.
3. Si a est différent de −1 et 2, montrer que A est diagonalisable.
4. Pour a = 2, montrer que A n’est pas diagonalisable.
5. Pour a = −1, diagonaliser A.
Exercice 22. Soit a un réel. On considère la matrice A suivante.
 
2 0 1−a
A =  −1 1 a − 1  .
 
a − 1 0 2a
1. Factoriser le polynôme caractéristique de A.
2. Déterminer en fonction de a la dimension du sous-espace propre associé à la
valeur propre a + 1.
3. Pour quelles valeurs de a la matrice A est-elle diagonalisable ?
Exercice 23. Soient a et b deux réels. On considère la matrice A suivante.
 
0 1 0
 0
A= 0 1  .

ab −(a + b + ab) a + b + 1
1. Calculer le polynôme caractéristique et le polynôme minimal de A (on pourra
observer que A est la transposée d’une matrice compagnon).
2. Calculer l’image par A du vecteur dont les trois coordonnées valent 1.
3. Déterminer les valeur propres et les sous espaces propres de A.
4. Donner une condition nécessaire et suffisante portant sur a et b pour que A soit
diagonalisable.
Exercice 24. Soient a, b et c trois réels non tous nuls. On note v le vecteur t(a, b, c).
On considère la matrice A suivante.
a2 ab ac
 
A =  ab b2 bc  .
 
ac bc c2
Soit f l’endomorphisme de R3 représenté par la matrice A dans la base canonique.
49
1. Montrer que f est diagonalisable.

2. Montrer que Im(f ) est la droite vectorielle engendrée par v.
3. Donner l’expression de An , pour tout n ∈ N∗ .
4. Déterminer Ker(f ).
5. D’éterminer les valeurs propres et les sous-espaces propres de f .
6. Si a2 + b2 + c2 = 1, montrer que f est la projection orthogonale sur la droite
engendrée par v.
Exercice 25. Soient a, b, c, d, e, f six réels. Pour chacune des matrices A suivantes,
donner une condition nécessaire et suffisante portant sur a, b, c, d, e, f pour que A soit
diagonalisable.
1 a b c 1 a b c 1 a b c
     
 0 1 d e   0 1 d e   0 1 d e 
;  ;  .
     
0 0 1 f 0 0 1 f 0 0 2 f
   
     
0 0 0 1 0 0 0 2 0 0 0 2
Exercice 26. Soit A une matrice carrée d’ordre n à coefficients réels.

1. On suppose que A est inversible. Montrer qu’il existe un polynôme P de degré
strictement inférieur à n tel que A−1 = P (A).
2. On suppose que A3 − 2A2 − A + 2I = 0. Montrer que A est inversible et diago-
nalisable.
Exercice 27. Soit A une matrice n × n diagonalisable. On considère la matrice B

2n × 2n, formée de 4 blocs égaux à A.
!
A A
B= .
A A
1. Soit λ une valeur propre de A et v un vecteur propre associé.

(a) On note V le vecteur obtenu en concaténant deux copies de v. Montrer que
V est vecteur propre de B associé à la valeur propre 2λ.
(b) On note V 0 le vecteur obtenu en concaténant une copie de v et une copie de
−v. Montrer que V 0 est vecteur propre de B associé à la valeur propre 0.
2. En déduire que B est diagonalisable.
Exercice 28. Soit A une matrice n × n diagonalisable. On considère la matrice B

2n × 2n, formée de 3 blocs nuls et un égal à A.
!
0 A
B= .
0 0
50
1. Quel est le polynôme caractéristique de B ?

2. Montrer que B est diagonalisable si et seulement si A est la matrice nulle.
Exercice 29. Soit E un espace vectoriel de dimension n. Soit f un endomorphisme de
E. On suppose que f 4 = f 2 .
1. Montrer que le polynôme minimal de f divise le polynôme X 4 − X 2 .
2. Parmi les diviseurs de X 4 − X 2 , lesquels sont des polynômes minimaux d’endo-
morphismes diagonalisables .
3. Montrer que f est diagonalisable si et seulement si f 3 = f .
Exercice 30. Soit E un espace vectoriel de dimension n. Soit f un endomorphisme de
E, que l’on suppose diagonalisable.
1. Montrer que Ker(f ) = Ker(f 2 ) et Im(f ) = Im(f 2 ).
2. On suppose que f a une seule valeur propre. Quel est le polynôme caractéristique
de f , quel est son polynôme minimal ? Montrer que f est une homothétie.
3. On suppose que f a deux valeurs propres, 0 et 1. Quel est le polynôme minimal
de f ? Montrer que f est une projection.
4. On suppose que f a deux valeurs propres, 1 et −1. Quel est le polynôme minimal
de f ? Montrer que f est une symétrie.
5. On suppose que f a deux valeurs propres disctinctes a et b. Ecrire f comme
somme d’une homothétie et d’une projection, puis d’une homothétie et d’une
symétrie.
Exercice 31. Soit E = Rn [X] l’espace vectoriel des polynômes de degré inférieur ou
égal à n. Soit Q un élément fixé de E, de degré k tel que 1 6 k 6 n. On considère
l’application f de E dans E, qui à un polynôme P associe le reste de la division
euclidienne de P par Q.
1. Montrer que f est un endomorphisme de E.
2. Montrer que f 2 = f (f est une projection).
3. En déduire que f est diagonalisable.
4. Montrer que Ker(f ) est l’ensemble des polynômes multiples de A. Donner une
base de Ker(f ).
5. Montrer que Ker(f − IE ) = Im(f ). Donner une base de Ker(f − IE ).
6. Si Q = X k , quelle est la matrice de f dans la base canonique de E ?
7. On considère le cas particulier n = 4, Q = X 2 − 1.
(a) Donner la matrice A de f dans la base canonique de E.
(b) Déterminer une matrice P telle que la matrice P −1 AP soit diagonale.
Exercice 32. Soit E = Rn [X] l’espace vectoriel des polynômes de degré inférieur ou égal
à n. On considère l’application f qui à un polynôme P associe f (P ) = (X − 1)P 0 + P .
51

2. Pour k 6 n, quelle est l’image par f du polynôme X k ? Écrire la matrice de f
dans la base canonique de E.
3. Montrer que f est un automorphisme de E et qu’il est diagonalisable.
4. Quel est le sous espace propre associé à la valeur propre 1 ?
5. Soit λ 6= 1 une valeur propre de f et P un vecteur propre de f associé à λ.
(a) Montrer que 1 est racine de P .
(b) Montrer qu’il existe un réel c tel que P = c(X − 1)λ−1 .
(c) Quel est le sous-espace propre associé à λ ?
Exercice 33. Soit E = Rn [X] l’espace vectoriel des polynômes de degré inférieur ou
égal à n. On considère l’application f qui à un polynôme P associe f (P ) = X 2 P 00 −XP 0 .
2. Pour k 6 n, quelle est l’image par f du polynôme X k ? Écrire la matrice de f
dans la base canonique de E.
3. Déterminer les valeurs propres de f .
4. On définit la suite de polynômes (Hk ) par H0 = 1, H1 = X et pour tout k > 2,
Hn = XHn−1 − (n − 1)Hn−1 . Montrer que Hk est vecteur propre de f .
5. En déduire que f est diagonalisable.
Exercice 34. Soit E un espace vectoriel de dimension n, et f un endomorphisme de

E. Soit A la matrice de f dans une base quelconque de E.
1. On suppose désormais que f est de rang 1. Quelle est la dimension du sous-espace
propre associé à la valeur propre 0 ?
2. On note λ la trace de A. Montrer que λ est valeur propre de f .
3. Montrer que le polynôme caractéristique de f est Pf (X) = (−1)n X n−1 (X − λ).
4. Montrer que le polynôme minimal de f est X(X − λ).
5. Montrer f est diagonalisable si et seulement si la trace de A est non nulle.
6. Soit v un vecteur non nul de Im(f ). Montrer que v est vecteur propre de f , associé
à la valeur propre λ.
7. Déterminer (sans autre calcul que celui de leur trace) les valeurs propres et les
sous-espaces propres des matrices suivantes.
       
1 0 −1 1 0 1 1 1 −1 1 1 −1
 0

0 0  ;  0
 
0 0  ;  −1 −1 −1  ;  −2 −2
   
2 

−1 0 1 −1 0 −1 1 1 1 1 1 −1
52
Exercice 35. Soit A une matrice fixée de Mn×n (R). On considère l’application f qui à
M ∈ Mn×n (R) associe f (M ) = tr(A) M − tr(M ) A, à tr désigne la trace d’une matrice
(somme des coefficients diagonaux). Soit F l’ensemble des matrices de Mn×n (R), de
trace nulle.
1. Montrer que f est un endomorphisme de Mn×n (R).
2. Montrer que A est vecteur propre de f associé à la valeur propre 0. Montrer que
le sous-espace propres associé à la valeur propre 0 est de dimension 1.
3. Montrer que Im(f ) = F . Quelle est la dimension de F ?
4. Montrer que F est le sous-espace propre de f associé à la valeur propre tr(A).
5. En déduire que f est diagonalisable, et que c’est la composée de la projection
sur F parallèlement à la droite engendrée par A avec l’homothétie de rappport
tr(A).
Exercice 36. Soit f l’endomorphisme de Mn×n (R), qui à une matrice associe sa trans-
posée.
1. Quel est le sous-espace propre de f associé à la valeur propre 1 ? Quelle est sa
dimension ?
2. Quel est le sous espace propre de f associé à la valeur propre −1 ? Quelle est sa
dimension ?
3. Montrer que f est diagonalisable, donner son polynôme caractéristique et son
polynôme minimal.
Exercice 37. Soit A une matrice d’ordre 6, telle que A3 − 3A2 + 2A = 0
1. Vérifier que les valeurs propres de A sont 0, 1, et 2.
2. On suppose que la trace de A est 8. Quelle sont les multiplicités de chacune des
valeurs propres, quel est le polynôme caractéristique de A ?
Exercice 38. Soit n un entier supérieur ou égal à 2. On note J la matrice de taille
n × n dont tous les coefficients valent 1.
1. Montrer que J est diagonalisable.
2. Exprimer J 2 en fonction de J. En déduire le polynôme minimal de J, ainsi qu’une
base du sous-espace propre associé à la valeur propre n.
3. Pour tout i ∈ {1, . . . , n − 1}, on note vi le vecteur défini par :


 1 si k = 1
vi (k) =  −1 si k = i + 1

0 sinon
Montrer que (v1 , . . . , vn−1 ) est une base de Ker(J).

4. Soient a et b deux réels. On note A la matrice aI + bJ, où I désigne la matrice
indentité de taille n × n. Utiliser ce qui précède pour diagonaliser la matrice A.
53
Exercice 39. Soit (e1 , . . . , en ) la base canonique de Cn . Soit σ ∈ Sn une permutation.

On lui associe l’endomorphisme fσ qui à ei associe eσ(i) , pour tout i = 1, . . . , n.
1. On suppose que σ est un cycle de longueur n. Montrer que le polynôme caracté-
ristique de f est (−1)n (X n − 1). En déduire que f est diagonalisable dans C.
2. On suppose que f est le produit de deux cycles de longueurs k et n−k, à supports
disjoints. Montrer que le polynôme caractéristique de f est (−1)n (X k −1)(X n−k −
1). Montrer que f est diagonalisable.
3. Dans le cas général, utiliser la décomposition de σ en produit de cycles pour
montrer que f est diagonalisable.

 
−1 2 1
A =  2 −1 −1  .
 
−4 4 3
1. Diagonaliser A.
2. En déduire l’expression de An pour tout n, et de exp(At), pour t ∈ R.
3. Calculer la solution du système différentiel X 0 (t) = AX(t), où X(t) est une
application de R dans R3 , telle que X(0) = t(1, 0, −1).
4. Soit (Un )n∈N la suite définie par U0 = t(1, 0, −1) et pour tout n ∈ N, Un+1 = AUn .
Donner l’expression de Un en fonction de n.

 
−1 2 0
A= 2

2 −3 
 .
2 2 1
1. Donner une décomposition de Jordan pour A.

2. En déduire l’expression de An pour tout n, et de exp(At), pour t ∈ R.
3. Calculer la solution du système différentiel X 0 (t) = AX(t), où X(t) est une
application de R dans R3 , telle que X(0) = t(1, 0, −1).
4. Soit (Un )n∈N la suite définie par U0 = t(1, 0, −1) et pour tout n ∈ N, Un+1 = AUn .
Exercice 42. Soit (un ) une suite de réels vérifiant, pour tout n ∈ N,
un+3 = 6un+2 − 11un+1 + 6un .
On pose Un = t(un , un+1 , un+2 ).

1. Écrire la matrice A telle que Un+1 = AUn .
54
2. Diagonaliser A.
3. En déduire une expression de An en fonciton de n.
4. Donner l’expression de un en focntion de U0 , u1 , u2 et n.
Exercice 43. Une multinationale américaine envoie chaque année un quart de ses gains
américains en Europe, et autant au Japon. Le reste demeure aux États-Unis. Les filiales
européennes et japonaises rendent la moitié de leurs gains aux États-Unis. Pour l’année
n, on note an , en et jn la proportion des gains restant en Amérique, en Europe et au
Japon respectivement, et Un le vecteur t(an , en , jn ).
2. Calculer les valeurs propres de A.
3. Soit v le vecteur propre associé à la valeur propre 1, à coordonnées positives, dont
la somme des coordonnées vaut 1. Calculer v.
4. Montrer que An converge vers la matrice dont toutes les colonnes sont égales à
v, et que Un converge vers v, quel que soit U0 .
Exercice 44. Doudou le hamster ne connaît que trois activités : dormir, manger, faire
de l’exercice dans sa roue. Il peut changer d’activité à chaque minute.
– Quand il dort, il a 8 chances sur 10 de ne pas se réveiller la minute suivante.
– Quand il se réveille il a autant de chances de se mettre à manger que de faire de
l’exercice.
– Chaque repas, et chaque séance d’exercice dure une minute, après quoi il s’endort.
On note dn , mn , en les probabilités qu’il a de dormir, manger et faire de l’exercice,
durant la minute n, et Un le vecteur t(dn , mn , en ).
2. Calculer les valeurs propres de A.
3. Soit v le vecteur propre associé à la valeur propre 1, à coordonnées positives, dont
la somme des coordonnées vaut 1. Calculer v.
4. Montrer que An converge vers la matrice dont toutes les colonnes sont égales à
v, et que Un converge vers v, quel que soit U0 .
Exercice 45. On considère l’espace vectoriel E des applications continues sur [0, 1],
à valeurs dans R. À tout élément f de E, on associe l’application ϕ(f ) définie par
ϕ(f )(0) = f (0) et pour tout x ∈]0, 1] :
1Zx
ϕ(f )(x) = f (t) dt .
x 0
1. Montrer que l’application ϕ est un endomorphisme de E.
1−λ
2. Soit λ ∈]0, 1]. on considère l’application fλ : x 7−→ x λ . Calculer ϕ(fλ ).
3. En déduire que fλ est vecteur propre de ϕ associé à la valeur propre λ.
55
4. Soit f un élément de E et λ un réel tel que ϕ(f ) = λf . Montrer que f est solution
sur ]0, 1[ de l’équation différentielle λxf 0 (x) + (λ − 1)f (x) = 0.
5. Montrer que cette équation n’admet de solution non nulle, prolongeable par conti-
nuité en 0 que pour λ ∈]0, 1].
2.3 QCM
rapporte 2 points.
Question 1. Soit A une matrice 2 × 2, à coefficients réels.

A Si A admet une valeur propre complexe, alors A est diagonalisable dans C.
B Si A admet une valeur propre réelle, alors A est diagonalisable dans R.
C Si A admet une seule valeur propre, alors A est la matrice d’une homothétie.
D Si A n’est pas diagonalisable dans R, alors A admet une seule valeur propre.
E Si A admet au moins deux vecteurs propres distincts, alors A est diagonalisable.
Question 2. Soit A une matrice 3 × 3, à coefficients réels.

A Si A est diagonalisable dans R, alors toutes ses valeurs propres sont distinctes.
B Si A est triangulaire, alors toutes ses valeurs propres sont réelles.
C Si A admet deux valeurs propres complexes, alors A est diagonalisable dans C.
D Si A admet au moins deux valeurs propres réelles distinctes, alors A est diago-
nalisable dans R.
E Si A est symétrique, alors toutes ses valeurs propres sont distinctes.
Question 3. Soit A une matrice de taille n × n (n > 2), λ une valeur propre de A et
m sa multiplicité dans le polynôme caractéristique.
A Si m = 1, alors le sous-espace propre associé à λ est une droite vectorielle.
B La dimension du sous-espace propre associé à λ est toujours égale à m.
C La matrice A − λI est de rang n − m.
D Si le sous-espace propre associé à λ est une droite vectorielle, alors m = 1.
E Le sous-espace propre de A associé à λ est inclus dans le sous-espace propre de
A2 associé à λ2 .
Question 4. Soit A une matrice de taille n × n (n > 2).

A La somme des valeurs propres de A est nulle si et seulement si son déterminant
est nul.
B Le produit des valeurs propres de A est égal à son déterminant.
C Les valeurs propres de A et celles de sa transposée sont les mêmes.
56
D Les sous-espaces propres de A et ceux de sa transposée sont les mêmes.

E Les sous-espaces propres de A et ceux de A2 sont les mêmes.
Question 5. Soit f un endomorphisme de Rn (n > 2), Pf son polynôme caractéristique
et πf son polynôme minimal.
A Si f est diagonalisable, alors toutes les racines de Pf sont simples.
B Si toutes les racines de πf sont simples, alors f est diagonalisable.
C Si Pf = (−1)n πf , alors f n’est pas diagonalisable.
D Le degré de πf est toujours strictement inférieur au degré de f .
E Si Pf a n racines distinctes, alors Pf = (−1)n πf .
Question 6. Soit f un endomorphisme de Rn (n > 2), Pf son polynôme caractéristique
et πf son polynôme minimal.
A Si πf (X) = X 2 − X alors f est nilpotent.
B Si πf (X) = X 2 − 1 alors f est une symétrie.
C Si f est une projection alors πf (X) = X 2 .
D Si πf (X) = X 2 alors f n’est pas diagonalisable.
E Si πf (X) = X 2 − X alors f n’est pas diagonalisable.
 
1 0 0
Question 7. On considère la matrice A =  0 0 1 .
 
0 0 0
A La matrice A est diagonalisable.
B La matrice A a deux valeurs propres distinctes.
C La polynôme minimal de A est X 3 − X 2 .
D Le sous espace propre associé à la valeur propre 0 est de dimension 2.
E Il existe une matrice symétrique semblable à la matrice A.
!
1 −1
Question 8. On considère la matrice A = .
1 1
A La matrice A est diagonalisable dans R
B La matrice A admet un vecteur propre à coordonnées réelles.
C La somme des valeurs propres de A est égale à leur produit.
D Si λ est valeur propre de A, la première colonne de A − λI est vecteur propre
de A associé à λ.
E Si v est vecteur propre de A associé à λ, alors v est vecteur propre de A associé
à λ.
1
− 12 1
 
2 2
1 1 1
Question 9. On considère la matrice A = 

−2 2 2 .

0 0 1
A La matrice A a trois valeurs propres distinctes.
57
B Le sous-espace propre associé à la valeur 

propre 1 est

de dimension 2.
0 0 0
C La matrice A est semblable à la matrice  0 1

1 
.
0 0 1
 
1 0 0
D La matrice A est semblable à la matrice  0 0 0 
.

0 0 1
E Le polynôme minimal de A est de degré 3.
1
− 21 3
 
2 2
Question 10. On considère la matrice A = 

− 21 1
2
− 12 .

0 0 1
A La matrice A a deux valeurs propres distinctes.
B Le sous-epace propre associé à la valeur propre

1 estde dimension 2.
1 0 0
C La matrice A est semblable à la matrice  0 0 0 .

0 0 1
D Le polynôme minimal de A est de degré  2. 
0 0 0
E La matrice A est semblable à la matrice  0 1 1 
.

0 0 1
Réponses : 1–AD 2–BC 3–AE 4–BC 5–BE 6–BD 7–BC 8–CE 9–BD 10–AE
2.4 Devoir
répondu.
Questions de cours : Soit n un entier supérieur ou égal à 1, E un espace vectoriel
de dimension n et f un endomorphisme de E.
1. Donner la définition du polynôme caractéristique de f et énoncer le théorème de
Cayley-Hamilton.
2. Donner la définition du polynôme minimal de f .
3. On suppose que le polynôme caractéristique est scindé. On note λ1 , . . . , λk ses
racines et m1 , . . . , mk leurs multiplicités respectives. Montrer que le polynôme
minimal de f s’écrit
k
(X − λi )li ,
Y
πf =
i=1
où pour tout i = 1, . . . , k, 1 6 li 6 mi .
58
k
Y
4. Montrer que si f est diagonalisable, alors πf = (X − λi ).
i=1
k
Y
5. Montrer que si πf = (X − λi ) alors f est diagonalisable.
i=1
Exercice 1 : Soit n un entier supérieur ou égal à 1. On note S la matrice de taille

2n × 2n dont le coefficient d’ordre (i, j) vaut 1 si i + j = 2n + 1 et 0 sinon.
1. Vérifier que S est symétrique, en déduire qu’elle est diagonalisable.
2. Montrer que S est son propre inverse.
3. En déduire le polynôme minimal de S.
4. Pour tout i ∈ {1, . . . , n}, on note vi et wi les vecteurs de R2n définis par :
 
1 si k = i

 1 si k = i


vi (k) = 1 si k = 2n + 1 − i et wi (k) = −1 si k = 2n + 1 − i
 

0 sinon 
0 sinon
Montrer que vi et wi sont vecteurs propres de A, associés respectivement aux

valeurs propres 1 et −1.
5. Soit P la matrice dont les vecteurs colonnes sont (v1 , . . . , vn , w1 , . . . , wn ). Montrer
que P tP = 2I.
6. En déduire une diagonalisation de S dans une base orthonormée.
7. Soient a et b deux réels. On pose A = aI + bS, où I désigne la matrice identité de
taille 2n × 2n. Diagonaliser A dans une base orthonormée. Quel est le polynôme
caractéristique de A ? Quel est son polynôme minimal ?
Exercice 2 : Soient a, b, c, d quatre réels tels que bcd 6= 0. On définit la matrice A
par :
a −b −c −d
 
 b a d −c 
A=  .

 c −d a b 

d c −b a
1. Calculer A + tA, A tA, puis (A − XI)(tA − XI).
2. En déduire le polynôme caractéristique de A.
3. Montrer que A n’est pas diagonalisable sur R.
4. Calculer A2 − (2a)A + (a2 + b2 + c2 ). En déduire le polynôme minimal de A.
Montrer que A est diagonalisable sur C.
5. On
t
√ se place désormais √ dans le cas où a = 1, b = c = d = −1. Vérifier que
(i 3, 1, 1, 1) et t(−1, i 3, −1, 1) sont des vecteurs propres de A.
6. En déduire une matrice de passage P et une matrice diagonale D telles que
D = P −1 AP .
59
7. Montrer que A3 = −8I. Pour tout n ∈ N, donner l’expression de An en fonction

de A et I.
8. Soit (Un ) la suite définie par U0 = t(1, 1, 1, 1), et pour tout n ∈ N, Un+1 = AUn .

1. On appelle polynôme caractéristique de f le polynôme det(f − XI), où I désigne
l’identité de E. Ses racines sont les valeurs propres de f . Soit P (X) = a0 + a1 X +
· · · + ad X d ∈ R[X] un polynôme. On note P (f ) l’endomorphisme :
d
a0 I + a1 f + · · · + ad f d = ai f i ,
X
i=0
où f 0 = I et pour tout i > 1, f i = f i−1 ◦ f . Le théorème de Cayley-Hamilton

affirme que Pf (f ) = 0, où Pf désigne le polynôme caractéristique de f
2. L’ensemble des polynômes P tels que P (f ) = 0 (polynômes annulateurs de f )
contient le polynôme caractéristique, d’après le théorème de Cayley-Hamilton. On
démontre que tous les polynômes annulateurs sont multiples d’un même polynôme
untaire, qui par définition est le polynôme minimal.
3. D’après le théorème de Cayley-Hamilton et la définition du polynôme minimal,
celui-ci divise le polynôme caractéristique. Puisque les polynômes de degré 1 sont
irréductibles,
k
(X − λi )li ,
Y
πf =
i=1
où pour tout i = 1, . . . , k, 0 6 li 6 mi . Nous devons démontrer que li > 0

pour tout i. Soit v un vecteur propre de f associé à la valeur propre λi . Alors
(f − λj I)(v) = (λi − λj )v, qui est nul si i = j, non nul i 6= j. Donc
 
k
(λi − λj )lj  v .
Y
πf (v) = 
j=1
Or par définition πf (v) doit être nul, donc l’exposant li est bien strictement positif
(s’il était nul, πf (v) serait égal à v multiplié par un produit de termes non nuls).
4. Considérons le polynôme π = kj=1 (X −λj ). Soit v un vecteur propre de f , associé
Q
à la valeur propre λi . L’image de v par π(f ) est :

 
k
Y
π(v) =  (λi − λj ) v = 0 .
j=1
60
Si f est diagonalisable, alors il existe une base de vecteurs propres. Si un endo-

morphisme s’annule sur tous les éléments d’une base, il est identiquement nul.
Donc le polynôme π est annulateur, donc multiple de πf . Or par la proposition
précédente, π divise πf . Donc π = πf .
5. Notons Ei le sous-espace propre de f associé à la valeur propre λi : Ei = Ker(f −
λi I). Nous voulons démontrer que E = ki=1 Ei . Un même vecteur propre ne peut
L
pas appartenir à deux sous-espaces propres différents : les intersections deux à

deux des Ei sont réduites à {0}. Il suffit donc de montrer que tout vecteur de E
s’écrit comme somme de vecteurs propres. Écrivons :
k
!
1 X 1 1
Qk = .
i=1 (X − λi ) j6=i (λi − λj ) X − λi
Q
i=1
En multipliant par le dénominateur du membre de gauche :

k
!
X 1 Y
1= (X − λj ) .
Q
i=1
Posons alors pour tout i = 1, . . . , k :

1 Y
αi = Q et Pi (X) = (X − λj ) .
Ainsi :
k
X
1= αi Pi (X) .
i=1
Composons par f :
k
X
I= αi Pi (f ) .
i=1
Donc pour tout vecteur v ∈ E :

k
X
v= αi Pi (f )(v) .
i=1
Il nous reste à démontrer que pour tout i = 1, . . . , n, Pi (f )(v) ∈ Ei . Par hypo-

thèse, πf (X) = (X − λi )Pi (X). Donc :
πf (f )(v) = (f − λi I)(Pi (f )(v)) = 0 .
Exercice 1 :
1. Soit si,j le coefficient d’ordre (i, j) de S. Par définition, si,j et sj,i valent 1 si
i + j = 2n + 1, 0 sinon. Donc si,j = sj,i : la matrice S est symétrique, donc
diagonalisable, comme toutes les matrices symétriques à coefficients réels.
61
2. Soient i, j, k trois entiers compris entre 1 et 2n. Par définition si,k sk,j vaut 1 si
i + k = j + k = 2n + 1, et 0 sinon. Or si i + k = j + k = 2n + 1, alors i = j et
k = 2n + 1 − i. Donc
2n
(
X 1 si i = j
si,j sk,j =
k=1
0 sinon.
La matrice S 2 est donc la matrice identité, donc S est son propre inverse.
3. D’après la question précédente, X 2 − 1 est un polynôme annulateur de S. Donc
le polynôme minimal divise X 2 − 1. Or il n’est égal ni à X − 1, ni à X + 1 (car
S 6= ±I). Donc le polynôme minimal de S est X 2 − 1.
4. Soit v = v(k) un vecteur quelconque de R2n . Le terme d’ordre i du produit Sv est
P
si,k v(k). Or cette somme ne contient qu’un seul terme non nul, correspondant
à i + k = 2n + 1, soit i = 2n + 1 − k : le terme d’ordre i de Sv est égal au terme
d’ordre 2n + 1 − i de v. Par définition, pour tout k, vi (k) = vi (2n + 1 − k) et
wi (k) = −wi (2n + 1 − k). Donc Svi = vi et Swi = −wi .
5. Par définition si i 6= j, les termes non nuls de vi et ceux de vj et wj sont d’indices
différents. Donc :
2n 2n
t t
X X
vi vj = vi (k)vj (k) = 0 et vi wj = vi (k)wj (k) = 0 .
k=1 k=1
Pour i = j :
2n
t
X
vi wi = vi (k)wj (k) = 1 − 1 = 0 ,
k=1
puis
2N 2N
t t
vi (k)2 = 2 et wi (k)2 = 2 .
X X
vi vi = wi wi =
k=1 k=1
Si P la matrice dont les vecteurs colonnes sont (v1 , . . . , vn , w1 , . . . , wn ), le terme

d’ordre (i, j) de P tP vaut 2 si i = j, 0 sinon. Donc P tP = 2I .
6. La matrice Q = √12 P est telle que Q tQ = 12 P tP = I. C’est donc la matrice d’un
changement de base orthonormée. Comme les colonnes de P sont des vecteurs
propres de S, il en est de même des colonnes de Q. Donc :
QSQ = Q−1 SQ = D ,
t
où D est la matrice diagonale don les n premiers coefficients valent 1, les n

suivants valent −1.
7. Écrivons :
t
QAQ = tQ(aI + bS)Q = atQQ + btQSQ = aI + bD .
La matrice aI + bD est diagonale, ses n premiers coefficiants valent a + b les n

suivants valent a − b. Les valeurs propres de A sont a + b et a − b, chacune de
62
multiplicité n. Donc le polynôme caractéristique de A est (X − (a + b))n (X − (a −

b))n . Comme A est diagonalisable, son polynôme minimal n’a que des racines
simples, et il a pour racines les deux valeurs propres distinctes. Il vaut donc
(X − (a + b))(X − (a − b)).
Exercice 2 :
1. Si I désigne la matrice identité de taille 4 × 4, on trouve :
A + tA = 2aI , A tA = (a2 + b2 + c2 + d2 )I ,
puis
(A − XI)(tA − XI) = (X 2 − 2aX + (a2 + b2 + c2 + d2 ))I .
2. Par définition, le polynôme caractéristique de A est PA (X) = det(A − XI). Or
le déterminant d’une matrice est égal à celui de sa transposée, et le déterminant
d’un produit de matrices est égal au produit des déterminants de ces matrices.
Donc :

det (A − XI)( A − XI) = det(A − XI) det(tA − XI) = PA (X)2 .
t
D’après la question précédente,

det (A − XI)(tA − XI) = (X 2 − 2aX + (a2 + b2 + c2 + d2 ))4
Donc :
PA (X) = ±(X 2 − 2aX + (a2 + b2 + c2 ))2 .
Le coefficient du terme en X 4 dans le polynôme caractéristique est (−1)4 = 1.
Donc :
PA (X) = (X 2 − 2aX + (a2 + b2 + c2 + d2 ))2 .
3. Notons π le polynôme X 2 − 2aX + (a2 + b2 + c2 + d2 ). Puisque PA = π 2 , Les
valeurs propres de A sont les racines de π. Par hypothèse b, c, d ne sont pas tous
les trois nuls, donc
π(X) = (X − a)2 + b2 + c2 + d2 > 0 , ∀X ∈ R .
Le polynôme π n’est pas scindé sur R : la matrice A n’est pas diagonalisable sur
R.
4. On trouve A2 − (2a)A + (a2 + b2 + c2 + d2 ) = π(A) = 0. Donc π est polynôme
annulateur de A. Par définition, le polynôme minimal de A divise π. Or π a
deux racines complexes conjuguées distinctes, qui sont valeurs propres de A,
donc racines du polynôme minimal. Donc π divise le polynôme minimal. Or c’est
un polynôme unitaire. Donc le polynôme minimal de A est π. Comme il a deux
racines simples, A est diagonalisable sur C.
63
√ √
5. On trouve Av = (1 − i 3)v, et Aw = (1 − i 3)w.√ Donc v et w sont des vecteurs
propres de A associés à la valeur propre 1 − i 3.
6. Puisque la matrice A est réelle :
√ √
Av = Av = (1 − i 3)v = (1 + i 3)v .
√
Donc v est un vecteur propre de A associé à la valeur propre 1 + i 3. De même,
√ √
Aw = Aw = (1 − i 3)w = (1 + i 3)w .
√
Donc w est aussi un vecteur propre de A associé à la valeur propre 1 + i 3.
On doit vérifier que (v, w, v, w) constitue une base de C4 . Pour √ cela, observons
√
que les sous espaces propres associés aux valeurs propres 1 − i 3 et 1 + i 3
sont d’intersection réduite à 0. Or les vecteurs v et w ne sont pas proportionnels.
Ils engendrent donc un sous-espace vectoriel de dimension 2. De même v et w
engendrent un sous-espace vectoriel de dimension 2. Ces deux espaces sont en
somme directe et ce sont des sous-espaces de C4 . Leur somme est donc C4 , et
donc (v, w, v, w) est une famille génératrice de C4 , donc une base. (On aurait pu
aussi vérifier que c’est
√ une famille libre en calculant le déterminant des 4 vecteurs,
qui vaut −12 + 4i 3). Soit P la matrice dont les colonnes sont (v, w, v, w). Cette
matrice est inversible, et D = P −1 AP√, où D est la matrice diagonale
√ dont les
deux premiers coefficients valent 1 − i 3, les deux suivants 1 + i 3.
7. D’après la question 4, le polynôme minimal de A est X 2 −2X +4. Or le polynôme
X 3 + 8 est multiple du polynôme minimal :
X 3 + 8 = (X 2 − 2X + 4)(X + 2) .
C’est donc un polynôme annulateur de A : A3 + 8I = 0. Pour tout n ∈ N,
A3n = (−8)n I , A3n+1 = (−8)n A , A3n+2 = (−8)n A2 = (−8)n (2A − 4I) .
8. Si Un+1 = AUn , alors Un = An U0 . Or IU0 = U0 et AU0 = t(4, 0, 0, 0). D’après la

question précédente pour tout n ∈ N,
1 4 4
     
 1   0   −4 
U3n = (−8)n  , U3n+1 = (−8)n  , U3n+2 = (−8)n  .
     
1 0 −4
  
     
1 0 −4
64
3 Compléments
3.1 Tout à l’envers
À partir de la définition axiomatique des espaces vectoriels, la notion de morphisme
(application linéaire) s’ensuit. Dans le cas particulier de la dimension finie, pourvu
que l’on ait choisi une base, les applications linéaires se représentent par des matrices.
Une équation dont l’inconnue est un vecteur et la donnée une matrice est un système
linéaire, que l’on peut résoudre à l’aide des déterminants. Le souci de représenter ces
mêmes applications linéaires de la façon la plus simple possible conduit ensuite à la
décomposition spectrale. Parmi les matrices admettant une décomposition spectrale
simple se trouvent les matrices symétriques.
Du moins est-ce ainsi que les choses vous ont été présentées. Mais l’histoire ne s’est
pas déroulée dans le même ordre 1 . Pour des calculs pratiques, on résoud des systèmes
linéaires depuis la plus haute antiquité : la méthode du pivot de Gauss était déjà
présente dans les « Neuf chapitres sur l’Art du calcul » en Chine au début de notre
ère. Pourtant, la notion de déterminant n’a émergé qu’à la fin du xviie siècle, et n’a
été vraiment formalisée qu’au début du xixe, trente ans après les formules de Cramer.
Que le déterminant d’un produit de matrices soit le produit des deux déterminants de
ces matrices a été démontré indépendamment par Binet et Cauchy en 1812, bien avant
qu’il soit question de multiplier des matrices ou de composer des applications linéaires.
Les mêmes calculs revenant assez souvent pour la résolution d’équations différentielles,
en particulier en astronomie, ils ont été petit à petit systématisés, et c’est ainsi que
les valeurs propres sont apparues. En 1829, Cauchy publie un article dont le titre en
dit long sur ses péoccupations algébriques : « Sur l’équation avec laquelle on détermine
les inégalités séculaires dans les mouvements des planètes ». Il y calcule les maxima et
minima d’une forme quadratique, ce qui le conduit tout droit au système


 Axx x + Axy y + Axz z + . . . = sx
Axy x + Ayy y + Ayz z + . . . = sy




 Axz x + Ayz y + Azz z + . . . = sx
... = ...

Et un peu plus loin, comme une remarque en passant,

. . . on prouve facilement que l’équation (7) ne saurait admettre de racines
imaginaires, tant que les coefficients Axx , Axy , Axz . . . ; Ayy , Ayz . . ., Azz . . .
restent réels. En effet. . .
Suit la première démonstration du fait que les valeurs propres d’une matrice symétrique
sont réelles. . . plus de vingt ans avant que la notion de matrice ne soit introduite par
Sylvester et Cayley, et avant que les valeurs propres aient été définies (indépendamment
1. F. Brechenmacher : les matrices : formes de représentation et pratiques opératoires (1850–1930)
CultureMATH – Site expert ENS Ulm/DESCO (2006)
65
des matrices). Dès l’introduction de son article de 1858 « A memoir on the theory of
matrices », Cayley annonce :
I obtain the remarkable theorem that any matrix whatever satisfies an
algebraical equation of its own order, the coefficient of the highest power
being unity, and those of the other powers functions of the terms of the
matrix, the last coefficient being in fact the determinant ; the rule for the
formation of this equation may be stated in the following condensed form,
which will be intelligible after a perusal of the memoir, viz. The determinant
formed out of the matrix, diminished by the matrix considered as a single
quantity involving the matrix unity, will be equal to zero.
C’est le théorème de Cayley-Hamilton. . . sans qu’il soit question encore de valeurs
propres ! Quant aux espaces vectoriels et autres applications linéaires, ils apparaissent
vers 1840, mais la relation entre matrices et applications linéaires n’est pas explicitée.
D’ailleurs tout cela restera essentiellement confidentiel jusqu’à la fin du xixe. Il faudra
attendre le début du xxe pour que la puissance de l’algèbre linéaire soit reconnue, et
les années 1930 pour qu’apparaissent les premiers livres qui l’exposent telle qu’elle vous
est présentée.
3.2 Racines lambdaïques ou latentes ?

Le mémoire fondateur de Cayley n’a certainement pas eu le succès qu’il méritait
en 1858. La notion de matrice est restée longtemps ignorée des autres mathématiciens,
y compris de Sylvester. Ce n’est que vers les années 1880, que celui-ci, alors âgé de
près de 70 ans et revenant sur les écrits de son ami, comprend la puissance de l’algèbre
linéaire et s’enthousiasme.
Qu’il me soit permis, avant de conclure, d’ajouter encore une petite réflexion
sur l’importance de la question traitée ici. Elle constitue, pour ainsi dire,
un canal qui, comme celui de Panama, sert à unir deux grands océans, celui
de la théorie des invariants et celui des quantités complexes ou multiples :
dans l’une de ces théories, en effet, on considère l’action des substitutions
sur elles-mêmes, et dans l’autre, leur action sur les formes ; de plus, on
voit que la théorie analytique des quaternions, étant un cas particulier de
celle des matrices, cesse d’exister comme une science indépendante ; ainsi,
de trois branches d’analyse autrefois regardées comme étant indépendantes,
en voilà une abolie ou résorbée, et les deux autres réunies en une seule de
substitution algébrique.
Pour autant il hésitera avant de fixer la notion de valeur propre. Voici ce qu’il écrit en
1882.
Soit un déterminant quelconque donné, et ajoutons le terme −λ à chaque
terme diagonal ; on obtient ainsi une fonction de λ : je nomme les racines de
cette fonction racines lambdaïques du déterminant donné [. . . ]. i étant une
66
quantité commensurable quelconque, les ies puissances des racines lamb-

daïques d’un déterminant de substitution sont identiques avec les racines
lambdaïques de ie puissance du déterminant.
Et en 1883 :
It will be convenient to introduce here a notion (which plays a conspicuous
part in my new theory of multiple algebra), namely that of the latent roots
of a matrix – latent in a somewhat similar sense a vapour may be said latent
in water or smoke in a tobacco leaf. If from each term in the diagonal of a
given matrix, λ be substracted, the determinant to the matrix so modified
will be a rational integer function of λ ; the roots of that function are the
latent roots of the matrix, and there results the important theorem that the
latent roots of any function of a matrix are respectively the same functions
of the latent roots of the matrix itself : for example, the latent roots of the
square of a matrix are the square of its latent roots.
Imaginatif et très porté sur la métaphore, Sylvester avait déjà baptisé les matrices,
susceptibles d’engendrer différents systèmes de déterminants « as from the womb of
a common parent ». Pourtant ni les racines latentes ni les racines lambdaïques n’ont
survécu. L’idée de quantité « caractéristique » ou « propre » s’est imposée à la suite de
Cauchy, y compris dans « eigenvalue » et « eigenvector » où le préfixe « eigen » est la
traduction allemande de « propre ». Encore qu’il n’y ait pas loin de la « fumée latente
dans une feuille de tabac » au « spectre » introduit par Hilbert dans les dernières années
du xixe.
3.3 Le théorème de Perron-Frobenius

Le théorème que nous allons vous exposer n’est pas seulement splendide.
It is a testament to the fact that beautiful mathematics eventually tend to
be useful, and useful mathematics eventually tend to be beautiful.
On en trouve en effet des applications, non seulement un peu partout en mathéma-
tiques, mais aussi en économie, en théorie des populations, dans les réseaux sociaux
etc 2 . On peut considérer par exemple que l’algorithme PageRank de Google en est un
lointain avatar. Ce théorème a été démontré en 1907 par Oskar Perron (1880–1975).
Théorème 11 (de Perron). Soit A une matrice carrée à coeffficients réels strictement
positifs. Alors A a une valeur propre simple α qui est réelle, strictement positive et
strictement supérieure au module de toute autre valeur propre. À cette valeur propre
maximale α correspond un vecteur propre dont toutes les coordonnées sont strictement
positives.
2. C.R. MacCluer : The many proofs and applications of Perron’s theorem SIAM Review Vol.
42(3), p. 487–498 (2000)
67
La beauté du résultat tient d’une part à son élégance, d’autre part dans un apparent
paradoxe. La décomposition spectrale d’une matrice est liée à l’endomorphisme qu’elle
représente, et elle est donc invariante par changement de base. La conclusion du théo-
rème (existence d’une valeur propre réelle supérieure au module de toute autre valeur
propre) est liée à l’endomorphisme et non à la matrice. Or l’hypothèse (coefficients
strictement positifs) n’est pas invariante par changement de base. Pour comprendre
ce paradoxe, il faut interpréter l’hypothèse de façon géométrique. Par exemple en di-
mension 2, considérez le quart de plan formé des vecteurs à coordonnées strictement
positives. Le fait que A soit à coefficients strictement positifs entraîne que le produit
par A d’un vecteur à coordonnées strictement positives reste dans le même quart de
plan. En d’autres termes, l’endomorphisme laisse stable ce quart de plan. Il n’est donc
pas surprenant qu’il y ait dans ce même quart de plan une direction invariante.
Soit dit entre parenthèses, Perron n’en était pas à un paradoxe près :
Soit N le plus grand entier naturel. Si N > 1, alors N 2 > N , ce qui contredit
la définition. Donc N = 1.
Démonstration : D’abord quelques notations pour faciliter la lecture. Pour tous vec-
teurs u = (ui )i=1,...,n et v = (vi )i=1,...,n de Rn ,
• u 6 v signifie ∀i = 1, . . . , n , ui 6 vi ,
• u < v signifie ∀i = 1, . . . , n , ui < vi ,
• 0 désigne le vecteur nul de Rn ,
• 1 désigne le vecteur de Rn dont toutes les coordonnées valent 1.
Soit S l’ensemble des réels λ > 0 tels qu’il existe v = (vi ) ∈ Rn vérifiant :
n
X
0 6 v 6 1 et vi = 1 et λv 6 Av .
i=1
Soit λ une valeur propre de A et w = (wi ) un vecteur propre associé. Pour tout
i = 1, . . . , n, posons ui = |wi |, puis u = (ui )i=1,...,n . Par l’inégalité triangulaire :
λw = Aw =⇒ |λ|u 6 Au .
En divisant u par la somme de ses coordonnées, on en déduit que |λ| appartient à

l’ensemble S, qui est donc non vide. Pour tout i, j = 1, . . . , n, notons aij > 0 le
coefficient d’ordre (i, j) de A. Tout élément β de S vérifie :
 
n n
X n X
∀i = 1 . . . , n , βvi 6 aij vj 6 max vj  aij  .
j=1
j=1 j=1
P
Donc β 6 maxi j aij : l’ensemble S est borné. Soit α la borne supérieure de S, et
(αn )n∈N une suite d’éléments de S convergeant vers α. À chacun des αn correspond un
vecteur v (n) , dont les coordonnées sont positives ou nulles et de somme 1, et tel que
αn v (n) 6 Av (n) . Par le théorème de Bolzano-Weierstrass, on peut extraire de la suite
68
(v (n) )n∈N une sous-suite (v (nk ) )k∈N convergente. Soit v la limite de cette sous-suite. Les
coordonnées de v sont encore positives ou nulles et de somme 1 et en particulier v est
non nul. En passant à la limite en k :
∀k ∈ N , αnk v (nk ) 6 Av (nk ) =⇒ αv 6 Av .
Supposons αv 6= Av. Le vecteur Av − αv a toutes ses coordonnées positives ou nulles

et l’une au moins est non nulle. Donc son produit par A a toutes ses coordonnées
strictement positives (d’après l’hypothèse sur A) : A(Av − αv) > 0. Notons v 0 le
vecteur proportionnel à Av dont toutes les coordonnées sont positives ou nulles et de
somme 1 : Av 0 > αv 0 , donc il existe ε > 0 tel que Av 0 > (α + ε)v 0 , ce qui contredit la
définition de α comme borne supérieure de S. On conclut donc que αv = Av, donc α
est valeur propre, et v est un vecteur propre associé à α. A priori, les coordonnées de
v sont positives ou nulles. Mais alors les coordonnées de Av sont strictement positives.
Puisque Av = αv, on en conclut que α > 0 et v > 0.
Montrons maintenant que α est strictement supérieure au module de toute autre valeur
propre. Soit λ une valeur propre de A et w = (wi ) un vecteur propre associé. Nous
avons déjà montré que |λ| ∈ S, en utilisant l’inégalité triangulaire.
λw = Aw =⇒ |λ|u 6 Au .
Comme α est la borne supérieure de S, |λ| 6 α. Supposons |λ| = α : αu 6 Au. Par

le raisonnement déjà effectué ci-dessus, on en conclut que nécessairement αu = Au,
donc les inégalités dans la majoration ci-dessus sont en fait des égalités. Mais ceci n’est
possible que si u est proportionnel à w. Mais alors, u est aussi vecteur propre associé
à λ, donc λ = α.
Il ne reste qu’un petit point à démontrer, mais c’est le plus délicat : α est valeur propre
simple. Pour cela, nous commençons par montrer que le sous-espace propre associé à
α est une droite. Soit w un vecteur propre associé à α et comme ci-dessus u le vecteur
des modules des coordonnées de w. Par un raisonnement déjà vu,
αw = Aw =⇒ αu 6 Au =⇒ αu = Au =⇒ u > 0 .
De sorte qu’aucun vecteur propre associé à α ne peut avoir de coordonnée nulle. Mais si
on pouvait trouver deux vecteurs propres indépendants associés à α, alors on pourrait
en former une combinaison linéaire, qui serait encore vecteur propre associé à α, et dont
par exemple la première coordonnée serait nulle. C’est impossible, donc le sous-espace
propre associé à α est de dimension 1. Nous allons utiliser cela pour démontrer que α
est racine simple du polynôme caractéristique PA (X) = det(A − XI). Considérons le
polynôme PA (α + X), qui est le déterminant de (A − αI) − XI. Son terme constant,
qui est le déterminant de A − αI, est nul. Le coefficient du terme de degré 1 est
la trace (somme des coefficients diagonaux) de la comatrice de A − αI (matrice des
mineurs d’ordre n − 1, affectés de signes alternés). Notons C cette comatrice. Comme
69
le sous-espace propre associé à α est de dimension 1, A − αI est de rang n − 1, donc

la matrice C n’est pas nulle. Nous voulons démontrer que sa trace est non nulle. Or
C(A − αI) = (A − αI)C = 0, car le déterminant de A − αI est nul. En particulier, tous
les vecteurs colonnes de C sont des vecteurs propres de A associés à α. En tant que tels,
ils sont proportionnels à v, dont toutes les coordonnées sont strictement positives. Les
vecteurs lignes sont des vecteurs propres de tA associés à α : ils sont donc également
proportionnels à un vecteur à coordonnées strictement positives. Ceci entraîne que tous
les coefficients de C sont tous non nuls et de même signe (tous strictement positifs ou
tous strictement négatifs). En particulier la trace est non nulle, et α est racine simple
de PA (X).
Ferdinand Georg Frobenius (1849–1917) étendit en 1912 le théorème de son jeune
collègue Perron aux matrices à coefficients positifs ou nuls, dont une puissance entière
a ses coefficients strictement positifs (matrices irréductibles). C’est la version qui est
à la base de la plupart des applications, en particulier aux chaînes et processus de
Markov, mais nous aurons l’occasion de vous en reparler.
Professeur à l’université de Tübingen, puis de Göttingen, Perron est l’auteur de
218 articles, dont quelques uns publiés après 80 ans, ce qui est une longévité assez
exceptionnelle. Il a par ailleurs continué sa pratique assidue de l’alpinisme bien au-delà
de 70 ans.
Quant à Frobenius, professeur à Zürich, puis Berlin, on lui doit une grande partie de
la théorie des matrices, en particulier ce qui concerne les matrices compagnons. Il a
montré qu’une matrice quelconque est semblable à une matrice diagonale par blocs,
dont les blocs sont des matrices compagnons. Il est resté célèbre pour ses colères et ses
opinions tranchées : voyez ce qu’il écrit au sujet de Sophus Lie (1842–1899).
Lie se contente de très peu de connaissances dans ses innombrables papiers.
Il a lu très peu de travaux des grands mathématiciens classiques et en
a compris encore moins. Ce que Lie nous fournit, c’est une doctrine de
méthodes de peu d’utilité, dont le formalisme dénudé, qui à y bien penser
nous rappelle les pires moments de la théorie des invariants, doit rebuter
tout lecteur au goût éduqué.
3.4 Jordan contre Kronecker

Quand Camille Jordan (1838–1922) publie en 1870 les quelque 700 pages de son
« Traité des substitutions et des équations algébriques », il installe définitivement la
théorie des groupes, donnant au travaux de Galois (antérieurs de 40 ans) toute leur im-
portance. Au sein de ce monument, il consacre quelques dizaines de pages aux groupes
de « substitutions linéaires » dont 12 pour le paragraphe « Forme canonique des sub-
stitutions linéaires ». On y trouve bien la « réduction de Jordan », même si vous auriez
du mal à y reconnaître sa version moderne. Il se trouve que au moins 2 ans auparavant
Karl Weierstrass (1815–1897) puis Leopold Kronecker (1823–1891) avaient exposé une
70
théorie sur un sujet apparemment différent, mais qui ressemblait beaucoup à celle de
Jordan. Ce dernier raisonnait en termes de faisceaux de substitutions linéaires, tandis
qu’à Berlin on réduisait des formes bilinéaires. Cette différence de point de vue allait
alimenter un spectaculaire dialogue de sourds par l’intermédiaire de mémoires publics
et de lettres privées, s’étendant sur toute l’année 1874 3 . La polémique commence par
un article de Jordan fin 1873, ayant pour sujet le problème déjà traité par les deux
allemands, mais utilisant ses propres méthodes « extrêmement simples ».
Le premier de ces problèmes est nouveau si nous ne nous trompons. Le
deuxième a déjà été traité (dans le cas où n est pair) par M. Kronecker, et
le troisième par M. Weierstrass ; mais les solutions données par les éminents
géomètres de Berlin sont incomplètes, en ce qu’ils ont laissé de côté certains
cas exceptionels qui, pourtant, ne manquent pas d’intérêt. Leur analyse
est en outre assez difficile à suivre, surtout celle de M. Weierstrass. Les
méthodes nouvelles que nous proposons sont, au contraire, extrêmement
simples et ne comportent aucune exception [. . . ]
Ce à quoi Kronecker réplique :
[. . . ] dans le Mémoire de M. Jordan « Sur les formes bilinéaires » (Journal
de M. Liouville, 2e série t. xix, pp. 35–54), la solution du premier problème
n’est pas véritablement nouvelle ; la solution du deuxième est manquée, et
celle du troisième n’est pas suffisamment établie. Ajoutons qu’en réalité
ce troisième problème embrasse les deux autres comme cas particuliers, et
que sa solution complète résulte du travail de M. Weierstrass de 1868 et se
déduit aussi de mes additions à ce travail. Il y a donc, si je ne me trompe,
de sérieux motifs pour contester à M. Jordan l’invention première de ses
résultats, en tant qu’ils sont corrects ; [. . . ]
Jordan très vexé écrit à l’« éminent géomètre de Berlin » :
J’ai publié il est vrai (c’était mon droit évident) sans vous consulter des
recherches qui complétaient les vôtres sur une question dont vous vous
étiez occupé, et dont vous ne m’aviez jamais entretenu. Là-dessus, sans
explication préalable, à l’instant même vous publiez une critique plus longue
que mon article, où vous me reprochez 1◦ De n’avoir rien compris à la
manière de poser la question 2◦ De n’y avoir apporté aucun élément nouveau
3◦ D’avoir pillé sans scrupule M. Weierstrass, M. Christoffel et vous.
Si au lieu de jeter brusquement ce débat dans le public, vous vous étiez
adressé à moi pour échanger des explications, comme je me voyais en droit
de l’espérer, nous nous serions sans doute entendu. Sur votre indication,
j’aurais relu plus attentivement votre mémoire de 1868 et constaté, ce que
je n’avais pas remarqué à première vue, que les formes bilinéaires non citées
3. F. Brechenmacher : Histoire du théorème de Jordan de la décomposition matricielle (1870–1930)
Revue d’Histoire des Mathématiques 2(13) p. 187–257 (2008)
71
dans votre travail, y sont pourtant implicitement comprises. De votre côté,

vous m’auriez concédé, j’en suis certain, que la réduction publiée par vous
à cette époque était insuffisante 1◦ Parce que ces faisceaux réduits conte-
naient encore des coefficients indéterminés à faire disparaître qui gêneraient
beaucoup pour étudier la question de l’équivalence 2◦ Parce que le carac-
tère fondamental de la réduction à savoir la décomposition en faisceaux
élémentaires n’était pas mise en évidence.
Vous m’auriez répondu que cette réduction ultérieure n’offrait pas grande
difficulté, j’aurais répliqué que toute la question est très simple d’un bout
à l’autre et nous serions tombés d’accord.
La publication imprévue de vos objections a un peu changé tout cela. Atta-
qué devant tout le monde, il me faut bien répondre de même et il ne tiendra
pas à moi que ce débat s’arrête là.
La querelle est l’occasion pour Kronecker d’exprimer son idéal de généralité : entre
Cauchy et Weierstrass, tout le monde s’était contenté de traiter le cas simple où « le
déterminant ne contient que des facteurs inégaux » (les valeurs propres sont distinctes).
Tandis que désormais. . .
Parce que, pendant si longtemps, on n’osait pas faire tomber la condition
que le déterminant ne contient que des facteurs inégaux, on est arrivé avec
cette question connue de la transformation simultanée de deux formes qua-
dratiques ; qui a été si souvent traitée depuis un siècle, mais de manière
sporadique, à des résultats très insuffisants et les vrais aspects de l’étude
ont été ignorés. Avec l’abandon de cette condition, le travail de Weierstrass
de l’année 1858 a conduit à un aperçu plus élevé et notamment à un règle-
ment complet du cas, dans lequel n’existent que des diviseurs élémentaires
simples. Mais l’introduction générale de cette notion de diviseur élémen-
taire, dont seule une étape provisoire était alors accomplie, intervint seule-
ment dans le mémoire de Weierstrass de l’année 1868, et une lumière tout à
fait nouvelle est ainsi faite sur la théorie des faisceaux pour n’importe quel
cas, avec la seule condition que le déterminant soit différent de zéro. Quand
j’ai aussi dépouillé cette dernière restriction et l’ai développée à partir de
la notion de diviseur élémentaire des faisceaux généraux, la clarté la plus
pleine s’est répandue sur une quantité de nouvelles formes algébriques, et
par ce traitement complet de l’objet, des vues plus élevées ont été acquises
sur une théorie des invariants comprise dans sa vraie généralité.
En 1878, Frobenius montrera que les points de vue de Jordan et Kronecker étaient
bel et bien équivalents, en élargissant la théorie de manière à englober les deux façons
de voir. En attendant, Jordan qui considère que la qualité principale de son approche
est son « extrême simplicité », ne parvient pas à obtenir, ni de Cayley et Sylvester ni
surtout de ses collègues français, le soutien qu’il estime mériter. Cela l’inquiète quelque
peu, surtout au moment où il candidate à l’Académie des Sciences. Il s’en ouvre à
72
Hermite.
Veuillez m’excuser si je prends la liberté de vous importuner encore en vous
renouvelant ma demande d’audience malgré le désir que m’aviez manifesté
de ne vous occuper de cette affaire que lorsque les cours de l’école polytech-
nique seraient terminés. J’apprends en effet de M. Fremy qu’il a l’intention
de proposer à l’Académie de pourvoir à la vacance dans les délais stricte-
ment règlementaires, c’est-à-dire très prochainement. D’autre part je n’ai
pas pu encore obtenir un soutien d’aucun des membres de la section aux-
quels je me suis adressé, bien qu’ils déclarent tous qu’ils ne sont pas au
courant de mes titres. Enfin j’apprends que l’on commence à dire ça et là
que mes travaux sont inintelligibles, et n’ont sans doute pas la portée qu’on
leur attribue. Vous m’avouerez qu’une semblable condamnation sans exa-
men serait un procédé trop commode pour se débarrasser d’un candidat.
Permettez-moi donc de faire appel à votre bienveillante équité. Vous seul
avez l’autorité nécessaire en ces sujets difficiles, pour imposer silence à ces
bruits défavorables, et me faire rendre la justice qui est due à tous. Si vous
avez la bonté de m’accorder deux heures d’entretien sérieux, je ne doute pas
qu’il me soit facile de vous édifier pleinement sur l’authenticité et la valeur
de mes découvertes. Je n’ai d’ailleurs pas besoin d’ajouter que je resterais à
votre disposition pour tous les éclaircissements ultérieurs que vous voudriez
bien me demander.
La réponse d’Hermite laisse transparaître comme un léger agacement !
L’étude de vos travaux est tellement difficile et tellement pénible que mes
devoirs présents me la rendent impossible. Votre mise en demeure de l’en-
treprendre cependant sur le champ, m’oblige de vous déclarer que si vous
récidivez à me les faire parvenir par ceux de vos amis qui sont membres
de l’Académie, j’y réponds en envoyant immédiatement ma démission de
membre de l’Institut.
Ne vous inquiétez pas, ce n’était que partie remise : Jordan a bien été élu à l’Académie
des Sciences, le 4 avril 1881.
73
Plan et espace
Eric Dumas, Emmanuel Peyre et Bernard Ycart
Ce chapitre est pour l’essentiel une révision des programmes de géométrie de vos
années de collège et de lycée. Il a pour but de vous préparer à voir la géométrie dans
un cadre plus général que celui des dimensions 2 et 3. Au passage, nous introduirons
quelques notions importantes, en particulier pour la physique, comme les déterminants
et le produit vectoriel.
Table des matières

1 Cours 1
1.1 Points, vecteurs et coordonnées . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Déterminants . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.5 Combinaisons linéaires et barycentres . . . . . . . . . . . . . . . . . . . 10
1.6 Droites et plans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.7 Produit scalaire et orthogonalité . . . . . . . . . . . . . . . . . . . . . . 15
1.8 Produit vectoriel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.9 Systèmes de coordonnées . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2 Entraînement 26
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Compléments 44
3.1 La géométrie du triangle . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 La proposition xxxii . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.3 Les Sangakus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.4 La règle de Sarrus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.5 Les géodésiens . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.6 Le cinquième postulat . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
19 novembre 2014
Maths en Ligne Plan et espace UJF Grenoble
1 Cours
1.1 Points, vecteurs et coordonnées
Une des difficultés de la géométrie est de bien comprendre la différence entre les
points et les vecteurs. On vous a appris que les points sont « fixés » et les vecteurs
sont « libres » (d’être translatés n’importe où dans le plan ou dans l’espace). Cette
vision des choses est largement suffisante pour vous permettre d’effectuer des calculs,
et vous pouvez vous en contenter pour l’instant. Nous décrirons à la section suivante
le formalisme mathématique de ces notions.
Un espace vectoriel est un ensemble de vecteurs muni de deux opérations, l’addi-
tion et la multiplication par un réel. Ce sont bien celles que vous connaissez et leurs
propriétés vous sont familières (figure 1).
(3/2) v
u+v
v
−u u
Figure 1 – Addition de deux vecteurs et multiplication d’un vecteur par un réel.
L’addition et la multiplication par un réel induisent la notion de combinaison li-

néaire. Si ~u et ~v sont deux vecteurs, les combinaisons linéaires de ~u et ~v sont les vecteurs
de la forme λ~u + µ~v , où λ et µ sont deux réels quelconques. On dit que ~u et ~v sont
liés si une de leurs combinaisons linéaires est égale au vecteur nul (noté ~0) sans que les
coefficients λ et µ soient tous les deux nuls. C’est équivalent à dire que l’un des deux
vecteurs est égal au produit de l’autre par un réel : on dit aussi que les deux vecteurs
sont colinéaires.
Une droite vectorielle est un espace vectoriel contenant des vecteurs non nuls, dans
lequel tous les vecteurs sont colinéaires entre eux. Dans une droite vectorielle tout
vecteur non nul constitue une base. Soit D une droite vectorielle et ~ı une base de D.
Pour tout vecteur ~u de D, il existe un réel x unique tel que ~u = x~ı.
Un plan vectoriel est un espace vectoriel contenant deux vecteurs non colinéaires, et
dans lequel tout vecteur est combinaison linéaire de ces deux vecteurs. Soit P un plan
vectoriel. Tout couple de vecteurs de P non colinéaires est une base du plan vectoriel.
Soit (~ı, ~) une base de P . À tout vecteur ~u de P correspond un couple unique de réels
(x, y) tel que
~u = x~ı + y~ .
Les deux réels x, y sont les coordonnées du vecteur ~u dans la base (~ı, ~).
1
L’addition et la multiplication des vecteurs se traduisent par les mêmes opérations

sur les coordonnées.
Proposition 1. Soit (~ı, ~) une base du plan vectoriel. Soient ~u et ~v deux vecteurs,
dont les coordonnées respectives dans la base (~ı, ~) sont (xu , yu ) et (xv , yv ). Soient λ et
µ deux réels quelconques. Les coordonnées du vecteur λ~u + µ~v dans la base (~ı, ~) sont
(λxu + µxv , λyv + µyv ).
λ~u + µ~v = (λxu + µxv )~ı + (λyu + µyv )~ .
Soit E un espace vectoriel. Un espace affine E est un ensemble de points. On suppose

définie une application de E × E vers E, qui à un couple (A, B) associe un vecteur, noté
−→
AB. Voyez le couple (A, B) comme une localisation dans l’espace affine du vecteur, A
étant l’origine et B l’extrémité. Au sens de l’addition des vecteurs, la relation suivante,
dite relation de Chasles, est vraie pour tous points A, B, C de l’espace affine E.
−→ −−→ −→
AB + BC = AC .
−→
Si de plus pour tout A, l’application de E vers E qui à B associe AB est bijective, on
dit que l’espace vectoriel E et l’espace affine E sont associés, ou bien que E est dirigé
par E.
−→
Lorsque AB = ~u, on écrit :
B = A + ~u ,
malgré le risque de confusion avec l’addition des vecteurs. Cet abus de notation sera
justifié plus loin.
Soit A un point d’un espace affine E, ~u un vecteur non nul de E, et B = A + ~u.
−−→
• La droite affine passant par A et B est l’ensemble des points M tels que AM = λ~u,
quand λ parcourt R.
D = { M = A + λ~u , λ ∈ R } .
−−→
• Le segment [A, B] est l’ensemble des points M tels que AM = λ~u, quand λ
parcourt l’intervalle [0, 1].
[A, B] = { M = A + λ~u , λ ∈ [0, 1] } .

−−→
• Le milieu du segment [A, B] est le point M tel que AM = (1/2)~u.
1
M = A + ~u .
2
2
La droite vectorielle
D = { λ~u , λ ∈ R } ,
est associée à la droite affine
D = {A + λ~u , λ ∈ R } .
Le plan vectoriel
P = { λ~u + µ~v , (λ, µ) ∈ R2 } ,
est associé au plan affine
P = {A + (λ~u + µ~v ) , (λ, µ) ∈ R2 } .
Dans le plan, deux droites affines sont dirigées par une même droite vectorielle si
et seulement si elles sont parallèles (d’intersection vide) ou confondues. Par un point
donné, passe une unique droite dont un vecteur directeur est donné, et donc une unique
parallèle à une droite donnée : c’est le fameux cinquième postulat d’Euclide.
Il est possible de choisir une même origine O pour les représentants de tous les
−→
vecteurs : à chaque vecteur ~u on associe alors l’unique point A tel que OA = ~u. On
définit ainsi une bijection de l’ensemble des vecteurs vers l’ensemble des points.
−→
Si ~u = AB, la relation de Chasles justifie la notation B = A + ~u, puisqu’alors
−−→ −→ −→ −→
OB = OA + AB = OA + ~u ,
au sens de l’addition des vecteurs.

La donnée d’une origine O et d’une base de l’espace vectoriel E constitue un repère
de l’espace affine associé : tout point A de E est repéré de façon unique par les coor-
−→
données du vecteur OA dans la base. Par exemple si le plan affine P est muni d’un
repère (O,~ı, ~), à tout point A du plan correspond le couple unique de réels (x, y) qui
−→
sont les coordonnées du vecteur OA dans la base (~ı, ~).
1.2 Espaces vectoriels

Nous donnons ici, sans démonstrations, un résumé (trop) rapide de la théorie des
espaces vectoriels de dimension finie. Ces notions seront reprises en détail dans un autre
chapitre.
Un espace vectoriel est un ensemble sur lequel sont définies ;
• une addition interne (on peut ajouter entre eux deux éléments de l’ensemble),
nombre réel).
Ces deux opérations doivent vérifier certaines propriétés de compatibilité qui sont lis-
tées dans la définition 1. Pour la multiplication externe, l’ensemble des réels peut être
remplacé par n’importe quel ensemble de nombres muni d’une addition et d’une mul-
tiplication (par exemple C), sans changer aucun des énoncés qui suivent.
3
Définition 1. Soit E un ensemble non vide. On dit que E est un espace vectoriel sur
R si E est muni d’une addition et d’une multiplication externe vérifiant les propriétés
suivantes. (
E × E −→ E
• Addition :
(~v , w)
~ 7−→ ~v + w ~
1. Associativité : ∀~u, ~v , w
~ ∈ E , ~u + (~v + w)~ = (~u + ~v ) + w
~
2. Élément neutre : ∃~e ∈ E , ∀~v ∈ E , ~v + ~e = ~e + ~v = ~v
3. Opposé : ∀~v ∈ E , ∃~v 0 ∈ E , ~v + ~v 0 = ~v 0 + ~v = ~e
4. Commutativité : ∀~v , w ~ ∈ E , ~v + w
~ =w ~ + ~v
(
R × E −→ E
(λ, ~v ) 7−→ λ ~v
5. Associativité : ∀λ, µ ∈ R , ∀~v ∈ E , λ(µ ~v ) = (λµ) ~v
6. Élément neutre : ∀~v ∈ E , 1 ~v = ~v
7. Distributivité (1) : ∀λ, µ ∈ R , ∀~v ∈ E , (λ + µ) ~v = λ ~v + µ ~v
8. Distributivité (2) : ∀λ ∈ R , ∀~v , w
~ ∈ E , λ (~v + w)
~ = λ ~v + λ w ~
En utilisant les propriétés de la définition, on démontre que :
1. le produit par le réel 0 d’un vecteur ~v quelconque est l’élément neutre pour
l’addition :
∀~v ∈ E , 0 ~v = ~e ,
2. le produit par le réel −1 d’un vecteur ~v quelconque est son opposé pour l’addition :
∀~v ∈ E , ~v + (−1) ~v = ~e .
En conséquence, on note ~0 l’élément neutre pour l’addition (qu’on appelle le vecteur
nul) et −~v l’opposé de ~v .
L’exemple fondamental est l’ensemble des n-uplets de réels :
Rn = { (x1 , . . . , xn ) , x1 , . . . , xn ∈ R } .
L’ensemble des n-uplets de réels (couples pour n = 2, triplets pour n = 3, . . . ), est
• Addition : (1, 2, 3, 4) + (3, −1, −2, 2) = (4, 1, 1, 6)
Le singleton contenant seulement le vecteur nul est un espace vectoriel particulier, dont
on convient qu’il est de dimension 0. Tous les espaces vectoriels considérés dans la suite
sont supposés contenir au moins un vecteur non nul.
La notion de combinaison linéaire, que nous avons rappelée dans le cas de deux
vecteurs, est l’outil de base des espaces vectoriels. Dans tout ce qui suit, n désigne
un entier strictement positif. Une combinaison linéaire de n vecteurs se définit comme
suit.
4
Définition 2. Soient ~u1 , . . . , ~un n vecteurs dans un espace vectoriel. On appelle com-
binaison linéaire des vecteurs ~u1 , . . . , ~un tout vecteur s’écrivant :
n
X
λi ~ui = λ1~u1 + · · · + λn~un ,
i=1
Un sous-espace d’un espace vectoriel E est un sous-ensemble qui est lui-même un

espace vectoriel pour les opérations de E. Pour qu’un sous-ensemble soit un sous-
espace, il est nécessaire et suffisant qu’il contienne toutes les combinaisons linéaires
d’un nombre quelconque de ses vecteurs.
Définition 3. Soit E un espace vectoriel, F un sous-ensemble de E. On appelle sous-

espace engendré par F l’ensemble des combinaisons linéaires de vecteurs de F .
Tout sous-espace contenant F , contient nécessairement le sous-espace engendré par

F.
Définition 4. Soit E un espace vectoriel, ~u1 , . . . , ~un n vecteurs de E.

1. On dit que (~u1 , . . . , ~un ) est une famille génératrice de E si le sous-espace vectoriel
qu’elle engendre est égal à E lui-même.
n
∀~v ∈ E , ∃(λ1 , . . . , λn ) ∈ Rn ,
X
~v = λi ~ui
i=1
2. On dit que E est de dimension finie s’il est engendré par une famille finie de
vecteurs. Un sous-espace d’un espace vectoriel de dimension finie, est lui-même
de dimension finie.
3. On dit que (~u1 , . . . , ~un ) est une famille libre si la seule combinaison linéaire nulle
a tous ses coefficients nuls.
n
λi ~ui = ~0 =⇒ (λ1 = . . . = λn = 0)
X
i=1
Une famille qui n’est pas libre est dite liée.

4. On dit que (~u1 , . . . , ~un ) est une base de E si c’est une famille à la fois génératrice
et libre.
Deux vecteurs liés sont colinéaires, trois vecteurs liés sont dits coplanaires.
Rappelons que deux vecteurs ~u et ~v sont colinéaires si et seulement s’il existe un
nombre réel λ tel que ~u = λ~v ou ~v = λ~u. Plus généralement, si n ≥ 2, une famille
(u1 , . . . , un ) est liée si et seulement s’il existe i ∈ {1, . . . , n} tels que ui soit combinaison
linéaire de la famille (u1 , . . . , ui−1 , ui+1 , . . . , un ).
5
Théorème 1. Dans un espace vectoriel de dimension finie, contenant des vecteurs non
nuls, il existe une infinité de bases et toutes les bases ont le même cardinal.
Par définition, le nombre d’éléments commun de toutes les bases est la dimension
de l’espace.
Les coordonnées d’un vecteur sont définies grâce au résultat suivant.
Théorème 2. Soit E un espace vectoriel de dimension n et (~u1 , . . . , ~un ) une base de
E. Pour tout ~v ∈ E, il existe un unique n-uplet de réels (x1 , . . . , xn ) tel que :
n
X
~v = xi~ui .
i=1
Les réels x1 , . . . , xn sont les coordonnées de ~v dans la base (~u1 , . . . , ~un ).

Le n-uplet (x1 , . . . , xn ) est un élément de l’espace vectoriel Rn . Dans Rn , la base la
plus naturelle est constituée des n-uplets dont une seule coordonnée vaut 1, les autres
étant nulles.
(1, 0, . . . , 0) , (0, 1, . . . , 0) , . . . , (0, 0, . . . , 1) .
On appelle cette base, la base canonique. Constatez avec soulagement que les coordon-
nées du n-uplet (x1 , . . . , xn ) dans la base canonique sont les n réels x1 , . . . , xn .
1.3 Déterminants
Dans cette section, nous définissons la notion de déterminant, puis nous en dé-
duisons un critère pratique pour reconnaître une base, dans un espace vectoriel de
dimension 2 ou 3. Nous commençons par la dimension 2.
Définition 5. Soit E un espace vectoriel de dimension 2 et soit B = (~ı, ~ ) une base de
E. Soient ~u = x1~ı + y1~ et ~v = x2~ı + y2~ des éléments de E. On appelle déterminant
de (~u, ~v ) dans la base B le nombre réel :

x x2
1
DetB (~u, ~v ) = = x1 y 2 − y 1 x2 .
y1 y2

Proposition 2. Soit B = (~ı, ~ ) une base de E. Le déterminant vérifie les assertions

suivantes :
a) Pour tout vecteur ~u de E,
DetB (~u, ~u) = 0 .
b) Pour tous vecteurs ~u, ~v de E,
DetB (~u, ~v ) = −DetB (~v , ~u) .
6
c) Soient ~u, ~v et w
~ des éléments de E, λ et µ des nombres réels.
DetB (~u, λ~v + µw)

~ = λDetB (~u, ~v ) + µDetB (~u, w),
~
DetB (λ~u + µ~v , w)
~ = λDetB (~u, w)
~ + µDetB (~v , w);
~
d) Si B 0 = (~ı0 , ~0 ) est une base de E, alors :
DetB (~u, ~v ) = DetB0 (~u, ~v ) DetB (~ı0 , ~0 ) .
Démonstration : Soient x1 et y1 deux réels.

x x1
1
= x1 y 1 − y 1 x1 = 0 .
y1 y1

Donc, pour tout ~u de E, DetB (~u, ~u) = 0, ce qui démontre a). De même, la relation

x x1 x x
2 1 2
= x2 y1 − y2 x1 = −
y2 y1 y1 y2

entraîne l’assertion b).

Soient x1 , x2 , x3 , y1 , y2 , y3 , λ et µ des nombres réels. L’assertion c) découle des
égalités :

x
1 λx2 + µx3
= x1 (λy2 + µy3 ) − y1 (λx2 + µx3 )
y1 λy2 + µy3

= λ(x1 y2 − y1 x2 ) + µ(x1 y3 − y1 x3 )

x x x x
1 2 1 3
= λ + µ .
y1 y2 y1 y3
Reprenons les notations de l’assertion d). Soient x01 , y10 (resp. x02 , y20 ) les coordonnées
de ~u (resp. ~v ) dans la base B 0 .
~u = x01~ı0 + y10 ~0 et ~v = x02~ı0 + y20 ~0 .
En appliquant c), b) et a) on obtient :
DetB (~u, ~v ) = DetB (x01~ı0 + y10 ~0 , x02~ı0 + y20 ~0 )

= x01 DetB (~ı0 , x02~ı0 + y20 ~0 ) + y10 DetB (~0 , x02~ı0 + y20 ~0 )
= x01 y20 DetB (~ı0 , ~0 ) + y10 x02 DetB (~0 ,~ı0 )
= DetB0 (~u, ~v ) DetB (~ı0 , ~0 ) .

Corollaire 1. Soit B = (~ı, ~ ) une base de E. Pour tous ~u, ~v de E, DetB (~u, ~v ) = 0 si
et seulement si ~u et ~v sont colinéaires.
7
Démonstration : Si ~u et ~v sont colinéaires, alors il existe λ ∈ R tel que ~u = λ~v ou

~v = λ~u. Dans les deux cas, il résulte des assertions a) et c) de la proposition que
DetB (~u, ~v ) = 0.
Si ~u et ~v ne sont pas colinéaires, alors la famille B 0 = (~u, ~v ) est une base de E. Par
la relation d), on obtient que :

1 0
DetB0 (~ı, ~)DetB (~u, ~v ) = DetB (~ı, ~) = =1.

0 1

Par conséquent, DetB (~u, ~v ) 6= 0.
Passons maintenant à la dimension 3. Soit E un espace vectoriel de dimension 3

(par exemple E = R3 ). Soient ~u, ~v et w~ des vecteurs de E. La famille (~u, ~v , w)
~ est liée
si et seulement si les trois vecteurs sont coplanaires, ou encore si et seulement si un de
ces vecteurs est une combinaison linéaire des deux autres.
Définition 6. Soit B = (~ı, ~, ~k) une base de l’espace vectoriel E. Soient ~u1 , ~u2 et ~u3
des vecteurs de E. Pour i ∈ {1, 2, 3}, on note (xi , yi , zi ) des coordonnées de ~ui dans la
base B. On appelle déterminant de (~u1 , ~u2 , ~u3 ) dans la base B le nombre réel :

x x2 x3
1
DetB (~u1 , ~u2 , ~u3 ) = y1 y2 y3

z1 z2 z3
= x1 y2 z3 + x2 y3 z1 + x3 y1 z2 − z1 y2 x3 − z2 y3 x1 − z3 y1 x2

y y x x x x
2 3 2 3 2 3
= x1 − y1 + z1 ·
z2 z3 z2 z3 y2 y3
Pour calculer le déterminant de trois vecteurs, on peut utiliser la règle de Sarrus : on

réécrit les deux premières lignes du déterminant en dessous de celui-ci, puis on effectue
tous les produits en diagonale. On affecte du signe + les diagonales descendantes, du
signe − les diagonales montantes, et on ajoute le tout (figure 2). Par exemple :

1 2 3

2 −1 1
= +(−2) + (−12) + (+6) − (−9) − (−2) − (+8) = −5
3 −2 2

Proposition 3. Soit B = (~ı, ~, ~k) une base de l’espace vectoriel E. Le déterminant de
trois vecteurs de E vérifie les assertions suivantes :
a) Soient ~u et ~v des éléments de E.
DetB (~u, ~u, ~v ) = DetB (~u, ~v , ~u) = DetB (~u, ~v , ~v ) = 0.
b) Soient ~u, ~v et w
~ des éléments de E.
~ = −DetB (~v , ~u, w)
DetB (~u, ~v , w) ~ = DetB (~v , w,
~ ~u).
8
− z1 y2 x3
x1 x2 x3 − x1 z2 y3
y1 y2 y3
− y1 x2 z3
z1 z2 z3
x1 x2 x3 + x1 y2 z3
y1 y2 y3 + y1 z2 x3
+ z1 x2 y3
Figure 2 – Règle de Sarrus.
c) Soient ~u, ~v , w
~ et ~x des éléments de E, λ et µ des nombres réels. Les relations
suivantes sont vraies.
DetB (λ~u + µ~v , w,

~ ~x) = λDetB (~u, w,
~ ~x) + µDetB (~v , w,
~ ~x)
DetB (~u, λ~v + µw,~ ~x) = λDetB (~u, ~v , ~x) + µDetB (~u, w,
~ ~x)
DetB (~u, ~v , λw
~ + µ~x) = λDetB (~u, ~v , w)
~ + µDetB (~u, ~v , ~x) .
d) Si B 0 = (~ı0 , ~0 , ~k 0 ) est une base de E, alors pour tout triplet (~u, ~v , w) ~ de vecteurs
de E,
DetB (~u, ~v , w) ~ DetB (~ı0 , ~0 , ~k 0 ) .
~ = DetB0 (~u, ~v , w)
Démonstration : Ces assertions se montrent par des calculs élémentaires comme dans
le cas du déterminant de deux vecteurs.
Corollaire 2. Soit B = (~ı, ~, ~k) une base de E. Pour tout triplet (~u, ~v , w)
~ de vecteurs
de E, DetB (~u, ~v , w)
~ = 0 si et seulement si les vecteurs ~u, ~v et w
~ sont coplanaires.
1.4 Espaces affines

Passons maintenant à la définition d’un espace affine.
Définition 7. Soit E un espace vectoriel sur R. On appelle espace affine de direction
E un ensemble E non vide, muni d’une application
E × E −→ E
−→
(A, B) 7−→ AB
telle que :
9
−→
1. pour tout A ∈ E, l’application qui à B associe AB est bijective : pour tout ~u ∈ E,
−→
il existe un unique B ∈ E, tel que AB = ~u. On le note B = A + ~u ;
2. la relation de Chasles est vérifiée.
−→ −−→ −→
∀A, B, C ∈ E , AB + BC = AC .
Soient A, C deux points de E, ~u un vecteur de E. Notons B = A + ~u et D = C + ~u.

Les couples de points (A, B) et (C, D) sont dits équipollents : les 4 points A, B, D, C
forment un parallélogramme (ses diagonales se coupent en leur milieu : figure 3).
A
D
Figure 3 – Couples de points équipollents.
La relation d’équipollence est une relation d’équivalence sur l’ensemble E × E des

couples de points de l’espace affine. À tout vecteur ~u de E correspond une classe
d’équivalence de couples et une seule :
~u ←→ {(A, B) ∈ E × E , B = A + ~u } .
Ceci définit une bijection entre l’ensemble quotient de E × E par la relation d’équipol-
lence, et l’espace vectoriel associé E.
À tout vecteur correspond une classe d’équivalence de couples de points équipol-
−→
lents. Etant donné un couple de points (A, B), le vecteur AB peut donc être interprété
comme la classe d’équivalence de (A, B) pour la relation d’équipollence.
1.5 Combinaisons linéaires et barycentres

Soit E un espace vectoriel, et E un espace affine de direction E. Rappelons que la
combinaison linéaire des n vecteurs ~u1 , . . . , ~un affectés des coefficients réels λ1 , . . . , λn
est le vecteur : n X
λi ~ui .
i=1
10
Passons de l’espace vectoriel à l’espace affine, c’est-à-dire des vecteurs aux points.
Dès qu’une origine O a été choisie, on peut associer à n points A1 , . . . , An et n réels
−−→
λ1 , . . . , λn le point M tel que OM soit la combinaison linéaire :
n
−−→ X −−→
OM = λi OAi .
i=1
La proposition suivante montre que ce point M ne dépend pas du choix de l’origine,

quand la somme des coefficients vaut 1.
Proposition 4. Soient A1 , . . . , An n points dans un espace affine E, λ1 , . . . , λn n réels
tels que λ1 + · · · + λn = 1. Soit O un point de E, et M le point défini par :
n
−−→ X −−→
OM = λi OAi .
i=1
Pour tout point O0 de E,

−− → X n −−→
O0 M = λi O0 Ai .
i=1
Démonstration : Il suffit d’utiliser la relation de Chasles :

n −−→ n −−→ −−→
λi O0 Ai = λi (O0 O + O0 Ai )
X X
i=1 i=1
n −−0→ n
! !
X X −−→
= λi OO+ λi OAi
i=1 i=1
−−→ −−→ −−→

= O0 O + OM = O0 M .

Vous avez sans doute reconnu dans la proposition précédente la notion de bary-
centre d’une famille de points affectés de coefficients (ou pondérations). Elle vous a été
présentée comme suit.
Définition 8. Soient A1 , . . . , An n points dans un espace affine E, λ1 , . . . , λn n réels
tels que λ1 + · · · + λn 6= 0. On appelle barycentre des points A1 , . . . , An affectés des
pondérations λ1 , . . . , λn le point M tel que pour tout point O :
n
!
−−→ 1 X −−→
OM = P λi OAi . (1)
λi i=1
En remplaçant O par M dans (1), on obtient

n
−−→
λi M Ai = ~0 .
X
i=1
11
Le barycentre M est le seul point de l’espace tel que la combinaison linéaire des vecteurs
−−→
M Ai affectés des coefficients λi soit nulle.
Quand les coefficients λi sont tous égaux, on parle d’isobarycentre. En physique, la
notion de barycentre se réfère à des coefficients tous positifs, que l’on comprend comme
des masses placées aux points A1 , . . . , An . Le barycentre, ou centre de gravité, est un
point d’équilibre pour l’ensemble des masses. Insistons sur le fait que dans la définition
8, les coefficients sont de signe quelconque.
Proposition 5. Soient A, B deux points distincts d’un espace affine. La droite affine
passant par A et B est l’ensemble des barycentres de A et B, affectés de coefficients λ
et µ tels que λ + µ 6= 0.
Démonstration : La droite passant par A et B peut être vue comme la droite passant
−→
par A de vecteur directeur AB :
−→
D = { A + λAB , λ ∈ R } .
Soit O une origine quelconque. Le point M appartient à la droite D si et seulement si

−−→ −→ −→ −→ −−→
OM = OA + λAB = (1 − λ)OA + λOB ,
pour un certain réel λ. Donc M est le barycentre de A et B affectés des coefficients

(1 − λ) et λ. Réciproquement, si M est le barycentre de A et B affectés des coefficients
λ1 et λ2 , alors :
−−→ 1 −→ −−→
OM = (λ1 OA + λ2 OB)
λ1 + λ2
1 −→ −→ −→
= (λ1 OA + λ2 (OA + AB))
λ1 + λ2
−→ λ2 −→
= OA + AB .
λ1 + λ2

De façon analogue, l’ensemble des barycentres de 3 points est le plan passant par
ces 3 points.
Proposition 6. Soient A, B, C trois points non alignés d’un espace affine. Le plan
affine contenant A, B et C est l’ensemble des barycentres de A, B, C affectés de
coefficients λ, µ, ν tels que λ + µ + ν 6= 0.
1.6 Droites et plans

Cette section rappelle les équations des droites et des plans. Nous commençons par
la dimension 2, et considérons un plan affine P et son plan vectoriel associé P .
12
Soit A un point de P et ~u un vecteur non nul de P . La droite de vecteur directeur

~u passant par A est l’ensemble des points A + λ~u, où λ parcourt R.
D = {A + λ~u , λ ∈ R} .
Supposons le plan muni d’un repère (O,~ı, ~). Notons xA et yA les coordonnées de A
dans le repère (O,~ı, ~), xu et yu les coordonnées de ~u dans la base (~ı, ~). Les coordonnées
x, y de M = A + λ~u sont : (
x = xA + λxu
(2)
y = yA + λyu .
Les équations ci-dessus sont les équations paramétriques de la droite D. On obtient son
équation implicite (on dit aussi « cartésienne ») en notant que le point M appartient
~ et ~u sont colinéaires, ce qui se traduit,
à la droite D si et seulement si les vecteurs AM
à l’aide du déterminant par l’équation :

x − x xu
A
=0,

y − yA yu

c’est-à-dire :
yu x − xu y − (yu xA − xu yA ) = 0 .
La proposition suivante montre que, réciproquement, toute équation de ce type définit
bien une droite.
Proposition 7. Soient a et b deux réels, dont un au moins est non nul. Pour tout réel
c l’ensemble des points de coordonnées (x, y) telles que :
ax + by + c = 0 , (3)
est une droite dont un vecteur directeur a pour coordonnées (−b, a).
Démonstration : Sans perte de généralité, nous pouvons supposer a 6= 0. Soit A un

point dont les coordonnées (xA , yA ) vérifient (3) (par exemple xA = −c/a et yA = 0).
Nous devons démontrer que, pour tout point M dont les coordonnées vérifient (3), le
−−→
vecteur AM et le vecteur ~u de coordonnées (−b, a) sont colinéaires. Ecrivons :
ax +by +c = 0
axA +byA +c = 0 ,
et soustrayons les deux équations. On obtient :
a(x − xA ) + b(y − yA ) = 0 .
−−→
Les coordonnées du vecteur AM sont (x − xA , y − yA ). Posons λ = −a et µ = y − yA .
On vérifie que
λ(x − xA ) + µ(−b) = 0 et λ(y − yA ) + µ(a) = 0 ,
13
soit
−−→
λAM + µ ~u = ~0 .
−−→
Réciproquement, soit M un point tel que AM et ~u sont colinéaires. Soient x et y les
coordonnées de M : il existe un réel λ tel que,
x − xA = −λb et y − yA = λa .
Ceci entraîne :
a(x − xA ) + b(y − yA ) = 0 ,
et donc :
ax + by + c = 0 .

En dimension 3 un plan est déterminé par un point A et deux vecteurs ~u, ~v non
colinéaires.
P = { A + λ~u + µ~v , λ, µ ∈ R } .
Soit (O,~ı, ~, ~k) un repère de l’espace. Les trois coordonnées d’un point du plan P
s’écrivent : 
 x = xA + λ xu + µ xv

y = yA + λ yu + µ yv (4)


z = zA + λ zu + µ zv .
Ce sont les équations paramétriques du plan P. Pour obtenir son équation implicite, il
faut éliminer λ et µ dans les équations paramétriques. C’est moins facile qu’en dimen-
sion 2. L’expression des trois coefficients a, b, c ci-dessous peut paraître arbitraire, mais
vous y reconnaîtrez en fait trois déterminants. Nous expliquerons plus loin leur sens
mathématique.
a = yu zv − yv zu , b = zu xv − zv xu , c = xu yv − xv yu . (5)
Lemme 1. Pour tous réels xu , yy , zu , xv , yv , zv , si a, b, c sont définis par (5), alors :
axu + byu + czu = 0 et axv + byv + czv = 0 . (6)
Démonstration : La vérification, laissée au lecteur, est un peu fastidieuse, mais elle ne

présente aucune difficulté.
Multiplions les équations paramétriques (4) respectivement par a, b et c, et ajoutons
les trois : d’après le lemme 1 λ et µ disparaissent et on obtient :
ax + by + cz − (axA + byA + czA ) = 0 .
Réciproquement, toute équation du type ax + by + cz + d = 0 définit bien un plan, que

nous caractériserons à la section suivante.
14
En dimension 3, les équations paramétriques de la droite
D = { A + λ~u , λ ∈ R } ,
sont sans surprise : 


 x = xA + λ xu
y = yA + λ yu (7)


z = zA + λ zu .
Pour éliminer λ et obtenir des équations implicites, nous pouvons appliquer la technique
déjà utilisée en dimension 2, par exemple aux deux premières équations, ensuite aux
deux dernières. Voici le résultat.
(
yu x − xu y − (yu xA − xu yA ) = 0
zu y − yu z − (zu yA − yu zA ) = 0 .
Les deux équations obtenues sont les équations de deux plans dont la droite D est
l’intersection. Evidemment elles n’ont rien d’uniques. Il existe une infinité de manières
d’exprimer une droite comme intersection de deux plans.
1.7 Produit scalaire et orthogonalité

Commençons par la définition d’un produit scalaire.
Définition 9. Soit E un espace vectoriel. Soit S une application de E × E dans R.
On dit que l’application S est un produit scalaire si elle est :
1. symétrique : pour tous vecteurs ~u, ~v ,
S(~u, ~v ) = S(~v , ~u) ;
2. bilinéaire : pour tous vecteurs ~u, ~v , w

~ et tous réels λ, µ,
S(~u, (λ~v + µw))

~ = λS(~u, ~v ) + µS(~u, w)
~
S((λ~u + µ~v ), w)
~ = λS(~u, w)~ + µS(~v , w)
~ ;
3. définie positive : pour tout vecteur ~u,
S(~u, ~u) ≥ 0 et S(~u, ~u) = 0 ⇐⇒ ~u = ~0 .
Observez que si S est symétrique, et linéaire par rapport à l’une des composantes,
elle est nécessairement linéaire par rapport à l’autre.
Soit E un espace vectoriel de dimension n, muni d’une base (~u1 , . . . , ~un ). Soient ~u
et ~v deux vecteurs de E.
n
X n
X
~u = xi ~ui et ~v = yi ~ui
i=1 i=1
15
On appelle produit scalaire de ~u et ~v relatif à la base (~u1 , . . . , ~un ), et on note ~u · ~v la

somme des produits deux à deux des coordonnées.
n
X
~u · ~v = xi y i .
i=1
Il est immédiat de vérifier que le produit scalaire relatif à une base, vérifie bien la
définition 9. On démontre que si S est un produit scalaire au sens de la définition 9,
sur un espace de dimension finie, alors il existe une base B telle que S soit le produit
scalaire relatif à la base B. En dimension finie, quitte à changer de base, on se ramène
donc toujours au cas où le produit scalaire est la somme des produits deux à deux des
coordonnées. Nous noterons donc désormais ~u · ~v le produit scalaire de deux vecteurs,
comme vous en avez l’habitude.
Dans un espace vectoriel, la donnée d’un produit scalaire induit les notions d’or-
thogonalité, et de norme.
Définition 10. Soit E un espace vectoriel muni d’un produit scalaire.

1. On dit que deux vecteurs ~u et ~v de E sont orthogonaux si leur produit scalaire
est nul.
2. On appelle norme d’un vecteur ~u de E, et on note k~uk la racine carrée du produit
scalaire de u par lui même. √
k~uk = ~u · ~u .
Comme conséquence du fait qu’un produit scalaire est défini positif, la norme d’un
vecteur ne peut être nulle que si ce vecteur est nul. De même, si deux vecteurs sont à la
fois orthogonaux et colinéaires alors l’un d’entre eux est le vecteur nul ; ou de manière
équivalente, si deux vecteurs non nuls sont orthogonaux, ils ne sont pas colinéaires.
Considérons un espace vectoriel de dimension n, muni d’une base (~u1 , . . . , ~un ) et
notons ~u · ~v le produit scalaire relatif à cette base.
Dans la base (~u1 , . . . , ~un ), le vecteur ~ui a toutes ses coordonnées nulles, sauf la i-
ième qui vaut 1. On vérifie donc immédiatement que ~ui a pour norme 1 et que ~ui et ~uj
sont orthogonaux pour i 6= j. On dit que la base est orthonormée.
Définition 11. Soit E un espace vectoriel de dimension n, muni d’un produit scalaire.
On dit que la base (~u1 , . . . , ~un ) est orthonormée, si les vecteurs sont orthogonaux deux
à deux, et chacun d’eux est de norme 1.
(
0 si i 6= j
∀i, j = 1, . . . , n , ~ui · ~uj =
1 si i = j .
Tel que nous l’avons défini, le produit scalaire semble dépendre de la base. La
proposition suivante montre que si on remplace la base initiale par une autre base
orthonormée, le produit scalaire garde la même écriture.
16
Proposition 8. Soient ~u et ~v deux vecteurs d’un espace vectoriel E de dimension n,

et ~u · ~v leur produit scalaire relatif à la base (~u1 , . . . , ~un ). Soit (~u01 , . . . , ~u0n ) une autre
base orthonormée. Soient (x01 , . . . , x0n ) et (y10 , . . . , yn0 ) les coordonnées respectives de ~u
et ~v dans cette nouvelle base. Alors :
n
x0i yi0 .
X
~u · ~v =
i=1
Démonstration : En utilisant la bilinéarité :

n
!  n 
x0 ~u0 ·  y 0 u~0j 
X X
~u · ~v = i i j
i=1
 j=1 
n n
x0i yj0 ~u0i · ~u0j 
X X
= 
i=1 j=1
n
x0i yi0 ,
X
=
i=1
car puisque la base est orthonormée,
~u0i · ~u0i = 1 et ~u0i · ~u0j = 0 si i 6= j .

Voici un résultat souvent utile, l’inégalité de Cauchy-Schwarz.
Théorème 3. Soit ~u et ~v deux vecteurs.
|~u · ~v | ≤ k~uk k~v k , (8)
l’égalité ayant lieu si et seulement si ~u et ~v sont colinéaires.
Démonstration : Soit x un réel quelconque. Calculons le produit scalaire du vecteur

x~u + ~v par lui-même, en utilisant la bilinéarité et la symétrie :
(x~u + ~v ) · (x~u + ~v ) = x2 (~u · ~u) + 2x(~u · ~v ) + (~v · ~v )
Cette expression est un polynôme du second degré en x. Or pour tout x, il prend

une valeur positive ou nulle. Son discriminant ne peut pas être strictement positif, car
sinon le polynôme aurait deux racines réelles entre lesquelles il prendrait des valeurs
négatives. Ecrire que le discriminant est négatif ou nul donne :
(~u · ~v )2 ≤ (~u · ~u) (~v · ~v ) ,
soit
(~u · ~v )2 ≤ k~uk2 k~v k2 ,
17
ce qui entraîne (8). L’égalité a lieu si et seulement si le trinôme admet une racine double
x, valeur pour laquelle x~u + ~v est le vecteur nul.
Passons maintenant à l’espace affine. Rappelons qu’un repère est constitué d’une
origine O et d’une base de l’espace vectoriel associé. Dire qu’on munit l’espace d’un
repère orthonormé, c’est supposer implicitement qu’on dispose d’un produit scalaire,
pour lequel les vecteurs de la base sont orthogonaux deux à deux, et de norme 1. Ceci
permet de définir la distance euclidienne.
Définition 12. Soit E un espace affine, muni d’un repère orthonormé. On appelle
distance euclidienne de deux points A et B, et on note d(A, B), la norme du vecteur
−→
AB.
Vous apprendrez plus tard qu’il existe de multiples manières de définir une dis-
tance dans un espace. Pour l’instant, nous n’utiliserons que celle-ci, et nous omettrons
l’adjectif « euclidienne ».
L’inégalité de Cauchy-Schwarz montre que le rapport entre le produit scalaire de
deux vecteurs non nuls et le produit de leurs normes est compris entre −1 et 1. Ce
rapport est interprété comme le cosinus de l’angle que forment les deux vecteurs.
−→ −−→
OA · OB = d(O, A)d(O, B) cos(AOB)
[ . (9)
Cette interprétation permet de retrouver tous les résultats classiques de la géométrie

plane ; par exemple le théorème suivant, dit théorème d’Al-Kashi (figure 4).
−→
Théorème 4. Soient A, B, C trois points du plan et α l’angle des deux vecteurs AB,
−→
AC.
d2 (B, C) = d2 (A, B) + d2 (A, C) − 2d(A, B)d(A, C) cos(α) .
Le cas particulier où le triangle est rectangle en A (cos(α) = 0) est le théorème du
regretté Pythagore.
Démonstration : La relation de Chasles donne :
−−→ −→ −→
BC = AC − AB .
En utilisant la bilinéarité du produit scalaire, on écrit :

−−→ −→ −→ −→ −→
kBCk2 = (AC − AB) · (AC − AB)
−→ −→ −→ −→
= kACk2 − 2(AB · AC) + kABk2
−→ −→ −→ −→
= kACk2 − 2kABk kACk cos(α) + kABk2 .

Définir rigoureusement la notion d’angle de deux vecteurs pose un problème de

choix d’orientation. En dimension 2 les angles sont mesurés de 0 à 2π, dans le sens
18
α b
c
B C
a
Figure 4 – Le théorème d’Al-Kashi : a2 = b2 + c2 − 2bc cos(α).
trigonométrique. En dimension 3, parler d’angle dans un plan suppose qu’on a défini

une orientation du plan, ce qui peut se faire si on a défini une orientation de l’espace,
et une orientation normale du plan.
Deux ensembles de vecteurs sont dits orthogonaux si tout vecteur de l’un est or-
thogonal à tout vecteur de l’autre. Nous examinons le cas particulier de deux droites
vectorielles dans un plan. Observons que, du fait de la bilinéarité, si deux vecteurs sont
orthogonaux, tout vecteur colinéaire à l’un est orthogonal à tout vecteur colinéaire à
l’autre.
~u · ~v = 0 =⇒ ∀λ, µ ∈ R , (λ~u) · (µ~v ) = λµ(~u · ~v ) = 0 .
Réciproquement, l’ensemble des vecteurs du plan, orthogonaux à un vecteur donné est
une droite vectorielle.
Définition 13. On dit que deux droites du plan affine sont orthogonales (ou perpen-
diculaires) si tout vecteur directeur de l’une est orthogonal à tout vecteur directeur de
l’autre.
La projection orthogonale utilise le fait qu’il existe une seule perpendiculaire à une
droite donnée passant par un point extérieur à cette droite (figure 5).
Définition 14. Soit D une droite et A un point du plan, n’appartenant pas à D. on

appelle projection orthogonale de A sur D le point d’intersection de D avec la droite
orthogonale à D passant par A. On appelle distance du point A à la droite D la distance
du point à sa projection orthogonale sur la droite.
On étend cette définition de façon évidente aux points de D : la projection ortho-

gonale d’un point de D sur D est le point lui-même, et sa distance à D est nulle. Le
théorème de Pythagore entraîne que la distance d’un point à une droite est la plus
petite des distances de ce point à un point de la droite. Dans le cas où la droite est
définie par une équation implicite, la distance d’un point à cette droite se calcule très
simplement.
19
Proposition 9. Considérons le plan muni d’un repère orthonormé (O,~ı, ~). Soit D la
droite d’équation implicite ax + by + c = 0, et A le point de coordonnées (xA , yA ). La
distance du point A à la droite D est :
|axA + byA + c|
√ .
a2 + b 2
Démonstration : Si A ∈ D la distance est nulle, et la formule est vraie. Supposons

maintenant que le point A n’appartienne pas à la droite D (figure 5). Le vecteur
de coordonnées (a, b), que nous noterons ~n, est orthogonal au vecteur de coordonnées
(−b, a), qui est un vecteur directeur de la droite (~n pour « normal » : un autre synonyme
d’orthogonal). Notons H la projection orthogonale de A sur D. Tout point M de la
droite vérifie :
−−→ −−→ −−→ −−→
AM · ~n = (HM − HA) · ~n = −HA · ~n ,
−−→ −−→
car HM et ~n sont orthogonaux. Comme HA et ~n sont colinéaires, la valeur absolue de
leur produit scalaire est le produit des normes. On obtient donc :
−−→ −−→
|AM · ~n| = kHAk k~nk .
−−→ √
Par définition, kHAk est la distance de A à la droite, et k~nk = a2 + b2 . Il reste à
−−→
évaluer le produit scalaire de AM par ~n.
−−→
AM · ~n = a(xM − xA ) + b(xM − xA ) = −(axA + bxA + c) ,
car axM + bxM + c = 0. D’où le résultat.
A D
H
M
Figure 5 – Projection orthogonale d’un point sur une droite.
Les notions de projection orthogonale et de distance sont définies de la même façon

en dimension 3. Soient deux vecteurs ~u et ~v , non colinéaires, et P le plan vectoriel
qu’ils engendrent.
P = { λ~u + µ~v , λ, µ ∈ R } .
Nous avons introduit à la section précédente les trois coefficients :
a = yu zv − yv zu , b = zu xv − zv xu , c = xu y v − xv y u .
20
Ce sont trois déterminants. Puisque ~u et ~v ne sont pas colinéaires, la proposition 1

entraîne que a, b, c ne sont pas tous les trois nuls. Les deux relations :
axu + byu + czu = 0 et axv + byv + czv = 0
montrent que le vecteur ~n de coordonnées (a, b, c) est orthogonal à ~u et à ~v (voir lemme

1). La bilinéarité du produit scalaire entraîne que ~n est orthogonal à tout vecteur de
P . Réciproquement, tout vecteur orthogonal à ~n est combinaison linéaire de ~u et ~v , et
donc appartient à P .
Proposition 10. Dans un espace affine de dimension 3, l’ensemble des points de

coordonnées x, y, z tels que :
ax + by + cz + d = 0 ,
est un plan affine, dont le plan vectoriel associé est l’ensemble des vecteurs orthogonaux
au vecteur ~n, de coordonnées (a, b, c).
Soit P un plan affine dans un espace de dimension 3, et A un point n’appartenant

pas à P. La projection orthogonale de A sur P est l’intersection avec P de la droite
passant par A et de vecteur directeur ~n (la perpendiculaire à P passant par A). La
distance d’un point à un plan défini par une équation implicite se calcule par une
formule analogue à celle de la proposition 9.
Proposition 11. Considérons un espace affine E de dimension 3, muni d’un repère

orthonormé (O,~ı, ~, ~k). Dans ce repère, soit P le plan d’équation implicite ax + by +
cz + d = 0, et A le point de coordonnées (xA , yA , zA ). La distance du point A au plan
P est :
|axA + byA + czA + d|
√ .
a2 + b 2 + c 2
1.8 Produit vectoriel

Nous utilisons à nouveau les déterminants. La définition 5 semble dépendre du choix
d’une base particulière. Nous ne considérons ici que des bases orthonormées. Observons
que DetB (~u, ~v ) est le produit scalaire du vecteur ~u par le vecteur ~v 0 , de coordonnées
(y2 , −x2 ). Or ~v 0 est l’un des deux vecteurs orthogonaux à ~v , de même norme que ~v .
La proposition 8 montre que le produit scalaire, et donc l’orthogonalité et la norme ne
dépendent pas de la base orthonormée dans laquelle on écrit les vecteurs. Ceci entraîne
que le calcul de DetB0 (~u, ~v ) donnera soit le même résultat, soit l’opposé, si on exprime
les vecteurs dans une autre base orthonormée B 0 . Ceci permet de définir l’orientation
du plan, à partir d’une seule base de référence. Nous supposons désormais que le plan
est muni d’une base orthonormée B, et nous omettons l’indice B dans l’écriture des
déterminants.
21
Définition 15. Soient ~u et ~v deux vecteurs non colinéaires. On dit du couple (~u, ~v )
qu’il est une base directe si DetB (~u, ~v ) > 0.
Observons que si (~u, ~v ) est une base directe, alors (~v , ~u) ne l’est pas, d’après le point
b) de la proposition 2.
La valeur du déterminant s’interprète géométriquement grâce à la formule suivante,
qui se déduit immédiatement de (9).
−→ −−→
Det(OA, OB) = d(O, A)d(O, B) sin(AOB)
[ .
On en déduit que la valeur absolue du déterminant est l’aire du parallélogramme de

−−→
sommets O, A, B, A + OB (figure 6).
B

O A
Figure 6 – La valeur absolue du déterminant est l’aire du parallélogramme.
Nous avons déjà rencontré des déterminants pour établir l’équation implicite d’un
plan dans l’espace.
Définition 16. Dans un espace affine de dimension 3 muni d’un repère orthonormé,
considérons deux vecteurs ~u et ~v . On appelle produit vectoriel de ~u et ~v et on note
~u ∧ ~v , le vecteur de coordonnées a, b, c définies par :
a = yu zv − yv zu , b = zu xv − zv xu , c = xu y v − x v y u .
Pour calculer le produit vectoriel ~u ∧ ~v , retenez que sa première coordonnée est le

déterminant des deux dernières coordonnées de ~u et ~v , puis écrivez les deux coordonnées
suivantes en permutant deux fois circulairement x → y → z → x.
Les propriétés du produit vectoriel en dimension 3 rappellent celles du déterminant
en dimension 2.
Proposition 12.
1. Le produit vectoriel est changé en son opposé si on permute les deux vecteurs
∀~u, ~v ∈ E , ~u ∧ ~v = −~v ∧ ~u ;
22
2. le produit vectoriel est bilinéaire
∀~u, ~v , w
~ ∈ E , ∀λ, µ ∈ R ,
~u ∧ (λ~v + µw)
~ = λ ~u ∧ ~v + µ ~u ∧ w
~;
(λ~u + µ~v ) ∧ w
~ = λ ~u ∧ w
~ + µ ~v ∧ w
~;
3. Le produit vectoriel ~u∧~v est le vecteur nul si et seulement si ~u et ~v sont colinéaires.
Nous avons déjà observé que le vecteur ~u ∧ ~v est orthogonal à ~u et ~v (lemme 1).
Sa norme est la surface du parallélogramme construit à partir des deux vecteurs (cf.
figure 6).
Passons maintenant à la dimension 3. Soit E un espace vectoriel de dimension 3
muni d’une base orthonormée B = (~ı, ~, ~k). Nous continuons à omettre l’indice B dans
l’écriture des déterminants. La proposition suivante consiste simplement à écrire la
définition 6 à l’aide des produits scalaire et vectoriel.
Proposition 13. Soient ~u, ~v , w
~ trois vecteurs. Le déterminant de ~u, ~v , w
~ est :
~ = ~u · (~v ∧ w)
Det(~u, ~v , w) ~ .
~ = ~u · (~v ∧ w)
L’expression Det(~u, ~v , w) ~ permet de donner une interprétation géomé-
trique du déterminant en dimension 3, analogue à la dimension 2 : la valeur absolue du
−→ −−→ −→
déterminant de 3 vecteurs OA , OB, OC est le volume du parallélépipède de sommets
−−→ −→ −→ −−→ −→
O, A, B, C, A+OB, A+OC, B+OC, A+OB+OC (figure 7). Le signe est positif si les 3
vecteurs sont orientés dans le sens direct (comme sur la figure 7), négatif s’il est orienté
dans le sens indirect (rappelons que le déterminant change de signe si on permute 2
des 3 vecteurs). Le signe du déterminant permet donc d’orienter une base quelconque,
par rapport à une base de référence. L’orientation de la base de référence se fait selon
la règle du bonhomme d’Ampère, autrement nommé tire-bouchon de Maxwell.
Définition 17. Soit E un espace vectoriel de dimension 3, muni d’une base (~ı, ~, ~k).
~ trois vecteurs non coplanaires. On dit du triplet (~u, ~v , w)
Soient ~u, ~v , w ~ qu’il est une
base directe si Det(~u, ~v , w)
~ > 0.
1.9 Systèmes de coordonnées

En dimension 2, il faut voir un système de coordonnées comme une application de
l’ensemble des couples de réels R2 (ou un de ses sous-ensembles) vers l’ensemble des
points du plan : à un couple de réels l’application associe un point du plan et un seul.
Moyennant le choix d’un repère orthonormé (O,~ı, ~), l’application qui à un couple de
réels (x, y) associe le point A du plan tel que :
−→
OA = x~ı + y~ ,
23
O A
Figure 7 – La valeur absolue du déterminant est le volume du parallélépipède.
est une application de R2 vers le plan. Cette application est bijective : à tout point du
plan correspond un unique couple de réels.
De même dans un espace de dimension 3 muni d’un repère (O,~ı, ~, ~k), l’application
qui à un triplet de réels (x, y, z) associe le point A tel que :
−→
OA = x~ı + y~ + z~k ,
est une bijection de R3 vers l’espace. Ces applications sont les systèmes de coordonnées
cartésiennes.
On rencontre souvent en physique des situations où les calculs s’effectuent plus sim-
plement en utilisant d’autres systèmes de coordonnées. Nous allons présenter les plus
courants : les coordonnées polaires dans le plan, les coordonnées cylindriques et sphé-
riques en dimension 3. Elles sont définies par référence aux coordonnées cartésiennes.
Les coordonnées polaires sont la traduction géométrique de la forme trigonomé-
trique des nombres complexes. Supposons le plan muni d’un repère (O,~ı, ~). Voici l’ap-
plication qui aux coordonnées polaires associe les coordonnées cartésiennes (figure 8).
R+ × [0, 2π[ −→ R2
(ρ, θ) 7−→ (x, y)
x = ρ cos θ , y = ρ sin θ .
Les réels ρ et θ sont le module et l’argument de l’affixe du point de coordonnées
cartésiennes (x, y) : ρ est la distance de l’origine au point et θ est l’angle orienté
→
−
entre le vecteur ~ı et le vecteur A . Observons que l’application ainsi définie n’est pas
(tout à fait) bijective : tout couple (x, y) a un antécédent unique, sauf (0, 0) qui a
pour antécédents tous les couples (0, θ). Si on la restreint aux valeurs de ρ strictement
positives, l’application définie ci-dessus est bien une bijection de ]0, +∞[×[0, 2π[ vers
le plan privé de l’origine.
Les coordonnées cylindriques remplacent les deux premières des trois coordonnées
cartésiennes par les coordonnées polaires correspondantes, en conservant la troisième
(figure 9)
R+ × [0, 2π[×R −→ R3
(ρ, θ, z) 7−→ (x, y, z)
x = ρ cos θ , y = ρ sin θ .
24
y
ρ
θ
x
Figure 8 – Coordonnées polaires d’un point du plan.
Cette application n’est toujours pas une bijection, puisque l’image réciproque de (0, 0, z)
est l’ensemble des triplets de la forme (0, θ, z), θ ∈ [0, 2π[.
y
ρ
θ
x
Figure 9 – Coordonnées cylindriques d’un point de l’espace.
Les coordonnées sphériques suivent la même logique que les coordonnées polaires :
la première des trois est la distance de l’origine au point. Les deux autres sont deux
angles, correspondant à la longitude et la co-latitude terrestres (figure 10).
R+ × [0, 2π[×[0, π] −→ R3
(r, φ, θ) 7−→ (x, y, z)
x = r sin θ cos φ , y = r sin θ sin φ , z = r cos θ .
Cette application n’est pas plus bijective que les précédentes (la latitude et la longitude
ne sont pas définies de façon unique au centre de la terre).
25
r
y
φ
x
Figure 10 – Coordonnées sphériques d’un point de l’espace.
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit ~u un vecteur non nul dans un espace vectoriel et A un point d’un
espace affine associé. On pose B = A+~u et C = A−~u. Parmi les affirmations suivantes,
lesquelles sont vraies, lesquelles sont fausses, et pourquoi ?
−→ −→
1. Les vecteurs AB et AC sont égaux.
−→ −→
2. Les vecteurs BA et AC sont égaux.
−→ −→
3. (A, AB, AC) est un repère affine.
−→
4. (A, AB) est un repère affine de la droite passant par B et C.
5. Le point B est le milieu du segment [AC].
6. Le point B est un barycentre de A et C.
7. Le point A est l’isobarycentre de B et C.
8. C = B + 2~u.
−−→
9. A = C + 12 CB.
−→ −→
10. AB = −~u + 2CA.
Vrai-Faux 2. Soient A, B, C trois points d’un plan affine P. Parmi les affirmations
−→ −→ −→ −→
1. Si les vecteurs AB et AC forment une famille libre, alors (A, AB, AC) est un
repère de P.
−→ −→
2. Si B 6= C alors (A, AB, AC) est un repère de P.
−→ −→ −→ −→
3. Si (A, AB, AC) est un repère de P, alors (C, AB, AC) est un repère de P.
−→ −→ −−→ −→
4. Si (A, AB, AC) est un repère de P, alors (C, BC, AB) est un repère de P.
−→ −→
5. (B, AB, BA) est un repère de P.
26
−→ −→
6. Si (A, AB, AC) est un repère de P, alors C est un barycentre de A et B.
−→ −→
7. (A, AB, AC) est un repère de P, si et seulement si C n’est pas un barycentre
de A et B.
8. L’isobarycentre de A, B, C appartient à une droite passant par C et le milieu
du segment [A, B].
9. L’isobarycentre de A, B, C appartient à une droite passant par B et le milieu
du segment [A, B].
10. L’isobarycentre de A, B, C appartient à la droite joignant B au milieu du
−→ −→
segment [A, B] si et seulement si (A, AB, AC) n’est pas un repère de P.
Vrai-Faux 3. On note F l’ensemble des points M d’un espace affine E de dimension

3 dont les coordonnées (x, y, z) dans un repère (O,~ı, ~, ~k) de E vérifient x + 2y + 3 =
0. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et
pourquoi ?
1. F est une droite affine.
2. F contient le point O.
3. Si F contient un point M , alors il contient le point M + ~k.
4. ~k appartient à l’espace vectoriel associé à F.
5. ~ı + 2~ appartient au plan vectoriel associé à F.
6. 2~ı − ~ − 3~k appartient au plan vectoriel associé à F.
7. (2~ı − ~, 3~k) est une base du plan vectoriel associé à F.
8. (2~ı − ~ + 3~k, −4~ı + 2~ − 6~k) est une base du plan vectoriel associé à F.
Vrai-Faux 4. On considère un espace vectoriel E, muni d’un repère orthonormé. Soient

~u et ~v deux vecteurs de E. Parmi les affirmations suivantes, lesquelles sont vraies,
lesquelles sont fausses, et pourquoi ?
1. Si ~u et ~v sont orthogonaux, alors (~u, ~v ) est une famille libre dans E.
2. Si ~u et ~v sont colinéaires, alors ~u · ~v = k~uk k~v k.
3. Si k~uk = k~v k et ~u · ~v = k~uk2 , alors ~u = ~v .
4. ~u · (~u − ~v ) = k~uk2 − k~v k2
5. (~v − ~u) · (~u − ~v ) = k~uk2 − k~v k2
6. (~u + ~v ) · (~u − ~v ) = k~uk2 − k~v k2
7. ~u + ~v et ~u − ~v sont orthogonaux si et seulement si k~uk = k~v k.
8. Si k~u − ~v k = 0 alors k~uk = k~v k = 0.
9. Si k~u + ~v k = 0 alors k~uk = k~v k.
27
Vrai-Faux 5. Dans un espace affine euclidien de dimension 3, que l’on munit d’un repère
orthonormé (O,~ı, ~, ~k), on note P le plan d’équation implicite 2x + 2y + z + 3 = 0, et H
la projection orthogonale de O sur P. Parmi les affirmations suivantes, lesquelles sont
vraies, lesquelles sont fausses, et pourquoi ?
1. O ∈ P.
2. le vecteur de coordonnées (2, 2, 1) appartient à l’espace vectoriel associé à P.
3. Toute droite de vecteur directeur (2, 2, 1) est perpendiculaire à P.
4. H est le point de coordonnées (2, 2, 1).
−−→
5. La distance de O à P est la norme du vecteur OH.
6. La distance de O à P vaut 1.
7. Le vecteur de coordonnées (1, 0, −2) appartient à l’espace vectoriel associé à
P.
8. La distance de O à la droite passant par H dont un vecteur directeur a pour
coordonnées (1, 0, −2) est strictement supérieure à 1.
9. Il existe une droite dans P telle que la distance de O à cette droite soit
strictement inférieure à 1.
Vrai-Faux 6. On considère deux plans P1 et P2 dans un espace affine de dimension 3.

On note P1 et P2 les plans vectoriels associés. Parmi les affirmations suivantes, lesquelles
1. L’intersection de P1 et P2 est une droite affine si et seulement si P1 et P2 sont
distincts.
2. Si P1 ∩ P2 = ∅, alors la distance à P2 d’un point M de P1 ne dépend pas de
M.
3. Il se peut que tout vecteur de P1 soit orthogonal à tout vecteur de P2 .
4. Si P2 contient l’ensemble des vecteurs orthogonaux à P1 alors P1 et P2 sont
parallèles ou confondus.
5. Si P2 contient l’ensemble des vecteurs orthogonaux à P1 alors P1 contient
l’ensemble des vecteurs orthogonaux à P2 .
6. S’il existe deux droites perpendiculaires, une dans P1 , l’autre dans P2 , alors
P1 contient l’ensemble des vecteurs orthogonaux à P2 .
7. Si P1 ∩ P2 6= ∅, alors pour toute droite de P1 , il existe une droite de P2 , telle
que ces deux droites sont perpendiculaires.
Vrai-Faux 7. Soient ~u et ~v deux vecteurs quelconques dans un espace vectoriel de

dimension 3. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont
1. ~u · (~u ∧ ~v ) = 0.
28
2. Si (~u − ~v ) ∧ (~u − ~v ) = ~0 alors ~u = ~v .

3. Si k~u ∧ ~v k = k~uk k~v k alors ~u · ~v = 0.
4. Si ~u ∧ (~u ∧ ~v ) est colinéaire à ~v , alors ~u · ~v = 0.
5. Si ~u ∧ (~u ∧ ~v ) = ~0, alors ~u · ~v = 0.
6. Si ~u ∧ (~u ∧ ~v ) = ~0, alors ~u ∧ ~v = ~0.
7. Si ~u · ~v = k~uk k~v k alors ~u ∧ ~v = k~uk ~v .
8. Si ~u · ~v = k~uk k~v k alors ~u ∧ ~v = ~0.
Vrai-Faux 8. Soient ~u, ~v et w

~ trois vecteurs quelconques dans un espace vectoriel de
dimension 3. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont
1. Det(~u, ~v , w)
~ = Det(w,
~ ~u, ~v ).
2. Det(~u, ~v , w)
~ = Det(w,
~ ~v , ~u).
3. Det(~u + ~v , ~v , w)
~ = Det(~u, ~v , w).
~
4. Det(~u + ~v , ~v , ~u + ~v + w)
~ = Det(~u, ~v , w).
~
5. Det(~u + ~v , ~v + w,
~ ~u + 2~v + w)
~ = Det(~u, ~v , w).
~
6. Det(~u + 2~v , ~v , ~u + 2~v + w)
~ = Det(~u, ~v , w).
~
7. Det(~u + ~v , ~v + w,
~ ~u + w)
~ = 2Det(~u, ~v , w).
~
2.2 Exercices
Exercice 1. Soient D1 et D2 deux droites dans le plan, données par leurs équations im-
plicites ou paramétriques. Déterminer si les droites sont sécantes, parallèles ou confon-
dues. Dans le cas ou elles sont sécantes, donner les coordonnées de leur point d’inter-
section.
D1 : 3x + 5y − 2 = 0 ; D2 : x − 2y + 3 = 0 .
D1 : 2x − 4y + 1 = 0 ; D2 : −5x + 10y + 3 = 0 .
( (
x = 3 + 4λ x = 5−µ
D1 : ; D2 : .
y = 2−λ y = 2 + 3µ
( (
x = 1 + 2λ x = 3 − 4µ
D1 : ; D2 : .
y = 2 − 3λ y = −1 + 6µ
(
x = 2+µ
D1 : x − 2y + 3 = 0 ; D2 : .
y = 3 − 2µ
(
x = 1 − 4µ
D1 : 3x − 2y + 1 = 0 ; D2 : .
y = 2 − 6µ
29
Exercice 2. Soit A un point du plan, donné par ses coordonnées dans un repère ortho-
normé (O,~ı, ~). Soit ~u un vecteur non nul, déterminé par ses coordonnées dans la base
(~ı, ~). On considérera les cas suivants.
A : (−1, 1) , ~u : (1, 0) .
A : (2, 1) , ~u : (−3, −1) .
A : (0, 1) , ~u : (1, 2) .
A : (−3, 1) , ~u : (1, −1) .
1. Donner des équations paramétriques et implicites de la droite D passant par A,
admettant ~u comme vecteur directeur.
2. Donner des équations paramétriques et implicites de la droite D0 passant par A,
et perpendiculaire à D.
Exercice 3. On considère trois points A, B, C non alignés d’un plan affine. On note D1
(respectivement D2 , D3 ) la droite (B, C) (respectivement (A, C), (A, B)).
−→ −→
1. Montrer que (A, AB, AC) est un repère du plan.
−→ −→
2. Donner les équations des 3 droites D1 , D2 , D3 , dans le repère (A, AB, AC).
3. Donner les équations des 3 médianes du triangle ABC dans le même repère.
4. Donner les coordonnées de l’isobarycentre de A, B, C dans le même repère, et
vérifier qu’il est le point d’intersection des trois médianes.
−→ −−→
5. Montrer que (B, BA, BC) est un repère du plan et déterminer l’ensemble des
−→ −→
points ayant les mêmes coordonnées dans les deux repères (A, AB, AC) et
−→ −−→
(B, BA, BC).
6. Soit D une droite du plan affine, dont une équation implicite dans le repère
−→ −→
(A, AB, AC) est ax + by + c. A quelles conditions portant sur les réels a, b, c la
droite D est-elle sécante avec les trois droites D1 , D2 et D3 ?
On suppose ces conditions réalisées et on note I (respectivement J, K) le point
d’intersection de D avec D1 (respectivement D2 , D3 ).
7. On appelle « diagonales » les segments [A, I], [B, J], [C, K]. Donner les coordon-
−→ −→
nées des milieux des 3 diagonales dans le repère (A, AB, AC), et vérifier que ces
trois points sont alignés.
Exercice 4. Soient A, B, C trois points du plan affine, donnés par leurs coordonnées
dans un repère (O,~ı, ~). On considérera les cas suivants.
A : (0, 0) , B : (0, 1) , C : (1, 0) .
A : (0, 3) , B : (−2, 0) , C : (0, 2) .
A : (1, 0) , B : (−1, 0) , C : (2, 3) .
A : (2, 0) , B : (−1, 4) , C : (−4, 3) .
30
1. Donner des équations paramétriques et implicites des trois droites passant par
(A, B), (A, C), (B, C).
2. Donner des équations paramétriques et implicites des trois médianes du triangle
ABC et vérifier que l’isobarycentre G de A, B, C est leur point d’intersection.
3. Donner des équations paramétriques et implicites des trois hauteurs du triangle
ABC. Vérifier qu’elles sont concourantes et donner les coordonnées de leur point
d’intersection H.
4. Donner des équations paramétriques et implicites des trois médiatrices du triangle
ABC. Vérifier qu’elles sont concourantes et donner les coordonnées de leur point
d’intersection M .
−−→ −−→
5. Vérifier que les trois points G, H, M sont alignés et que M H = 3M G.
Exercice 5. Soient A, B, C, D quatre points d’un plan affine. Soient I, J, K, L, M, N les
milieux respectifs des segments [A, B], [B, C], [C, D], [D, A], [A, C], [B, D].
1. Montrer que les segments [I, K], [J, L] et [M, N ] ont le même milieu.
2. Montrer que le quadrilatère de sommets I, J, K, L est un parallélogramme.
Exercice 6. Dans un plan affine, muni d’un repère orthonormé, on considère deux
droites sécantes, D1 et D2 , données par leurs équations implicites :
a1 x + b1 y + c1 = 0 et a2 x + b2 y + c2 = 0
1. Soit M un point équidistant des deux droites D1 et D2 . Quelle équation vérifient
les coordonnées (x, y) de M ?
2. En déduire que l’ensemble des points équidistants de D1 et D2 est la réunion de
deux droites ∆1 et ∆2 , dont on donnera une équation implicite.
3. Vérifier que ∆1 et ∆2 sont orthogonales.
4. Pour i = 1, 2, soit ~ui un vecteur directeur de Di , ~vi un vecteur directeur de ∆i .
On suppose que ces 4 vecteurs ont tous la même norme. Montrer que :
|u~1 · v~1 | = |u~2 · v~1 | et |u~1 · v~2 | = |u~2 · v~2 |
5. Donner des équations paramétriques et implicites des droites ∆1 et ∆2 dans les

cas suivants.
D1 : x = 1 ; D2 : y = 1 .
D1 : x + y = 2 ; D2 : x − y = 2 .
D1 : x + y = 2 ; D2 : y = 1 .
D1 : 2x + y = 3 ; D2 : x − 2y = −1 .
Exercice 7. Soit a, b deux réels. Soit D1 la droite d’équation 2x + ay − 1 = 0 et D2 la
droite d’équations paramétriques x = b − λ, y = λ, λ ∈ R. Discuter suivant les valeurs
de a et b si D1 et D2 sont sécantes, parallèles ou confondues.
31
Exercice 8. On considère le triangle ABC dont les côtés ont pour équations (AB) :
x + 2y = 3, (AC) : x + y = 2, (BC) : 2x + 3y = 4.
1. Donnez les coordonnées des points A, B, C.
2. Donnez les coordonnées des milieux A0 , B 0 , C 0 de (BC), (AC) et (AB) respecti-
vement.
3. Donnez une équation de chaque médiane et vérifiez qu’elles sont concourantes.
Exercice 9. Soit A un point donné par ses coordonnées dans un repère orthonormé
(O,~ı, ~, ~k). Soit ~u un vecteur non nul donné par ses coordonnées dans la base (~ı, ~, ~k).
On considérera les cas suivants.
A : (1, 0, 0) , ~u : (1, 1, 1) .
A : (1, −1, 1) , ~u : (1, 1, 1) .

A : (1, 0, 0) , ~u : (1, −1, 1) .
A : (1, 2, 3) , ~u : (3, 2, 1) .
1. Donner des équations paramétriques et implicites pour la droite D, de vecteur
directeur ~u, passant par A.
2. Donner des équations paramétriques et implicites pour le plan P passant par A
et orthogonal à D.
3. Calculer la distance de O à P et de O à D.
Exercice 10. Soient A, B, C, D quatre points d’un espace affine de dimension 3, muni
d’un repère orthonormé (O,~ı, ~, ~k). Les points sont donnés par leur coordonnées. On
considérera les cas suivants.
A : (0, 0, 0) , B : (1, 0, 0) , C : (0, 1, 0) , D : (0, 0, 1) .
A : (0, 0, 0) , B : (1, 0, 0) , C : (1, 1, 0) , D : (1, 1, 1) .

A : (1, 0, 0) , B : (1, 2, −1) , C : (−1, 1, 2) , D : (2, −1, 1) .
A : (1, 2, 3) , B : (1, 3, 2) , C : (3, 1, 2) , D : (3, 3, 3) .
−→ −→ −−→
1. Vérifier que (A, AB, AC, AD) est un repère.
−→ −→ −−→
2. On pose A0 = A + AB + AC + AD. Calculer les coordonnées de A0 . Vérifier que
−−→ −−→ −−→
(A0 , A0 B, A0 C, A0 D) est un repère.
−→ −→ −−→
3. Donner les coordonnées de A0 dans le repère (A, AB, AC, AD).
4. Déterminer des équations paramétriques et implicites des 3 plans, contenant res-
pectivement (A, B, C), (A, B, D), (A, C, D), dans le repère (O,~ı, ~, ~k).
5. Déterminer des équations paramétriques et implicites des 3 plans, contenant res-
−−→ −−→ −−→
pectivement (A, B, C), (A, B, D), (A, C, D), dans le repère (A0 , A0 B, A0 C, A0 D).
32
6. En supposant le repère (O,~ı, ~, ~k) orthonormé, calculer la distance de A0 à chacun

des trois plans de la question précédente.
7. Calculer la distance de A0 à chacune des 3 droites, contenant respectivement
(A, B), (A, C), (A, D).
8. Reprendre les questions 3 à 7 en échangeant les rôles de A et A0 .
Exercice 11. Soient P1 et P2 deux plans non parallèles et A un point n’appartenant ni
à P1 ni à P2 dans un espace de dimension 3, muni d’un repère orthonormé. Les deux
plans sont donnés par des équations implicites et A par ses coordonnées. On note D la
droite intersection de P1 et P2 . On considérera les cas suivants.
P1 : z = 0 ; P2 : y = 0 , A : (1, 1, 1) .
P1 : x + y = 0 ; P2 : x + z + 1 = 0 , A : (1, 1, 1) .
P1 : x + y + z + 2 = 0 ; P2 : 2x − y + 3z − 4 = 0 , A : (2, 1, 0) .
P1 : 2x + y − z − 2 = 0 ; P2 : x + 3y + 7z − 11 = 0 , A : (1, 2, 1) .
P1 : 2x − y + 1 = 0 ; P2 : 3y − z − 2 = 0 , A : (3, −1, 2) .
P1 : x + y + z − 1 = 0 ; P2 : −x + y − z + 1 = 0 , A : (1, 1, 2) .
1. Vérifier que P1 et P2 ne sont pas parallèles.
2. Donner des équations paramétriques de P1 et P2 .
3. Donner des équations paramétriques de D.
4. Donner des équations paramétriques et implicites de la droite orthogonale à P1
passant par A.
5. Donner des équations paramétriques et implicites de la droite orthogonale à P2
passant par A.
6. Donner des équations paramétriques et implicites du plan orthogonal à D passant
par A.
7. Calculer la distance de A à P1 , puis à P2 , puis à D.
Exercice 12. Soient ~u, ~v , w,
~ trois vecteurs déterminés par leurs coordonnées dans un
repère orthonormé (O,~ı, ~, ~k). On considérera les cas suivants.
~u : (1, 0, 0) , ~v : (1, 1, 0) , ~ : (1, 1, 1) .

w
~u : (0, 2, 2) , ~v : (1, 0, 1) , ~ : (1, 2, 0) .

w
~u : (0, 2, 1) , ~v : (2, 1, −1) , ~ : (−1, 2, 1) .
w
~u : (1, 1, −2) , ~v : (1, −2, 1) , ~ : (−2, 1, 1) .
w
~u : (1, 2, 3) , ~v : (4, 5, 6) , ~ : (7, 8, 9) .
w
~u : (1, −3, 2) , ~v : (−5, 3, 4) , ~ : (−2, 3, −1) .
w
33
1. Calculer les trois produits scalaires ~u · ~v , ~u · w,

~ ~v · w.
~
2. Calculer les trois produits vectoriels ~u ∧ ~v , ~u ∧ w,
~ ~v ∧ w.
~
3. Calculer les trois produits scalaires ~u · (~v ∧ w),
~ ~v · (w
~ ∧ ~u), w
~ · (~u ∧ ~v ).
4. Calculer le déterminant Det(~u, ~v , w)
~ par la règle de Sarrus.
Exercice 13. Procédé d’orthonormalisation de Gram-Schmidt. Soient ~u, ~v , w,

~ trois vec-
teurs non coplanaires, donnés par leurs coordonnées dans un repère orthonormé
(O,~ı, ~, ~k). On considérera les cas suivants.
~u : (1, 0, 0) , ~v : (1, 1, 0) , ~ : (1, 1, 1) .

w
~u : (0, 2, 2) , ~v : (1, 0, 1) , ~ : (1, 2, 0) .

w
~u : (0, 2, 1) , ~v : (2, 1, −1) , ~ : (−1, 2, 1) .
w
~u : (1, −3, 2) , ~v : (−5, 3, 4) , ~ : (−2, 3, −1) .
w
1. Calculer k~uk. On pose ~u0 = (1/k~uk)~u. Calculer les coordonnées de ~u0 .
2. On pose :
~v1 = ~v − (~u0 · ~v )~u0 ,
puis ~v 0 = (1/k~v1 k)~v1 . Calculer les coordonnées de ~v 0 .
3. On pose :
−
→=w
w ~ − (~u0 · w)~
~ u0 − (~v 0 · w)~
~ v0 ,
1
~ 0 = (1/k−
puis w →k)−
w → ~ 0.
1 w1 . Calculer les coordonnées de w
4. Vérifier que (~u0 , ~v 0 , w

~ 0 ) est une base orthonormée.
5. Démontrer que si (~u, ~v , w) ~ est une base quelconque de l’espace vectoriel, alors
(~u0 , ~v 0 , w
~ 0 ) est une base orthonormée.
Exercice 14. Soit A un point d’un espace de dimension 3, donné par ses coordonnées
dans un repère orthonormé (O,~ı, ~, ~k). On considérera les cas suivants.
A : (1, 0, 0) , A : (0, 1, 0) ,
A : (0, 0, 1) , A : (−1, 0, 0) ,
√ √
A : (1, 0, 1) , A : (1, 1, 0) , A : (1, 1, 2) , A : (−1, 1, − 2) ,
√ √ √ √ √ √
A : (1, 1, − 6) , A : (1, 3, −2) , A : (− 3, 1, 2) , A : (− 3, 3, − 2) .
1. Donner les coordonnées cylindriques de A.
2. Donner les coordonnées sphériques de A.
34
2.3 QCM
rapporte 2 points.
Question 1. Soit ~u un vecteur non nul dans un espace vectoriel, et A un point dans
un espace affine associé. On pose B = A + 2~u et C = A − ~u.
A La droite passant par A de vecteur directeur ~u contient les points B et C.
B Il existe une unique droite passant par A et de vecteur directeur ~u.
C A est le milieu du segment [B, C].
D Il existe un unique plan passant par les trois points A, B et C.
−→ −→
E Le vecteur AB + 2AC est un vecteur directeur de la droite (AB).
A A = C − ~u.
B B = C + 3~u.
−→
C C = A + BA.
−→
D CA = ~u.
−→
E BA = 2~u.
Question 3. Soit E un espace vectoriel de dimension 3, et B = (~ı, ~, ~k) une base de E.
A DetB (~,~ı, ~k) = 1.
B DetB (~, ~k,~ı) = 1.
C DetB (~ı,~ı + 2~, ~k) = 1.
D DetB (~ı + ~k,~ı + 2~, ~k − 2~) = 0.
E Det(~ı + ~,~ı + ~k, ~ + ~k) = 0.
A A est le barycentre de B et C affectés des coefficients respectifs 1 et 2.
B B est le barycentre de A et C affectés des coefficients respectifs −2 et 1.
C C est le barycentre de A et B affectés des coefficients respectifs 2 et −1.
D A est l’isobarycentre de B et C.
E B est le barycentre de A et C affectés des coefficients respectifs 3 et −2.
Question 5. Dans un espace affine de dimension 3, muni d’un repère (O,~ı, ~, ~k), on
considère le plan affine P d’équation 2x − y + z = 3.
A La droite passant par le point de coordonnées (1, 2, 0), de vecteur directeur
~ı + 2~ ne coupe pas le plan P.
35
B La droite passant par le point de coordonnées (1, 2, 3), de vecteur directeur

~ı + 2~ coupe le plan P en un point et un seul.
C La droite passant par le point de coordonnées (1, 2, 3), de vecteur directeur
~ı + 2~ + 3~k ne coupe pas le plan P.
D La droite passant par le point de coordonnées (1, 2, 0), de vecteur directeur
~ı + 2~ + 3~k coupe le plan P en un point et un seul.
E La droite passant par le point de coordonnées (1, 0, 1), de vecteur directeur ~ı+2~
ne coupe pas le plan P.
considère le point A de coordonnées (1, 0, 1) le vecteur ~u = ~ı + ~k et la droite affine D
passant par A et de vecteur directeur ~u.
A La droite D est contenue dans le plan d’équation x+ z = 0.
 x = 1+λ

B La droite D admet pour équations paramétriques  y = 0 , λ∈R.

z = 1+λ
C La droite D contient le point O.
D La droite D ne coupe pas le plan d’équation x(− z = 0.
x−z = 0
E La droite D admet pour équations implicites
x+y+z = 2.
considère le point A de coordonnées (1, 0, 1) le vecteur ~u = ~ı + ~k, et le plan affine P
passant par A et de vecteurs directeur ~u et ~.
A Le plan P contient la droite passant par l’origine et par le point de coordonnées
(1, 1, 1). 
 x = 1+λ

B Le plan P admet pour équations paramétriques  y = λ , λ∈R.

z = 1+λ
C Le plan P contient la droite passant par A, de vecteur directeur ~ı + ~.
D Le plan P ne rencontre pas la droite passant par le point de coordonnées
(0, 0, 1), et de vecteur directeur ~.
E Le plan P est parallèle au plan passant par O, de vecteurs directeurs ~ et ~k.
considère le plan affine P d’équation implicite x + z = 2.
A Le plan vectoriel associé à P contient le vecteur ~.
B Le vecteur ~ı + ~k est un vecteur normal au plan P.
C Le plan P contient la droite passant par O, de vecteur directeur ~.
D Le plan contient la droite passant par le point de coordonnées (1, 0, 1), de
vecteur directeur ~ı + ~k.
E Toute droite affine de vecteur directeur ~ı − ~k est contenue dans le plan P.
36
Question 9. Dans un espace affine euclidien de dimension 3, muni d’un repère orho-
normé (O,~ı, ~, ~k), on considère le plan affine P d’équation implicite x + z = 2.
A La distance de O au plan P vaut 1.
B Toute droite de vecteur directeur ~ı + ~k est perpendiculaire au plan P.
C La distance de O au point de coordonnées (2, 0, 0) est égale à la distance de O
à P.
D La distance de O à la droite passant par les points (2, 0, 0) et (0, 0, 2) est
strictement supérieure à la distance de O à P.
E La projection orthogonale de O sur le plan P est le point de coordonnées (1, 0, 1).
Question 10. On considère un espace affine euclidien de dimension 3, muni d’un repère
orhonormé (O,~ı, ~, ~k).
A (~ı + ~) ∧ ~ = ~k.
B (~ı + ~) ∧ (~ı − ~) = ~k.
C (~ı +~) ∧~ı = ~k.
D ~ · (~ı + ~) ∧ ~k = 1.

E ~ı · (~ı + ~) ∧ (~ı + ~ + ~k) = 1.
Réponses : 1–AB 2–BD 3–BD 4–AE 5–AD 6–BC 7–AD 8–AB 9–BE 10–AE
2.4 Devoir
répondu.
1. Soient ~u = (x1 , y1 ) et ~v = (x2 , y2 ) deux vecteurs de R2 , muni de sa base canonique.
Démontrer que si ~u et ~v sont colinéaires, alors Det(~u, ~v ) = 0.
2. Soient ~u = (x1 , y1 , z1 ) et ~v = (x2 , y2 , z2 ) deux vecteurs de R3 , muni de sa base
canonique. Démontrer que si ~u et ~v sont colinéaires, alors ~u ∧ ~v = 0.
3. Soient ~u = (x1 , y1 , z1 ) et ~v = (x2 , y2 , z2 ) deux vecteurs de R3 , muni de sa base ca-
nonique. Démontrer que le vecteur ~u ∧~v est orthogonal au plan vectoriel engendré
par ~u et ~v .
~ trois vecteurs de R3 , muni de sa base canonique. En utilisant
4. Soient ~u, ~v et w
l’expression du déterminant à l’aide du produit scalaire et du produit vectoriel,
démontrer que si ~u, ~v et w
~ sont coplanaires, alors Det(~u, ~v , w)
~ = 0.
5. On pose ~u = (1, 0, −1), ~v = (1, −2, 1), w
~ = (0, 1, −1). Calculer le déterminant de
ces trois vecteurs par la règle de Sarrus, puis vérifier que chacun des trois vecteurs
est orthogonal au produit vectoriel des deux autres.
37
Exercice 1 : On considère un espace affine de dimension 3, muni du repère orthonormé

(O,~ı, ~, ~k). Dans cet espace, on considère le plan P d’équation 2x + y − 2z = −4, et
les points A de coordonnées (3, 2, 6), B de coordonnées (1, 2, 4) et C de coordonnées
(4, −2, 5).
1. Vérifier que le plan P est l’unique plan contenant les points A, B et C.
2. Calculer les distances d(A, B), d(A, C) et d(B, C) et démontrer que le triangle
ABC est rectangle.
3. Donner les coordonnées d’un vecteur ~n, normal au plan P. Vérifier que les trois
−→ −→ −→ −−→ −→ −−→
produits vectoriels AB ∧ AC, BA ∧ BC et CA ∧ CB sont colinéaires au vecteur
~n.
4. Calculer la distance de O au plan P.
5. Ecrire un système d’équations paramétriques de la droite D passant par O et
orthogonale au plan P.
6. Soit K la projection orthogonale de O sur P. Calculer les coordonnées de K, puis
−−→
la norme du vecteur OK. Retrouver le résultat de la question 4.
7. Soit G le barycentre des points O, A, B, C, munis des poids respectifs 3, 1, 1, 1.
Déterminer les coordonnées de G, puis la distance de G au plan P .
8. On note I le centre de gravité du triangle ABC. Démontrer que G est le milieu
du segment [O, I].
9. Soit Γ l’ensemble des points M de l’espace, vérifiant :
−−→ −−→ −−→ −−→
k 3M O + M A + M B + M C k = 6 .
Montrer que l’intersection de Γ avec P est un cercle, déterminer son centre et son
rayon.
Exercice 2 : On considére un espace affine de dimension 3, muni d’un repère ortho-
normé (O,~ı, ~, ~k). Soit A le point de coordonnées (0, 1, 1) dans le repère (O,~ı, ~, ~k). Soit
~u le vecteur de coordonnées (3, 1, 0) dans la base (~ı, ~, ~k).
1. Donner des équations paramétriques et implicites de la droite D passant par A
et admettant ~u comme vecteur directeur.
2. Donner des équations paramétriques et une équation implicite du plan P passant
par A et orthogonal à D.
3. Calculer la distance de O à P et la distance de O à D.
4. Soit P 0 le plan passant par 0 et parallèle à P. Soit A0 l’intersection de P 0 avec D.
Justifier, sans calculs, le fait que la distance de O à A0 est égale à la distance de
O à la droite D.
5. Soit I la projection orthogonale de O sur le plan P. Calculer les coordonnées de
I.
38
6. Démontrer que les 4 points O, A, A0 , I sont dans un même plan, et que le quadri-
latère OAA0 I est un rectangle.

1. Par définition, le déterminant Det(~u, ~v ) vaut x1 y2 − x2 y1 . Supposons que ~u et ~v
soient colinéaires. Si ~u = ~0, alors Det(~u, ~v ) = 0. Sinon, il existe λ ∈ R tel que
~v = λ~u, donc x2 = λx1 et y2 = λy1 . Dans ce cas,
x1 y2 − x2 y1 = λx1 y1 − λx1 y1 = 0 .
2. Considérons les vecteurs de R2 définis comme suit.
~ua = (y1 , z1 ) , ~ub = (x1 , z1 ) , ~uc = (x1 , y1 ) ,
~va = (y2 , z2 ) , ~vb = (x2 , z2 ) , ~vc = (x2 , y2 ) .
Par définition, le produit vectoriel de ~u par ~v est :

~u ∧ ~v = Det(~ua , v~a ) , −Det(~ub , ~vb ) , Det(~uc , ~vc ) .
Si ~u et ~v sont colinéaires, alors ~ua et ~va le sont aussi, et également u~b et ~vb , ainsi
que u~c et ~vc . Donc les trois coordonnées de ~u ∧ ~v sont nulles, d’après la question
précédente.
3. Nous devons montrer que ~u ∧ ~v est orthogonal à tous les vecteurs de la forme
λ~u + µ~v , où λ et µ sont deux réels quelconques. Pour montrer que deux vecteurs
sont orthogonaux, nous devons montrer que leur produit scalaire est nul. Par la
bilinéarité du produit scalaire, il suffit de montrer que :
~u · (~u ∧ ~v ) = 0 et ~u · (~u ∧ ~v ) = 0
C’est une vérification facile.
~u · (~u ∧ ~v ) = x1 (y1 z2 − y2 z1 ) + y1 (x2 z1 − x1 z2 ) + z1 (x1 y2 − x2 y1 ) = 0 ,
~v · (~u ∧ ~v ) = x2 (y1 z2 − y2 z1 ) + y2 (x2 z1 − x1 z2 ) + z2 (x1 y2 − x2 y1 ) = 0 .
4. Si ~u, ~v et w
~ sont coplanaires, alors l’un des trois vecteurs est combinaison linéaire
des deux autres. Sans perte de généralité, nous allons supposer qu’il existe deux
réels λ et µ, tels que ~u = λ~v + µw.~ Ecrivons :
Det(~u, ~v , w)
~ = Det(λ~v + µw, ~ ~v , w)
~
= ~ + µDet(w,
λDet(~v , ~v , w) ~ ~v , w)
~
= λ~v · (~v ∧ w)
~ + µw ~ · (~v ∧ w)
~
= 0,
d’après la question précédente.
39
5. On trouve Det(w, ~ = 0. Le calcul est inutile, il suffit d’observer que ~u − ~v =

~ ~v , w)
2w.
~ En effectuant le calcul des produits vectoriels, on trouve :
~u ∧ ~v = (−2, −2, −2) , ~u ∧ w
~ = (1, 1, 1) , ~v ∧ w
~ = (1, 1, 1) .
Les produits scalaires suivants sont bien nuls.
(~u ∧ ~v ) · w
~ = (~u ∧ w)
~ · ~v = (~v ∧ w)
~ · ~u = 0 .
Exercice 1 :
1. Nous devons d’abord vérifier que les trois points appartiennent au plan P :
2 × 3 + 2 − 2 = −4 , 2 × 1 + 2 − 2 = −4 , 2 × 4 − 2 − 2 = −4 .
Nous devons ensuite montrer que les 3 points ne sont pas alignés, ce qui se vérifie
−→ −→
par exemple en montrant que les deux vecteurs AB et AC ne sont pas colinéaires.
Il suffit pour cela de calculer leur produit vectoriel, et de vérifier qu’il est non
nul.
−→ −→
AB ∧ AC = (−2, 0, −2) ∧ (1, −4, −1) = (−8, −4, 8) 6= ~0 .
2.
−→ −→ −−→
d2 (A, B) = kABk2 = 8 , d2 (A, C) = kACk2 = 18 , d2 (B, C) = kBCk2 = 26 .
√ √ √
Donc d(A, B) = 2 2, d(A, C) = 3 2 et d(B, C) = 26. Puisque d2 (AB) +
d2 (AC) = d2 (BC), le triangle ABC est rectangle en A, d’après le théorème de
Pythagore.
3. Le plan affine P est associé au plan vectoriel P , d’équation 2x + y − 2z = 0. Cette
équation traduit le fait que tout vecteur directeur de P, de coordonnées x, y, z, est
orthogonal au vecteur ~n de coordonnées 2, 1, −2, qui est donc un vecteur normal
au plan P. En effectuant les produits vectoriels, on trouve :
−→ −→
AB ∧ AC = (−8, −4, 8) = −4~n ,
−→ −−→
BA ∧ BC = (8, 4, −8) = 4~n ,
−→ −−→
CA ∧ CB = (−8, −4, 8) = −4~n .
4. En appliquant la formule,
4 4
d(O, P) = √ = .
9 3
5. La droite D a pour vecteur directeur ~n. Tout point M , s’il appartient à D, est
−−→
tel que OM est colinéaire à ~n, dont les coordonnées x, y, z de M vérifient :


 x = 2λ
y = λ , λ∈R.
z = −2λ


40
6. Le point K est l’intersection de la droite D avec le plan P. Nous devons donc

trouver le réel λ tel que :
2(2λ) + λ − 2(−2λ) = −4 ,
soit λ = −4/9. Le point K a pour coordonnées −8/9, −4/9, 8/9. La norme du

−−→
vecteur OK est telle que :
2 2 2 2
−−→ 8 4 8 4

kOKk2 = − + − + = .
9 9 9 3
La distance d(O, K), qui est aussi la distance de O au plan P, vaut 4/3.
7. Par définition,
−→ 1 ~ −→ −−→ −→

OG = 3 0 + OA + OB + OC .
6
4 1 5
On en déduit les coordonnées de G : , , . Pour calculer la distance de G au
3 3 2
plan P, on applique la formule :

4
2 3 + 13 − 2 52 + 4 2
d(G, P) = √ = .
22 + 1 + 22 3
8. Le centre de gravité du triangle ABC est tel que :

−→ 1 −→ −−→ −→ −→

OI = OA + OB + OC = 2 OG .
3
−→ −→
Donc OG = (1/2)OI : G est le milieu du segment [O, I].
9. Le point G est tel que, pour tout point M de l’espace :
−−→ 1 −−→ −−→ −−→ −−→

MG = 3M O + M A + M B + M C .
6
Donc Γ est l’ensemble des points M de l’espace tels que :
−−→
kM Gk = 1 .
C’est la sphère de centre G et de rayon 1. Nous avons vu que la distance de G au

plan P est 2/3, donc inférieure au rayon de la sphère. Donc l’intersection de Γ et
P est non vide : c’est bien un cercle. Son centre est la projection
√ orthogonale de
2 2
G sur P . Son rayon r est tel que r + (2/3) = 1, soit r = 5/3.
Exercice 2 : Considérons un espace affine de dimension 3, muni d’un repère ortho-
normé (O,~ı, ~, ~k). Soit A le point de coordonnées (0, 1, 1) dans le repère (O,~ı, ~, ~k). Soit
~u le vecteur de coordonnées (3, 1, 0) dans la base (~ı, ~, ~k).
41
−−→
1. Soit M un point de D. Le vecteur AM est colinéaire au vecteur ~u. Donc les
coordonnées x, y, z de M vérifient :


 x = 3λ

y = 1+λ , λ∈R.

z = 1
Ce sont les équations paramétriques de la droite D. Pour obtenir des équations
implicites, il faut éliminer λ dans les équations ci-dessus :
(
x − 3y = −3
z = 1.
2. Le plan P admet ~u comme vecteur normal. Nous devons trouver deux vecteurs
non colinéaires, et orthogonaux au vecteur ~u. Par exemple : (1, −3, 0) et (0, 0, 1).
−−→
Tout point M de P est tel que AM est combinaison linéaire de ces deux vecteurs.
Ses coordonnées x, y, z vérifient donc :


 x = λ
y = 1 − 3λ , λ, µ ∈ R .


z = 1+µ
Pour l’équation implicite, nous savons que ~u est un vecteur normal à P, qui admet
donc une équation du type 3x + y = d. Pour déterminer d, il suffit d’écrire que
A vérifie l’équation. On trouve ainsi l’équation 3x + y = 1.
3. La distance de O à P se calcule par la formule :
1 1
d(O, P) = √ 2 =√ .
3 +1 10
La distance de O à D peut se déduire du théorème de Pythagore, puisque
d2 (O, A) = d2 (O, P) + d2 (O, D). On trouve :
1 19
d2 (O, D) = d2 (O, A) − d2 (O, P) = 2 − = .
10 10
q
Donc la distance de 0 à D est de 19/10.
−−→
4. Par construction, le vecteur OA0 appartient au plan vectoriel associé à P, ainsi
qu’à P 0 . Il est donc orthogonal à la droite D. Donc A0 est la projection orthogonale
de O sur D, donc la distance de O à A0 est égale à la distance de O à la droite D.
5. Considérons la droite D0 , passant par O et perpendiculaire au plan P (figure 11).
Un système d’équations paramétriques de cette droite est :


 x = 3λ

y = λ , λ∈R.

z = 0
La projection orthogonale de O sur P est l’intersection de la droite D0 avec le
plan P. elle a pour coordonnées 3/10, 1/10, 0.
42
D D’
P’ A’ O
A I
P
Figure 11 – Plans et droites parallèles.
6. Par construction, les plans P et P 0 sont parallèles. Considérons les trois points
−−→ −−→
O, A, A0 . Par construction, les vecteurs OA0 et AA0 sont orthogonaux, donc non
colinéaires. Il existe donc un unique plan passant par O, A, A0 . Ce plan contient
toute droite, passant par un de ses points, et parallèle à D, en particulier D0 . Il
−−→ −→
contient donc I. Les vecteurs A0 A et OI sont égaux, donc le quadrilatère OAA0 I
−−→ −−→
est un parallélogramme. De plus, OA0 et AA0 sont orthogonaux, donc c’est un
rectangle.
43
3 Compléments
3.1 La géométrie du triangle
Les Éléments d’Euclide, écrits au iiie siècle avant notre ère, contenaient déjà de
nombreux résultats sur la géométrie des triangles. Les formulations d’Euclide sont très
différentes des nôtres, car il ne disposait pas des fonctions trigonométriques et raisonnait
uniquement en termes de longueurs et d’aires. De plus il n’était pas question de traiter
les quantités à ôter comme des quantités négatives à ajouter. Pour cette raison, les
propositions 12 et 13 du livre II des Éléments, séparent le cas d’un triangle obtusangle
(ayant un angle obtus) et celui d’un triangle acutangle (dont tous les angles sont aigus).
La proposition 12 est énoncée comme suit. Avec un peu de réflexion, vous devriez
pouvoir y reconnaître le théorème d’Al-Kashi.
Dans les triangles obtusangles, le carré du côté qui soutient l’angle obtus est plus
grand que les carrés des deux autres côtés, de la quantité de deux fois le rectangle formé
d’un des côtés contenant l’angle obtus, à savoir celui sur le prolongement duquel tombe
la hauteur, et de la ligne prise en-dehors entre le pied de la hauteur et l’angle obtus.
L’astronome et mathématicien Al-Battani généralisa le résultat d’Euclide à la géométrie
sphérique au début du xe siècle, ce qui lui permit d’effectuer des calculs de distance
angulaire entre étoiles. Ghiyath Al-Kashi, mathématicien de l’école de Samarcande,
mit le théorème sous une forme utilisable pour la triangulation, au cours du xve siècle.
A
Y
Z
B C
Figure 12 – Le théorème de Napoléon.
Le théorème suivant, n’a été attribué (faussement) à Napoléon Bonaparte qu’au

début du vingtième siècle. Il a été maintes fois redécouvert, et on ignore s’il était ou
non connu des grecs.
44
Théorème 5. Soit ABC un triangle quelconque. Soient X, Y, Z les isobarycentres des

3 triangles équilatéraux extérieurs au triangle ABC, construits sur chacun des trois
côtés. Le triangle XY Z est équilatéral (figure 12).
Il est connu que Napoléon se piquait de mathématiques, et qu’il a eu plusieurs
conversations avec Laplace et Lagrange. Sur ses capacités réelles, les avis divergent,
selon l’interprétation de ce que lui aurait dit Laplace, lors d’un dîner le 11 décembre
1797. Voici deux versions.
1. H. Poincaré : « Nous attendions tout de vous, Général, sauf des leçons de géo-
métrie »
2. H.S.M. Coxeter et S.L. Greitzer : « The last thing we want from you, General,
is a lesson in geometry »
Cette anecdote a été si souvent rapportée qu’il peut être utile d’écouter un témoin :
Dubois-Aymé (1779–1846) 1 .
Entouré d’artistes et de savants, il [Bonaparte] en retira un éclat de savoir
qui éblouit toujours la multitude. L’Institut, selon l’ancienne coutume de
toutes les académies, d’appeler dans leur sein des hommes puissants pour
s’en faire un appui, l’élut membre de la section de mécanique à la place de
Carnot proscrit, et il tira habilement parti de cette couronne académique
dont le faux éclat éblouit ses soldats et sembla l’élever au-dessus de tous
les autres généraux, ses rivaux de gloire.
Je me rappelle qu’à cette époque, Bonaparte, entretenant un jour le célèbre
Laplace et quelques autres membres de l’Institut d’un nouvel ouvrage, in-
titulé Geometria del compasso, dont Mascheroni lui avait récemment, fait
hommage à Milan, fit, à l’occasion d’une proposition tout à fait élémentaire,
une figure sur le tableau avec de la craie pour mieux se faire comprendre,
prétendit-il, et que Laplace, soit moquerie comme je le crus alors, soit fla-
gornerie comme je l’ai cru depuis, lui dit « Je ne m’attendais pas, général,
à recevoir une leçon de mathématiques de vous ». Les aides-de-camp de
Bonaparte et ses flatteurs, il n’en manquait pas déjà, répétèrent à l’envi ce
qu’ils appelaient l’aveu de Laplace lui-même de la supériorité de Napoléon
sur lui en mathématiques, et la foule hébétée le répéta après eux. La vérité
est que Bonaparte avait oublié depuis longtemps le peu de mathématiques
dont il avait eu besoin pour entrer dans l’artillerie avant la Révolution, et
que lorsqu’il fut reçu à l’Institut il n’eût certes pas pu être reçu à l’école
polytechnique.
À vous de conclure ! En attendant, vous pouvez démontrer vous-même le « théorème
de Napoléon », par exemple en utilisant le calcul dans le plan complexe.
Le magnifique théorème suivant, en revanche, ne prête pas à polémique. Il a bien été
démontré par Frank Morley (1860-1937), en 1899.
1. Dubois-Aymé : Marie-Thérèse de Bouès. Pascal Beyls éd. Grenoble, p. 233 (2009).
45
Théorème 6. Soit ABC un triangle quelconque. Soient X, Y, Z les points d’intersec-

tion deux à deux des trissectrices adjacentes du triangle. Le triangle XY Z est équilatéral
(figure 13).
Pourquoi les grecs ne l’avaient-ils pas trouvé ? Peut-être parce qu’il est impossible
de construire les trissectrices d’un angle à la règle et au compas. . .
Z Y
B C
Figure 13 – Le théorème de Morley.
3.2 La proposition xxxii

Le père de Blaise Pascal avait peut-être acheté « Les quinze livres des éléments
géométriques d’Euclide : plus le livre des donnez du mesme Euclide aussi traduict en
françois par ledit Henrion, et imprimé de son vivant », en 1632. Voici ce qu’on y lit,
page 54.
theor 22. prop. xxxii
En tout triangle, l’vn des costez estant prolongé, l’angle extérieur est égal
aux deux opposez interieurs ; et de chacun triangle les trois angles interieurs
sont egaux à deux droicts.
Pas de quoi s’émerveiller pensez-vous ? Commencez par vérifier que vous savez le dé-
montrer, puis lisez la suite. La scène se passe en 1635 et c’est la sœur de Blaise qui
raconte.
Son génie pour la géométrie commença à paraître qu’il n’avait encore que
douze ans, par une rencontre si extraordinaire, qu’il me semble qu’elle mé-
rite bien d’être déduite en particulier.
Mon père était savant dans les mathématiques, et il avait habitude par là
avec tous les habiles gens en cette science, qui étaient souvent chez lui. Mais
comme il avait dessein d’instruire mon frère dans les langues, et qu’il savait
que la mathématique est une chose qui remplit et satisfait l’esprit, il ne
voulut point que mon frère en eût aucune connaissance, de peur que cela
ne le rendit négligent pour le latin et les autres langues dans lesquelles il
46
voulait le perfectionner. Par cette raison il avait fermé tous les livres qui en
traitent. Il s’abstenait d’en parler avec ses amis, en sa présence : mais cette
précaution n’empêchait pas que la curiosité de cet enfant ne fût excitée,
de sorte qu’il priait souvent mon père de lui apprendre les mathématiques.
Mais il le lui refusait en lui proposant cela comme une récompense. Il lui
promettait qu’aussitôt qu’il saurait le latin et le grec, il les lui apprendrait.
Mon frère, voyant cette résistance, lui demanda un jour ce que c’était que
cette science, et de quoi on y traitait ; mon père lui dit en général que c’était
le moyen de faire des figures justes, et de trouver les proportions qu’elles
ont entre elles, et en même temps lui défendit d’en parler davantage et d’y
penser jamais. Mais cet esprit qui ne pouvait demeurer dans ces bornes, dès
qu’il eut cette simple ouverture, que la mathématique donnait des moyens
de faire des figures infailliblement justes, il se mit lui-même à rêver, et, à
ses heures de récréation, étant venu dans une salle où il avait accoutumé
de se divertir, il prenait du charbon et faisait des figures sur des carreaux,
cherchant les moyens, par exemple, de faire un cercle parfaitement rond,
un triangle dont les côtés et les angles fussent égaux, et d’autres choses
semblables. Il trouvait tout cela lui seul sans peine ; ensuite il cherchait les
proportions des figures entre elles. Mais comme le soin de mon père avait
été si grand de lui cacher toutes ces choses qu’il n’en savait pas même les
noms, il fut contraint lui-même de s’en faire. Il appelait un cercle un rond,
une ligne une barre, ainsi des autres. Après ces noms il se fit des axiomes, et
enfin des démonstrations parfaites ; et comme l’on va de l’un à l’autre dans
ces choses, il passa et poussa sa recherche si avant, qu’il en vint jusqu’à
la trente-deuxième proposition du premier livre d’Euclide. Comme il en
était là-dessus, mon père entra par hasard dans le lieu où il était, sans que
mon frère l’entendît ; il le trouva si fort appliqué, qu’il fut longtemps sans
s’apercevoir de sa venue. On ne peut dire lequel fut le plus surpris ; ou le
fils de voir son père, à cause de la défense expresse qu’il lui en avait faite,
ou le père de voir son fils au milieu de toutes ces choses. Mais la surprise
du père fut bien plus grande lorsque lui ayant demandé ce qu’il faisait, il
lui dit qu’il cherchait telle chose, qui était la trente-deuxième proposition
du premier livre d’Euclide. Mon père lui demanda ce qui l’avait fait penser
à cela. Il dit que c’était qu’il avait trouvé telle chose. Et sur cela, lui ayant
fait encore la même question, il lui dit encore quelques démonstrations qu’il
avait faites ; et enfin en rétrogradant et s’expliquant toujours par les noms
de rond et de barre, il en vint à ses définitions et à ses axiomes.
Mon père fut si épouvanté de la grandeur et de la puissance de ce génie,
que sans lui dire un mot il le quitta et alla chez M. Le Pailleur, qui était son
ami intime, et qui était aussi très savant. Lorsqu’il y fut arrivé, il demeura
immobile comme transporté. M. Le Pailleur, voyant cela, et voyant même
qu’il versait quelques larmes, fut épouvanté, et le pria de ne lui pas celer
47
plus longtemps la cause de son déplaisir. Mon père lui répondit : « Je ne

pleure pas d’affliction, mais de joie ; vous savez le soin que j’ai pris pour
ôter à mon fils la connaissance de la géométrie, de peur de le détourner de
ses autres études : cependant voyez ce qu’il a fait.» Sur cela il lui montra
même ce qu’il avait trouvé, par où l’on pouvait dire en quelque façon qu’il
avait trouvé la mathématique.
M. Le Pailleur ne fut pas moins surpris que mon père l’avait été, et lui dit
qu’il ne trouvait pas juste de captiver plus longtemps cet esprit, et de lui
cacher encore cette connaissance ; qu’il fallait lui laisser voir les livres sans
le retenir davantage.
Mon père, ayant trouvé cela à propos, lui donna les Éléments d’Euclide,
pour les lire à ses heures de récréation. Il les vit et les entendit tout seul, sans
avoir jamais eu besoin d’explication ; et pendant qu’il les voyait, il composait
et allait si avant, qu’il se trouvait régulièrement aux conférences qui se
faisaient toutes les semaines, où tous les habiles gens de Paris s’assemblaient
pour porter leurs ouvrages, et pour examiner ceux des autres. Mon frère
tenait fort bien son rang, tant pour l’examen que pour la production ; car il
était de ceux qui y portaient le plus souvent des choses nouvelles. On voyait
souvent aussi dans ces assemblées des propositions qui étaient envoyées
d’Allemagne et d’autres pays étrangers, et on prenait son avis sur tout avec
autant de soin que de pas un autre ; car il avait des lumières si vives, qu’il est
arrivé qu’il a découvert des fautes dont les autres ne s’étaient point aperçus.
Cependant il n’employait à cette étude que les heures de récréation ; car il
apprenait le latin sur des règles que mon père lui avait faites exprès. Mais
comme il trouvait dans cette science la vérité qu’il avait toujours cherchée
si ardemment, il en était si satisfait, qu’il y mettait tout son esprit ; de sorte
que, pour peu qu’il s’y occupât, il y avançait tellement, qu’à l’âge de seize
ans il fit un Traité des Coniques qui passa pour un si grand effort d’esprit,
qu’on disait que depuis Archimède on n’avait rien vu de cette force. Tous les
habiles gens étaient d’avis qu’on l’imprimât dès lors, parce qu’ils disaient
qu’encore que ce fût un ouvrage qui serait toujours admirable, néanmoins, si
on l’imprimait dans le temps que celui qui l’avait inventé n’avait encore que
seize ans, cette circonstance ajouterait beaucoup à sa beauté : mais comme
mon frère n’a jamais eu de passion pour la réputation, il ne fit point de cas
de cela ; et ainsi, cet ouvrage n’a jamais été imprimé.
3.3 Les Sangakus

La bataille de Sekigahara s’est déroulée les 20 et 21 octobre 1600 sous une pluie
battante. Elle allait décider de l’avenir du pays pour 2 siècles et demi. Le vainqueur,
Ieyasu Tokugawa, s’empara du pouvoir et transféra la capitale dans une petite bour-
gade tranquille promise à un certain avenir : l’ancienne Edo devint finalement Tokyo.
48
Sous l’ère Edo donc, les dirigeants successifs appliquèrent une stricte politique d’isole-
ment qui permit de maintenir la paix. Commerçants chinois, missionnaires européens,
tous ces fauteurs de troubles porteurs d’idées nouvelles n’étaient pas les bienvenus.
Ceci engendra le développement de particularités culturelles originales dans tous les
domaines, du théâtre à la poésie, en passant par la musique. . . et les mathématiques.
Certains prirent l’habitude d’accrocher au fronton des temples des planches de bois
décorées exposant des énigmes mathématiques, les sangakus. Exposés aux intempéries
et à l’indifférence, beaucoup de ces sangakus du xviie au xixe siècle se sont perdus :
environ 800 seulement ont été conservés. Les auteurs viennent de toutes les classes
sociales, jeunes ou vieux, hommes ou femmes. Offrande aux Dieux, ex-voto, publicité,
ostentation ou simple amusement ? Si le sens religieux ou mystique s’est perdu, en re-
vanche l’intérêt esthétique et la signification mathématique restent parfaitement clairs.
Jusque de nos jours, des passionnés affichent encore leurs énigmes, et il en est même qui
en proposent sur le web. Ce sont en général des problèmes de géométrie euclidienne, à
base de cercles, de carrés et de triangles.
Nous vous proposons celui de la figure 14. Dans un cercle de rayon R on trace 4
cercles dans chacun des quarts du cercle initial, tangents entre eux et au grand cercle.
Entre ces 4 cercles, on considère le cercle tangent aux 4, concentrique au grand cercle.
Soit r son rayon : quel est le rapport de r à R ? Essayez de jouer le jeu : pas de logiciel
de calcul, pas d’équation algébrique, pas de nombres complexes.
√ . . Après tout peu
importe : faites comme vous voulez, mais trouvez 3 − 2 2.
Figure 14 – Sangaku du temple d’Isaniwa Jinjya, 107 × 77 cm (1937)
3.4 La règle de Sarrus

Âgé de 17 ans, Pierre-Frédéric Sarrus 2 , natif de Saint-Affrique dans l’Aveyron, des-
cend à Montpellier pour y faire ses études. Nous sommes à la rentrée 1815, Napoléon
2. J.-B. Hirriart-Urruty et H. Caussinus : Sarrus, Borel, Deltheil. Le Rouergue et ses mathémati-
ciens Gazette de la SMF (104) p. 88–97 (2005)
49
vient d’être chassé du pouvoir, et il ne fait pas bon être à la fois protestant et bona-
partiste. Sarrus, qui hésite encore entre mathématiques et médecine, va l’apprendre à
ses dépens. Pour exercer la médecine, il faut un « certificat de bonne vie et mœurs »,
qu’il demande au maire de Saint-Affrique. Voici la réponse.
Le maire pense qu’un jeune homme auteur et propagateur de chansons sé-
ditieuses, outrageantes pour le roi et la famille royale, qui avant l’interrègne
se permit d’arracher et de fouler aux pieds le ruban blanc que portait à la
boutonnière un de ses camarades, et qui, dans une autre circonstance, lui
prend la fleur de lys et fait semblant de la conspuer, ne peut être un bon
citoyen, et ne mérite pas le certificat qu’il demande.
Ce sera donc les mathématiques. Il deviendra professeur et même doyen de la Faculté
des Sciences de Strasbourg. Il est l’auteur de publications d’un nombre et d’un niveau
tout à fait respectables, et il est quelque peu injuste qu’il soit surtout connu pour sa
règle de calcul d’un déterminant d’ordre 3, qui n’est au fond qu’une astuce mnémo-
technique, et qu’il n’a probablement pas publiée lui-même. Elle apparaît en 1846 dans
les « Éléments d’Algèbre » de P.J.E. Finck, son collègue à l’Université de Strasbourg,
à propos de la résolution des systèmes linéaires 3 × 3.
Pour calculer, dans un exemple donné, les valeurs de x, y, et z, M. Sarrus
a imaginé la méthode pratique suivante, qui est fort ingénieuse. D’abord
on peut calculer le dénominateur, et à cet effet on écrit les coefficients des
inconnues ainsi
a b c
a0 b0 c0
a00 b00 c00
On répète les trois premiers a b c
et les trois suivants a0 b0 c0
Alors partant de a, on prend diagonalement du haut en bas, en descendant à

la fois d’un rang, et reculant d’autant à droite, ab0 c00 ; on part de a0 de même,
et on a a0 b00 c ; de a00 , et on trouve a00 bc0 ; on a ainsi les trois termes positifs
(c’est-à-dire à prendre avec leurs signes) du dénominateur. On commence
ensuite par c et descendant de même vers la gauche on a cb0 a00 , c0 b00 a, c00 ba0 ,
ou les trois termes négatifs (ou plutôt les termes qu’il faut changer de signe).
3.5 Les géodésiens

Si dans un triangle on connaît les longueurs de deux côtés et la valeur de l’angle
entre ces deux côtés, alors on peut calculer l’autre côté et les deux autres angles, grâce
au théorème d’Al-Kashi. De même si on connaît la longueur d’un côté et la valeur des
deux angles à ses extrémités, alors on peut calculer les longueurs des deux autres côtés
et l’angle restant. Connus au moins depuis Euclide, ces résultats ont été longtemps
50
utilisés pour les calculs de longueur, tant en astronomie que pour les relevés terrestres.
Il sont la base de la triangulation, seule méthode possible pour mesurer de grandes
distances, avant le laser et les satellites.
Ses réflexions sur la gravitation universelle avaient conduit Newton à affirmer que
la Terre est un ellipsoïde aplati aux pôles (Principia Naturalis, 1687). Depuis, l’Eu-
rope savante, et en particulier l’Académie Royale des Sciences se passionnait pour
la vérification de cette affirmation. Les Cassini, père puis fils, avaient recueilli une
masse impressionnante de données en triangulant le territoire français. Leurs conclu-
sions semblaient infirmer celles de Newton. La polémique s’étend sur des centaines de
pages dans les comptes-rendus de l’Académie pour les années 1720. Arguant de consi-
dérations géopolitiques autant que scientifiques, le secrétaire de l’Académie Maurepas,
réussit à persuader le roi Louis xv de financer deux expéditions. L’une ira en Laponie
mesurer un degré de méridien au voisinage du pôle, l’autre devra mesurer un degré de
méridien à l’équateur. Si la Terre est bien aplatie, un degré de méridien au pôle doit
être plus court qu’en France, et à l’équateur il doit être plus long.
Le 16 mai 1735, l’expédition de l’équateur, composée de dix scientifiques et in-
génieurs s’embarque à La Rochelle, en direction du Pérou, une colonie espagnole qui
recouvrait la plus grande partie de la Bolivie, de l’Equateur et du Pérou actuels. Il est
impossible de décrire ici l’extraordinaire aventure scientifique et humaine que fut cette
expédition 3 . Il y eut dans la dizaine d’années que dura cette épopée, deux meurtres,
une dizaine de procès, d’innombrables maladies, un mort de fièvre jaune, un dans un
accident d’échafaudage, un disparu dans la jungle, un mariage, des affaires de cœur,
du trafic d’or et d’objets de luxe, une affaire d’espionnage.
Scientifiquement, rien ne semblait pourtant présenter de difficulté insurmontable.
Pour mesurer un degré de méridien, il faut essentiellement trois étapes. La première
consiste à mesurer, par arpentage direct sur le terrain, une base rectiligne. La seconde
est la triangulation. On construit à partir de la base un maillage, composé de triangles
dont on mesure tous les angles, et dont on calcule les longueurs des côtés. On en
déduit, par projection orthogonale, la longueur d’un arc de méridien. Il reste ensuite à
déterminer la différence des latitudes des deux extrémités de l’arc dont la longueur a
été mesurée.
Suite aux difficultés du voyage, la mesure de la base ne put pas avoir lieu avant
l’automne 1736. Une toise, spécialement amenée de Paris, sert d’étalon pour des perches
en bois, que l’on met bout à bout pour mesurer, en deux équipes indépendantes, une
étendue de terrain préalablement défriché, aplani et aménagé pour les mesures. Selon
l’heure de la journée, il faut tenir compte des variations des longueurs des perches avec
la température et l’humidité. Quand les deux équipes confrontent leurs résultats, la
différence sur plus de 12 kilomètres est de l’ordre de la dizaine de centimètres !
Forts de ce succès, les savants se lancent dans une triangulation d’envergure : 43
triangles seront mesurés sur une longueur de 354 kilomètres. La région de Quito où se
3. F. Trsytram : Le procès des étoiles, Seghers, Paris (1979)
51
déroulent les mesures est montagneuse, et pour être bien visibles, les repères marquant
les extrémités des triangles sont placés en altitude. Dès la première visée, les savants
passent une nuit à 4600 mètres, sous une tempête de neige. Ce n’est que le début d’une
épreuve de trois ans, passés pour l’essentiel sur des sentiers de montagne ou dans des
campements de fortune, où ni les nombreuses maladies, ni les vols de matériel, ni la
crainte des animaux sauvages ne les empêcheront de mesurer leurs triangles, toujours
avec le souci de précision le plus extrême. Leur plan initial prévoyait trois équipes,
mesurant chacune deux angles de chaque triangle, de manière à ce que tous les angles
soient systématiquement mesurés deux fois. Même si les dissensions et les circonstances
les empêcheront de s’en tenir à un programme aussi contraignant, c’est la satisfaction
du travail bien fait qui domine fin 1739. Ils s’offrent même le luxe, nécessaire à leurs
yeux, de mesurer une deuxième base à l’autre extrémité de leur triangulation, afin de
vérifier leurs calculs en les reprenant à l’envers. Tous pensent que le plus facile reste
à faire : déterminer la latitude des deux extrémités de l’arc. Il leur faudra encore des
années de travail et de polémique pour parvenir à un résultat.
Non pas que l’enjeu scientifique soit bien grand : en 1737, une mauvaise nouvelle
leur est parvenue. Fortement aidé par l’astuce et la puissance de calcul de Clairaut,
Maupertuis, qui dirigeait l’expédition en Laponie, n’a mis que quelques mois à ramener
le résultat qu’on attendait : la Terre est bien aplatie aux pôles. Maupertuis s’est déjà fait
représenter en majesté pour la postérité, devant un globe terrestre exagérément aplati,
la main négligemment posée sur un exemplaire des Principia Naturalis de Newton !
Longtemps après cette aventure, la triangulation de la terre devait occuper encore
de nombreux mathématiciens. Enjeux scientifiques, mais aussi économiques et surtout
militaires, les raisons pour établir des cartes précises, et donc mesurer des triangula-
tions sur le terrain ne manquaient pas. Au cours des xviiie et xixe siècles, ces mesures
furent souvent confiées à des militaires, qui devaient parfois se montrer aussi bons alpi-
nistes que mathématiciens. Lors de la triangulation des Pyrénées en 1825, les officiers
géodésiens Peytier et Hossard utilisèrent pour leurs calculs le sommet du Balaïtous
(3144m). En 1865, C. Packes, pensant être le premier à réaliser l’ascension de ce pic,
fut plutôt déçu d’y trouver le repère que Peytier et Hossard avaient édifié 40 ans plus
tôt. Un sommet proche a été baptisé de leurs noms, et un autre s’appelle « pointe des
géodésiens ». Dans les Alpes, la pointe Helbronner, la pointe Dufour, la pointe Durand
portent aussi des noms de géodésiens.
3.6 Le cinquième postulat

Les Éléments sont un traité mathématique et géométrique, constitué de 13 livres
organisés thématiquement, probablement écrit par Euclide vers 300 avant J.-C. Il com-
prend une collection de définitions, axiomes, théorèmes et démonstrations sur la géo-
métrie et les nombres.
C’est le plus ancien exemple connu d’un traitement axiomatique et systématique
de la géométrie et son influence sur le développement de la science occidentale est
52
fondamentale. Il s’agit du livre de mathématiques le plus lu au cours de l’histoire : les

Éléments furent l’un des premiers livres imprimés et ont connu depuis plus de 1000
éditions. Pendant des siècles, vos prédecesseurs ont appris les mathématiques non pas
dans des polycopiés, mais dans les Éléments.
Le livre I contient 5 postulats de géométrie plane.
1. Un segment de droite peut être tracé en joignant deux points quelconques.
2. Un segment de droite peut être prolongé indéfiniment en une ligne droite.
3. Etant donné un segment de droite quelconque, un cercle peut être tracé en prenant
ce segment comme rayon et l’une de ses extrémités comme centre.
4. Tous les angles droits sont congruents
5. Si deux droites sont sécantes avec une troisième de telle façon que la somme des
angles intérieurs d’un côte soit inférieure à deux angles droits, alors ces deux
droites sont forcément sécantes de ce côté.
La contraposée du cinquième postulat est que si deux droites ne se coupent pas, alors
la somme des angles intérieurs à toute sécante est égale à π. En conséquence, par un
point donné, il ne peut passer qu’une parallèle à une droite donnée.
Pour cette raison, le cinquième postulat s’appelle le postulat des parallèles. Il a
toujours semblé moins évident que les autres, et de nombreux mathématiciens ont
pensé qu’il pouvait être démontré à partir des précédents. Pendant des siècles, toutes
les tentatives échouèrent. La plupart d’entre elles étaient des essais de démonstration
par l’absurde. Nombreux furent ceux qui conclurent à une contradiction devant ce
qu’ils percevaient comme une impossibilité « évidente » mais qui n’était nullement
une contradiction mathématique. Parmi ces courageux, Giovanni Saccheri (1667-1733)
mérite une mention spéciale. En 1733, il publie « Euclides ab omni naevo vindica-
tus » (Euclide lavé de toute tache). Partant du postulat que par un point on peut
faire passer une infinité de droites distinctes qui ne coupent pas une droite donnée,
Saccheri démontre quantité de théorèmes, et devant leur évidente bizarrerie, conclut
qu’il a démontré par l’absurde le cinquième postulat d’Euclide.
Pourtant, les résultats de Saccheri sont maintenant des théorèmes connus de la
géométrie hyperbolique. Ce n’est qu’au xixe siècle que Lobachevski, Boliaï, et sans doute
Gauss, reconnurent qu’il était impossible de démontrer le cinquième postulat d’Euclide :
on obtient simplement des géométries différentes avec des postulats différents.
1. par un point ne passe aucune parallèle à une droite donnée : géométrie sphérique
2. par un point passe exactement une parallèle à une droite donnée : géométrie
euclidienne
3. par un point passe une infinité de parallèles à une droite donnée : géométrie
hyperbolique
Parmi les conséquences, la somme des angles d’un triangle, qui vaut π en géométrie
euclidienne, est supérieure à π en géométrie sphérique, et inférieure à π en géométrie
hyperbolique. Voici l’expression du théorème d’Al-Kashi 4 dans les trois géométries.
53
Figure 15 – Le disque de Poincaré : modèle de la géométrie hyperbolique.
1. géométrie sphérique : cos(a) = cos(b) cos(c) + sin(b) sin(c) cos(α)

2. géométrie euclidienne : a2 = b2 + c2 − 2bc cos(α)
3. géométrie hyperbolique : cosh(a) = cosh(b) cosh(c) − sinh(b) sinh(c) cos(α)
La géométrie sphérique est facile à visualiser : sur une sphère en dimension 3, il suffit de
baptiser « droite » tout cercle de rayon maximal (intersection de la sphère avec un plan
passant par le centre). La géométrie hyperbolique est moins facile à imaginer. Henri
Poincaré (1854-1912) a proposé deux modèles équivalents. Dans le premier, les points
sont ceux d’un demi-plan de la géométrie euclidienne, mais on appelle « droite » les
demi-cercles centrés sur l’axe des abscisses. Dans le second, les points sont ceux d’un
disque, et les « droites » sont les arcs de cercle qui coupent orthogonalement le cercle
bordant le disque. La figure 15 montre des droites hyperboliques, soit orthogonales
deux à deux, soit parallèles. Elles forment des « triangles » rectangles dont deux côtés
sont infinis et deux angles nuls.
Les triangles de la figure 15 constituent un pavage du plan hyperbolique. Les pos-
sibilités pour paver le plan hyperbolique sont beaucoup plus étendues qu’en géométrie
euclidienne : on peut par exemple utiliser des pavés à 4 côtés dont deux angles opposés
valent π/3, et les deux autres π/2 : ce pavage est illustré par la figure 16. Le peintre
hollandais M.C. Escher était fasciné par la symétrie et l’infini mais il ne connaissait
pas les mathématiques quand il a réalisé cette gravure. Après avoir vu ses œuvres,
le mathématicien H.S.M. Coxeter demanda à le rencontrer, et lui expliqua qu’il avait
réinventé les pavages du plan hyperbolique.
54
Figure 16 – « Limite circulaire » de M.C. Escher.
55
Coniques
Jean-Marc Decauwert
Les coniques ont été étudiées depuis l’antiquité. Ce sont, après les droites, les
courbes planes les plus simples et les plus fréquemment rencontrées. D’abord appa-
rues comme sections planes des cylindres et des cônes de révolution (d’où leur nom),
elles sont maintenant surtout considérées, d’un point de vue mathématique, comme
les courbes planes ayant une équation polynomiale du second degré. Elles jouissent de
propriétés géométriques remarquables et interviennent dans de nombreux problèmes
physiques, en particulier en cinématique (mouvement des planètes) et en optique géo-
métrique (miroirs).
Table des matières

1 Cours 1
1.1 Définition par foyer et directrice . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Définition bifocale des coniques à centre . . . . . . . . . . . . . . . . . 5
1.3 Propriétés des tangentes . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Ellipse et cercle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Hyperbole rapportée à ses asymptotes . . . . . . . . . . . . . . . . . . . 15
1.6 Réduction des équations . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Entraînement 23
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3 Compléments 40
3.1 Sections planes des cônes et des cylindres de révolution . . . . . . . . . 40
3.2 Les théorèmes belges . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.3 Lois de Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.4 Optique géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.5 L’hexagramme mystique . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.6 Billards . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
12 décembre 2011
Maths en Ligne Coniques UJF Grenoble
1 Cours
Nous étudierons ici les coniques exclusivement du point de vue de la géométrie
euclidienne. Tout ce chapitre a donc pour cadre un plan affine euclidien, rapporté,
dans la plupart des cas, à un repère orthonormal (avec une exception en ce qui concerne
l’hyperbole, dont l’équation est particulièrement simple dans un repère porté par ses
asymptotes).
1.1 Définition par foyer et directrice

Définition 1. Soit D une droite, F un point n’appartenant pas à D, et e > 0 un réel.
On appelle conique de directrice D, de foyer F et d’excentricité e l’ensemble des points
M du plan dont le rapport des distances à F et à D est égal à e, i.e. qui vérifient
MF
= e, où H est le projeté orthogonal de M sur D. Si e < 1, la conique est appelée
MH
ellipse, si e = 1 parabole, et si e > 1 hyperbole.
Proposition 1. La perpendiculaire ∆ à la directrice D menée par le foyer F est axe

de symétrie de la conique. Cette droite est appelée axe focal de la conique (focal = qui
porte le foyer).
Démonstration : Soit M un point de la conique, s la symétrie orthogonale d’axe ∆,

M 0 = s(M ). Le point F est fixe par s et la droite D globalement invariante par s.
Une symétrie orthogonale conserve les distances et l’orthogonalité. Il en résulte que le
projeté orthogonal de M 0 sur D est l’image H 0 = s(H) du projeté orthogonal H de M
sur D et que M 0 F = M F , M 0 H 0 = M H. Le point M 0 appartient donc à la conique.
Dans le cas particulier où e = 1, la parabole de directrice D et de foyer F est
l’ensemble des points du plan équidistants de la droite D et du point F ; on peut aussi
décrire cet ensemble comme le lieu des centres des cercles tangents à D passant par F .
1
Équations réduites
Nous allons chercher dans ce paragraphe un repère dans lequel l’équation de la
conique soit la plus simple possible. Une telle équation sera appelée équation réduite
de la conique.
La proposition 1 nous amène à travailler dans un repère orthonormal dont l’axe des
x est l’axe focal. Soit donc (O,~i, ~j) un tel repère, (xF , 0) les coordonnées de F , x = xD
MF
l’équation de D dans ce repère. L’équation = e équivaut à M F 2 = e2 M H 2 , soit
MH
encore :
(x − xF )2 + y 2 = e2 (x − xD )2 .
Si e = 1, cette équation s’écrit encore :
xD + xF

2(xF − xD ) x − = y2 ,
2
ce qui amène à poser xF = p/2, xD = −xF . L’équation s’écrit alors y 2 = 2px. Le réel
p > 0 est appelé paramètre de la parabole (c’est la distance du foyer à la directrice),
l’origine O sommet de la parabole (c’est le seul point de la parabole situé sur l’axe
focal).
Si e 6= 1, l’équation s’écrit :
(1 − e2 )x2 + y 2 − 2x(xF − e2 xD ) + x2F − e2 x2D = 0 .
On est alors amené à choisir l’origine O du repère de façon à avoir xF −e2 xD = 0, ce qui
revient à dire que O est barycentre du système de points pondérés [(F, 1), (K, −e2 )],
où K est le point d’intersection de la directrice et de l’axe focal. Le point O est aussi
le milieu du segment AA0 , où A et A0 sont les deux points de la conique situés sur l’axe
focal (ces points sont les barycentres des systèmes pondérés [(F, 1), (K, e)] et [(F, 1),
a
(K, −e)]). Si on appelle a et −a les abscisses de ces points, de sorte que xD = ,
e
xF = ae, l’équation s’écrit :
x2 y2
+ = 1.
a2 a2 (1 − e2 )
On constate alors que l’axe Oy est axe de symétrie et le point O centre de symétrie
de la conique. L’ellipse et l’hyperbole sont ainsi appelées coniques à centre, ce qui les
distingue de la parabole, qui ne possède pas de centre de symétrie.
Une symétrie centrale étant une isométrie, on en déduit (démonstration analogue
à celle de la proposition 1) pour ces coniques l’existence d’un second couple foyer-
directrice (F 0 , D0 ), symétrique du premier par rapport au point O (ou par rapport à
l’axe Oy).
On est ensuite amené à séparer les cas e < 1 et e > 1 :
• Si e < 1 (cas
√ de l’ellipse), l’axe Oy
√ coupe la conique en deux points B et B ,
0
d’ordonnées ±a 1 − e2 . On pose b = a 1 − e2 , de sorte que 0 < b < a. L’équation de
2
l’ellipse s’écrit alors :

x2 y 2
+ 2 = 1.
a2 b √
Le foyer F a pour coordonnées (c, 0), où on a posé c = ae = a2 − b2 , de sorte que
a2 = b2 + c2 , et la directrice D pour équation x = a2 /c. Le foyer F 0 a pour coordonnées
(−c, 0) et la directrice associée D0 pour équation x = −a2 /c. Les paramètres a, b, c
représentent respectivement la moitié de la longueur AA0 du grand axe, la moitié de
la longueur BB 0 du petit axe et la demi-distance focale (distance F F 0 entre les deux
foyers).
L’ellipse est une courbe bornée : elle est tout entière contenue dans le rectangle
de sommets de coordonnées (±a, ±b) et est en particulier comprise entre ses deux
directrices.
√ • Si e > 1 (cas de l’hyperbole), l’axe Oy ne coupe pas la conique. On pose b =
a e2 − 1. L’équation de l’hyperbole s’écrit alors :
x2 y 2
− 2 = 1.
a2 b
√
On pose c = ae = a2 + b2 , de sorte que c = a2 +b2 . Le foyer F (resp. F 0 ) a alors pour
2
coordonnées (c, 0) (resp. (−c, 0)) et la directrice associée D (resp. D0 ) pour équation
x = a2 /c (resp. x = −a2 /c). L’hyperbole possède deux branches, situées respectivement
dans les demi-plans définis par les inéquations x ≥ a et x ≤ −a. Ses directrices sont
situées dans la bande séparant ces deux demi-plans.
Une parabole ou une ellipse sépare le plan en deux régions, définies par les inégalités
M F > eM H et M F < eM H. Une hyperbole sépare le plan en trois régions, dont deux
correspondent à l’inégalité M F < eM H et une (celle située en les deux branches) à
l’inégalité M F > eM H.
Remarque : on peut considérer le cercle d’équation x2 + y 2 = a2 , de centre O et de
rayon a, comme un cas limite d’ellipse, pour lequel e = 0, b = a, c = 0, les directrices
étant repoussées à l’infini et les deux foyers confondus. Il n’est néanmoins pas possible
de donner une définition du cercle par foyer et directrice dans le cadre du plan affine
euclidien.
3
Représentation paramétrique
Parabole
La parabole d’équation y 2 = 2px admet la représentation paramétrique :

t2
x=



2p (t ∈ R) .
y = t


x2 y 2
Ellipse : L’ellipse d’équation + 2 = 1 admet la représentation paramétrique :
a2 b
x = a cos t
(
(t ∈ [0, 2π[) .
y = b sin t
x2 y2
Hyperbole : L’hyperbole d’équation 2 − 2 = 1 admet la représentation paramé-
a b
trique :
x = ±a ch t
(
(t ∈ R) .
y = b sh t
chaque choix de signe correspondant à la représentation paramétrique de l’une des deux
branches.
Elle admet aussi la représentation paramétrique :
a

x

=
π π π 3π

cos t t∈ − , ∪ , ,
 y = b tan t
 2 2 2 2
chacun des intervalles de son domaine de définition correspondant à une branche.

Elle admet également la représentation paramétrique rationnelle :
a 1

x = u+



2 u
(u ∈] − ∞, 0[∪]0, +∞[) ,
b 1

y =

u−


2 u
chacun des intervalles de son domaine de définition correspondant à une branche.
x2 y2
On en déduit que l’hyperbole d’équation 2 − 2 = 1 admet deux asymptotes
a b
b b
d’équations y = x et y = − x. En effet, en utilisant par exemple la représentation
a a
paramétrique x = a ch t, y = b sh t de la branche de droite de l’hyperbole, on voit que,
b
pour tout point (x, y) de l’hyperbole, y − x = b (sh t − ch t) = −b e−t tend vers 0
a
4
b
quand t tend vers +∞ et y + x = b (sh t + ch t) = b et tend vers 0 quand t tend vers
a
−∞.
Équation polaire d’une conique de foyer l’origine
Les lois de Kepler (voir section 3.3) disent que les trajectoires des planètes sont
approximativement des ellipses dont le soleil occupe un des foyers. La démonstration
de ce résultat fait intervenir l’équation polaire d’une conique dont un des foyers est
situé à l’origine du repère. C’est ce qui fait l’importance de la proposition suivante.
Proposition 2. Soit, dans le plan rapporté à un repère orthonormal (O,~i, ~j), D une
droite d’équation normale x cos ϕ + y sin ϕ = d, où d > 0 est la distance de O à D. La
conique d’excentricité e, de foyer O et de directrice D admet l’équation polaire :
p
ρ=
1 + e cos(θ − ϕ)
où p = ed est appelé paramètre de la conique.
Démonstration : La droite d’équation normale x cos ϕ + y sin ϕ = d se déduit de la

droite d’équation x = d (qui correspond au cas ϕ = 0) par la rotation de centre O et
d’angle ϕ. Il suffit donc de faire la démonstration dans le cas où ϕ = 0, le cas général se
déduit en remplaçant l’angle polaire θ d’un point M par θ − ϕ dans l’équation obtenue.
Les coordonnées cartésiennes de M sont alors x = ρ cos θ, y = ρ sin θ et celles du
projeté orthogonal H de M sur D (d, ρ sin θ). La relation M O2 = e2 M H 2 s’écrit alors
ρ2 = e2 (ρ cos θ − d)2 , soit en développant :
(1 − e2 cos2 θ)ρ2 + 2e2 d cos θ ρ − e2 d2 = 0 .
Les racines de cette équation du second degré sont

ed(−e cos θ ± 1)
ρ=
1 − e2 cos2 θ
si e2 cos2 θ 6= 1 (si e ≥ 1, la ou les valeurs de θ telles que e2 cos2 θ = 1 correspondent
aux directions asymptotiques de la parabole ou de l’hyperbole).
ed
On trouve donc a priori deux courbes d’équations polaires ρ1 (θ) = et
1 + e cos θ
−ed
ρ2 (θ) = . Mais ρ2 (θ + π) = −ρ1 (θ), ce qui signifie que le point d’angle polaire
1 − e cos θ
θ + π de la première courbe se confond avec le point de paramètre θ de la première. Il
suffit donc de garder la première équation.
1.2 Définition bifocale des coniques à centre

L’existence de deux couples foyer-directrice pour les coniques à centre permet d’en
obtenir une autre caractérisation. Si on appelle en effet F et F 0 les foyers, D et D0 les
5
directrices correspondantes, H et H 0 les projetés d’un point M de la conique sur D et

D0 , on a les relations M F = eM H, M F 0 = eM H 0 .
Cas de l’ellipse
L’ellipse est entièrement incluse dans la bande verticale délimitée par ses deux
directrices ; il en résulte que tout point M de l’ellipse appartient au segment HH 0 , d’où
2a
M F + M F 0 = e(M H + M H 0 ) = eHH 0 = e = 2a. L’ellipse est donc incluse dans
e
l’ensemble des points M du plan vérifiant M F + M F 0 = 2a.
Réciproquement, si un point M du plan de coordonnées (x, y) vérifie M F + M F 0 = 2a,
on déduit de la relation
(M F − M F 0 )(M F + M F 0 ) = M F 2 − M F 02 = [(x − c)2 + y 2 ] − [(x + c)2 + y 2 ] = −4cx
que M F −M F 0 = −2ex, puisque e = c/a, d’où M F = a−ex, et M F 2 = (x−c)2 +y 2 =

(a − ex)2 , soit x2 (1 − e2 ) + y 2 = b2 puisque ea = c et a2 − b2 = c2 , ou encore, en divisant
x2 y2
par b2 , 2 + 2 = 1, ce qui montre que l’ensemble des points M du plan vérifiant
a b
M F + M F 0 = 2a est inclus dans l’ellipse. L’ellipse est donc égale à cet ensemble.
Cas de l’hyperbole
L’hyperbole se compose au contraire de deux branches extérieures à la bande ver-
ticale délimitée par ses deux directrices. Il en résulte que pour tout point M de l’hy-
perbole, on a |M F − M F 0 | = e|M H − M H 0 | = 2a. L’une des branches de l’hyperbole
est donc incluse dans l’ensemble des points M du plan vérifiant M F − M F 0 = 2a et
l’autre dans l’ensemble des points M vérifiant M F 0 − M F = 2a. Un calcul identique
à celui opéré dans le cas de l’ellipse permet ici encore de vérifier que l’hyperbole est
exactement l’ensemble des points M du plan vérifiant |M F − M F 0 | = 2a.
En résumé :
Proposition 3. Soient F et F 0 deux points distincts du plan et c = F F 0 /2 la demi-
distance entre ces deux points.
1. Pour tout réel a > c, l’ensemble des points M du plan vérifiant M F + M F 0 = 2a
est l’ellipse de foyers F et F 0 et de grand axe 2a.
2. Pour tout réel positif a < c, l’ensemble des points M du plan vérifiant |M F −
M F 0 | = 2a est l’hyperbole de foyers F et F 0 et de grand axe 2a.
6
Le cercle peut apparaître ici encore comme un cas particulier d’ellipse pour laquelle
les deux foyers seraient confondus.
Application : construction de l’ellipse par le procédé dit du jardinier.
Pour tracer une ellipse de foyers F et F 0 et de longueur de grand axe 2a > F F 0
donnés, il suffit de fixer deux piquets en F et F 0 et d’y attacher les extrémités d’une
ficelle non élastique de longueur 2a. Le trajet que l’on parcourt en tournant autour de
F et F 0 tout en maintenant la ficelle tendue est l’ellipse cherchée.
Ellipse Hyperbole
x2 y 2 x2 y 2
Équation réduite + 2 =1 − 2 =1
a2 b a2 b
0<b<a
x = a cos t x = εa ch t
Représentation paramétrique y = b sin t y = b sh t
0 ≤ t < 2π ε ∈ {−1, +1}, t ∈ R
F F 0 = 2c F F 0 = 2c
Distance focale
a2 = b 2 + c 2 c2 = a2 + b2
c c
Excentricité e= e=
a a
AA0 = 2a grand axe
Longueur des axes AA0 = 2a axe focal
BB 0 = 2b petit axe
Définition bifocale M F + M F 0 = 2a | M F − M F 0 | = 2a
Table 1 – Coniques à centre
7
1.3 Propriétés des tangentes

Rappels : dérivation vectorielle
→
−
Soit t 7−→ ~u(t) une fonction d’un intervalle I de R dans un espace vectoriel E
de dimension finie n. On dit que cette fonction est dérivable si toutes les coordonnées
→
−
x1 (t), . . . , xn (t) de ~u(t) dans une base B = (~e1 , . . . , ~en ) de E le sont (cette propriété ne
dépend pas de la base). Le vecteur x01 (t)~e1 + · · · + x0n (t)~en est alors indépendant de la
base. On le note ~u0 (t).
On vérifie immédiatement que si deux fonctions t 7−→ ~u(t) et t 7−→ ~v (t) d’un intervalle
→
−
I de R dans un espace vectoriel euclidien E sont dérivables, la fonction t 7−→ ~u(t) ·~v (t)
de I dans R est dérivable et que sa dérivée est t 7−→ ~u0 (t) · ~v (t) + ~u(t) · ~v 0 (t). En
particulier, la fonction t 7−→ k~u(t)k2 a pour dérivée t 7−→ 2~u(t) · ~u0 (t). On en déduit
(dérivation d’une fonction composée) que la fonction t 7−→ k~u(t)k est dérivable en tout
~u(t)
point où elle ne s’annule pas et que sa dérivée en un tel point est égale à · ~u0 (t).
k~u(t)k
Une fonction t 7−→ M (t) d’un intervalle I de R dans un espace affine E est dite dérivable
−−−−→ →
−
s’il existe un point O de E tel que la fonction t 7−→ OM (t) de I dans E soit dérivable.
−
→
On note alors M 0 (t) sa dérivée (il résulte immédiatement de la relation de Chasles
que ce vecteur ne dépend pas du point O). La courbe de représentation paramétrique
−
→
t 7−→ M (t) admet alors en tout point de paramètre t où M 0 (t) ne s’annule pas une
−
→
tangente de vecteur directeur M 0 (t).
Tangentes à la parabole
Soit M = M (t) une représentation paramétrique de la parabole et H = H(t) le

projeté orthogonal de M sur la directrice D. En dérivant par rapport à t la relation
−−→ − → −−→ − → → − −−→ → −
F M 2 − HM 2 = 0, on obtient 2F M · M 0 − 2HM · (M 0 − H 0 ) = 0. Mais HM · H 0 = 0
−−→ →
−
puisque le vecteur HM est orthogonal à D et le vecteur H 0 appartient à la direction
8
−−→ − → −−→ −−→ − →

de D. Il en résulte F H · M 0 = (F M − HM ) · M 0 = 0. La tangente en M à la parabole
est donc orthogonale à la droite (F H), i.e. est la hauteur issue de M dans le triangle
M F H. Ce triangle étant isocèle en M , cette tangente est aussi la médiatrice de [HF ]
et la bissectrice intérieure de l’angle en M de ce triangle.
Proposition 4. La tangente en un point M à la parabole de foyer F et de directrice

D est la médiatrice de [HF ], où H est le projeté orthogonal de M sur D. C’est aussi
la bissectrice intérieure de l’angle en M dans le triangle isocèle HM F .
Il en résulte que tout rayon lumineux parallèle à l’axe d’un miroir parabolique se
réfléchit en un rayon passant par le foyer : un miroir parabolique concentre donc la
lumière au foyer. Cette propriété est utilisée dans certains télescopes et dans les fours
solaires (voir section 3.4).
Tangentes aux coniques à centre

Soit Γ l’ellipse de foyers F et F 0 et de demi-grand axea. En dérivant la relation
−−→ −− →
FM F 0M  − →
F M + F M = 2a, on obtient de même :
0 
−−→ + −− → · M 0 = 0. Mais le vecteur
kF M k kF 0 M k
−−→ −−→0
MF MF
−−→ + −− → est somme de deux vecteurs directeurs unitaires des demi-droites
kF M k kF 0 M k
[M F ) et [M F 0 ) ; c’est donc un vecteur directeur de la bissectrice intérieure de l’angle
en M du triangle M F F 0 . Il en résulte que la tangente en M à l’ellipse est orthogonale
à cette bissectrice intérieure : c’est donc la bissectrice extérieure de l’angle en M de ce
triangle.
Dans le cas de l’hyperbole, on montre de même, en dérivant la relation F M −
F 0 M = ±2a (chaque choix de signe correspondant à une branche de l’hyperbole), que
la tangente en M est la bissectrice intérieure de l’angle en M du triangle M F F 0 .
9
Ellipses et hyperboles homofocales

Les ellipses (resp. les hyperboles) de foyers F et F 0 fixés sont les lignes de niveau
de la fonction M 7→ M F + M F 0 (resp. M 7→ |M F − M F 0 |). Par tout point du plan
n’appartenant pas au segment [F F 0 ] (resp. à la médiatrice de [F F 0 ] ou à la droite (F F 0 )
privée du segment [F F 0 ]) passe donc une et une seule ellipse (resp. hyperbole) de foyers
F et F 0 . Il résulte de la démonstration précédente que ces deux coniques se coupent à
angle droit, puisque les deux bissectrices en M du triangle M F F 0 sont perpendiculaires
(les gradients des deux fonctions considérées sont en tout point orthogonaux). Les
ellipses et les hyperboles de foyers fixés constituent donc deux familles de courbes
orthogonales.
10
Génération tangentielle des coniques

Soit D une droite du plan et F un point du plan n’appartenant pas à D. L’en-
semble des médiatrices des segments HF , quand H parcourt D est alors l’ensemble
des tangentes à la parabole de foyer F et de directrice D. On dit que la parabole est
l’enveloppe de cette famille de droites.
De même, si F et F 0 sont deux points distincts du plan et C le cercle de centre

F et de rayon 2a, où a est un réel vérifiant F F 0 < 2a, l’ensemble des médiatrices des
0
segments HF , quand H parcourt C est l’ensemble des tangentes à l’ellipse de foyers F

et F 0 et de grand axe 2a. L’ellipse est donc l’enveloppe de cette famille de droites. Le
cas de l’hyperbole est analogue (avec cette fois F F 0 > 2a).
1.4 Ellipse et cercle

Rappels : affinité orthogonale
Définition 2. Soit D une droite du plan et λ un réel non nul. On appelle affinité
orthogonale de base D et de rapport λ l’application du plan dans lui-même qui à tout
−−−→ −−→
point M associe le point M 0 défini par mM 0 = λ mM , où m est le projeté orthogonal
du point M sur la droite D.
Si on rapporte le plan à un repère orthonormé (O,~i, ~j) tel que le point O appartienne
à D et que ~i soit un vecteur directeur de D, les coordonnées du point M 0 sont données
par x0 = x, y 0 = λy, où (x, y) sont les coordonnées de M .
Une affinité orthogonale est une transformation affine. Elle conserve donc l’aligne-
ment, les milieux, le contact (ce qui signifie qu’elle transforme la tangente à une courbe
11
en la tangente à la courbe image), et multiplie les aires par la valeur absolue du déter-
minant de sa partie linéaire, qui est ici le rapport de l’affinité. Elle laisse par ailleurs
fixe tout point de sa base D.
Proposition 5. L’ellipse de représentation paramétrique x = a cos t, y = b sin t dans
un repère orthonormal (O,~i, ~j) est l’image du cercle de centre O et de rayon a par
l’affinité orthogonale de base Ox et de rapport b/a. Ce cercle est appelé cercle principal
de l’ellipse.
Elle est aussi l’image du cercle de centre O et de rayon b par l’affinité orthogonale
de base Oy et de rapport a/b. Ce cercle est appelé cercle secondaire de l’ellipse.
Démonstration : Il suffit d’utiliser la représentation paramétrique x = a cos t, y = a sin t

(resp. x = b cos t, y = b sin t) du cercle principal (resp. secondaire) de l’ellipse.
Cette propriété permet de déduire un certain nombre de propriétés de l’ellipse de
propriétés analogues pour le cercle.
Construction de l’ellipse par points et par tangentes
Pour construire à la règle et au compas un point M de l’ellipse connaissant ses axes
et ses cercles principal et secondaire, il suffit de tracer une demi-droite ∆ d’origine le
centre O de l’ellipse ; soit M1 le point d’intersection de ∆ avec le cercle principal, M2 le
point d’intersection de ∆ avec le cercle secondaire ; la parallèle au grand axe mené par
par M2 et la parallèle au petit axe menée par M1 se coupent un point M de l’ellipse.
Le paramètre t de ce point dans la représentation paramétrique x = a cos t, y = b sin t
est une mesure de l’angle (Ox, ∆) et est appelé anomalie excentrique du point M .
Pour construire la tangente en M à l’ellipse, il suffit de tracer la tangente au cercle
principal en M1 ; si elle coupe le grand axe en I, la droite (M I) est tangente à l’ellipse
en M . On peut aussi construire le point d’intersection J de la tangente en M2 au
cercle secondaire avec le petit axe ; les trois points M , I, J sont alors alignés sur cette
tangente.
12
Diamètres conjugués
On appelle corde d’une conique Γ tout segment joignant deux points de Γ et dia-
mètre d’une conique à centre toute corde passant par le centre de cette conique.
Proposition 6. Soit E une ellipse et D une droite.
1. L’ensemble des milieux des cordes de E parallèles à D est le diamètre [M M 0 ] de
E ayant pour extrémités les deux points M et M 0 de E en lesquels la tangente à
E est parallèle à D.
2. L’ensemble des milieux des cordes de E parallèles à (M M 0 ) est le diamètre [N N 0 ]
de E parallèle à D.
Les diamètres [M M 0 ] et [N N 0 ] de E sont dits conjugués.
Démonstration : Le parallélisme et les milieux sont conservés par toute affinité or-
thogonale. Il suffit donc de prendre l’image de E par l’affinité orthogonale de base le
grand axe qui transforme E en son cercle principal C et de démontrer la propriété
pour C. Mais la propriété est évidente dans le cas d’un cercle, puisque l’ensemble des
milieux des cordes d’un cercle parallèles à une droite donnée est le diamètre du cercle
orthogonal à cette droite.
On remarquera que deux diamètres conjugués d’une ellipse ne sont en général pas
orthogonaux : en effet une affinité orthogonale ne conserve pas l’orthogonalité.
Aire de l’ellipse
Proposition 7. L’aire intérieure à une ellipse de demi-axes a et b est égale à πab.
Démonstration : Une affinité orthogonale de rapport k > 0 multiplie les aires par k.
b
L’aire intérieure à l’ellipse est donc πa2 = πab.
a
Remarque : il n’existe pas de formule simple pour la longueur de l’ellipse.
13
Construction de l’ellipse par le procédé dit de la bande de papier

Sur un segment AB de longueur a + b (0 < b < a), on place un point M tel que
AM = b (et donc BM = a). Quand A et B se déplacent respectivement sur deux axes
orthogonaux Ox et Oy, le point M décrit un quart d’ellipse.
Démonstration : Soit N tel que le quadrilatère OBM N soit un parallélogramme et m
l’intersection de (M N ) et Ox (i.e. le projeté orthogonal de M sur Ox). Les triangles
rectangles mM A et mN O étant semblables, le point M se déduit du point N par
b
l’affinité orthogonale de base Ox et de rapport − . Mais le point N décrit un quart
a
de cercle de centre O et de rayon a.
Projection orthogonale d’un cercle sur un plan

Proposition 8. Le projeté orthogonal d’un cercle C de rayon R de l’espace sur un
plan P est :
– un cercle de rayon R si le plan P est parallèle au plan de C ;
– un segment de longueur 2R si le plan P est perpendiculaire au plan de C ;
– une ellipse de demi-grand axe R et de demi-petit axe R cos θ, où θ est l’angle du
plan P avec le plan de C si ce plan n’est ni parallèle ni perpendiculaire à P .
Démonstration : Si deux plans sont parallèles, le projeté orthogonal d’une figure sur
l’un se déduit du projeté orthogonal de cette figure sur l’autre par une translation.
Quitte à compléter par une translation, on peut donc supposer que le plan P passe par
le centre O de C.
Soit Q le plan de C. Le cas où P et Q sont parallèles est immédiat. Supposons
donc P et Q sécants. Soit (O,~i, ~j, ~k) un repère orthonormé de l’espace tel que ~i soit un
vecteur directeur de la droite D d’intersection de P et Q et ~j un vecteur de P . Soit
~u un vecteur unitaire de Q orthogonal à ~i ; (O,~i, ~u) est alors un repère orthonormé
−−−−→
de Q. Le cercle C admet dans ce repère la représentation paramétrique OM (t) =
14
R cos t~i + R sin t ~u (0 ≤ t ≤ 2π). Les composantes du vecteur ~u dans la base (~i, ~j, ~k)
sont (quitte à changer le sens de ~j et ~k) (0, cos θ, sin θ). Il en résulte que M (t) a pour
coordonnées (R cos t, R sin t cos θ, R sin t sin θ) et son projeté orthogonal m(t) sur P
pour coordonnées (R cos t, R sin t cos θ, 0). Si P et Q sont perpendiculaires, cos θ = 0 et
m(t) parcourt un segment de longueur 2R. Si cos θ 6= 0, on reconnaît la représentation
paramétrique d’une ellipse dont le grand axe est le diamètre de C porté par D et le
petit axe a pour longueur 2R cos θ.
1.5 Hyperbole rapportée à ses asymptotes

x2 y2
L’hyperbole d’équation − = 1 dans un repère orthonormal R = (O,~i, ~j)
a2 b2
b
admet comme asymptotes les droites d’équations y = ± x.
a
Son équation s’écrit encore
x y x y

− + = 1,
a b a b
x y x y
soit, en posant X = − et Y = + :
a b a b
XY = 1 .
Mais les relations

1 1
 
−  x
! !
X
= 1 1 
a b

 
Y y
a b
d’où
1 a a
! ! !
x X
=
y 2 −b b Y
15
montrent que X et Y sont les coordonnées dans le repère (non orthonormé) R0 =

a b a b
(O, ~i − ~j, ~i + ~j) du point de coordonnées (x, y) dans le repère R. L’équation
2 2 2 2
XY = 1 est donc celle de l’hyperbole dans ce repère R0 porté par les asymptotes.
Proposition 9. Pour toute hyperbole H, il existe un repère cartésien porté par les
asymptotes de H dans lequel l’équation de H est XY = 1.
Plus généralement, une hyperbole admet, dans tout repère cartésien porté par ses
asymptotes, une équation de la forme XY = k, pour un réel k non nul.
Un tel repère n’est en général pas orthogonal. Il l’est si et seulement si l’hyperbole
est équilatère.
Définition 3. Une hyperbole est dite équilatère si ses asymptotes sont perpendiculaires.
Proposition
√ 10. Une hyperbole est équilatère si et seulement si son excentricité est
égale à 2.
x2 y2
Démonstration : Les asymptotes de l’hyperbole d’équation − = 1 dans un
a2 b2
repère orthonormal admettent comme vecteurs directeurs les vecteurs (a, −b) et (a, b).
Ces vecteurs sont orthogonaux si et seulement si a2 = b2 , ou encore c2 = 2 a2 , puisque
la demi-distance focale c vérifie c2 = a2 + b2 . Mais l’excentricité e est égale à c/a.
Intersection de l’hyperbole et d’une droite

En utilisant l’équation de l’hyperbole dans un repère porté par les asymptotes, on
vérifie immédiatement que toute droite parallèle à l’une des asymptotes (et distincte
de cette asymptote) coupe l’hyperbole en exactement un point. Une telle droite admet
en effet dans ce repère une équation de la forme x = x0 ou y = y0 , où x0 (resp. y0 ) est
un réel non nul.
Proposition 11. Si une droite D non parallèle aux asymptotes coupe l’hyperbole en
deux points M et N (distincts ou confondus) et les asymptotes en deux points P et Q,
les segments [M N ] et [P Q] ont même milieu.
Démonstration : Rapportons le plan à un repère (en général non orthonormé) porté

par les asymptotes dans lequel l’équation de l’hyperbole est xy = 1. Une droite D non
parallèle aux asymptotes a une équation de la forme ux + vy + w = 0, avec uv 6= 0.
Un point de coordonnées (x, y) appartient à l’hyperbole et à D si et seulement si
y = 1/x et ux2 + wx + v = 0. La droite D coupe donc l’hyperbole en deux points
distincts (x1 , y1 ) et (x2 , y2 ) si le discriminant w2 − 4 uv de cette équation du second
degré est strictement positif et un un point double s’il est nul. Dans le cas où D coupe
l’hyperbole en deux points distincts ou confondus M et N , le milieu du segment [M N ]
x 1 + x2 w
a pour abscisse = − . Les points P et Q d’intersection de D avec les axes
2 2u
16
w w
ont pour coordonnées (− , 0) et (0, − ). Les milieux des segments [M N ] et [P Q] ont
u v
donc même abscisse et sont donc confondus, puisqu’ils appartiennent tous deux à D.
Construction de l’hyperbole point par point

On en déduit une construction point par point d’une hyperbole dont on connaît les
asymptotes et un point : si M est le point donné, on mène par M une droite coupant
les asymptotes en P et Q, le symétrique M 0 de M par rapport au milieu I du segment
[P Q] appartient alors à l’hyperbole. On peut ainsi construire à la règle et au compas
autant de points de l’hyperbole qu’on le souhaite.
1.6 Réduction des équations

On a vu à la section 1.1 que toute conique admettait, dans un certain repère or-
thonormal, une équation polynomiale du second degré. Cette propriété ne dépend en
fait pas du repère : si une courbe admet, dans un certain repère cartésien du plan (non
nécessairement orthonormé) une équation du second degré, alors elle admet, dans tout
repère cartésien du plan, orthonormé ou pas, une équation du second degré.
Soit en effet ax2 + 2bxy + cy 2 + 2dx + 2ey + f = 0, avec a, b, c non tous nuls,
l’équation d’une telle courbe Γ dans un certain repère cartésien R = (O,~i, ~j) et soit
R0 = (O0 ,~i0 , ~j 0 ) un autre repère cartésien du plan. Notons X (resp.X 0 ) le vecteur colonne
des coordonnées ! (x, y) (resp. (x , y )) d’un point M dans le repère R (resp. R ), A la
0 0 0
a b
matrice , B le vecteur colonne de composantes (d, e), P la matrice de passage
b c
de la base (~i, ~j) à la base (~i0 , ~j 0 ) et C le vecteur colonne des coordonnées de O0 dans le
repère R.
L’équation de Γ dans le repère R s’écrit alors tXAX + 2 tBX + f = 0. Mais les
coordonnées de M dans le repère R0 sont données par X = P X 0 + C. Il en résulte que
17
l’équation de Γ dans le repère R0 s’écrit t(P X 0 + C)A(P X 0 +C)+2 tB(P X 0 +C)+f = 0,

soit encore tX 0 A0 X 0 + 2 tB 0 X 0 + f 0 = 0, où A0 = tP AP , B 0 = tP (B + AC), f 0 =
f + tCAC + 2 tBC. Cette équation est encore polynomiale du second degré en x0 , y 0 .
Le but de cette section est de montrer que, réciproquement, toute courbe plane
admettant une équation du second degré est une conique (éventuellement dégénérée)
et de ramener son équation, par un changement de repère approprié, à une des formes
canoniques obtenues à la section 1.1.
On considère donc dans toute cette section une courbe plane Γ (éventuellement vide
ou réduite à un point) admettant, dans un certain repère orthonormal R = (O,~i, ~j) du
plan, une équation du second degré, de la forme :
ax2 + 2bxy + cy 2 + 2dx + 2ey + f = 0 ,
où a, b, c, d, e, f sont 6 réels quelconques, avec (a, b, c) 6= (0, 0, 0).

!
a b
En introduisant comme précédemment la matrice A = et les matrices co-
b c
! !
d x
lonnes B = et X = , l’équation de Γ dans le repère R s’écrit
e y
XAX + 2 tBX + f = 0 .
t
La matrice A étant symétrique!réelle, il existe une matrice orthogonale P et une matrice

λ 0
diagonale réelle D = (où λ et µ sont les valeurs propres de A) telles que
0 µ
A = P DP −1 = P D tP , d’où D = tP AP . La matrice P est la matrice de passage de la
base (~i, ~j) à une base orthonormée (~i0 , ~j 0 ), où les vecteurs ~i0 et ~j 0 ont pour composantes
dans la base (~i, ~j) les vecteurs colonnes de la matrice P . Notons (x0 , y 0 ) les coordonnées
dans le repère! R0 = (O,~i0 , ~j 0 ) du point de coordonnées (x, y) dans le repère (O,~i, ~j) et
0
x
X 0 = 0 . L’équation de Γ dans le repère R0 s’écrit donc
y
t t
X 0 DX 0 + 2 B 0 X 0 + f = 0 ,
soit encore
λx02 + µy 02 + 2d0 x0 + 2e0 y 0 + f = 0 ,
!
d0
où B = 0 = tP B. Les matrices A et D étant semblables, on a
0
e
ac − b2 = det(A) = det(D) = λµ .
18
Premier cas : ac − b2 > 0.

Dans ce cas, λ et µ sont de même signe ; on peut donc, quitte à multiplier l’équation
par -1, les supposer tous deux positifs et poser λ = α2 , µ = β 2 pour des réels positifs
α et β. L’équation de Γ dans le repère R0 s’écrit alors
!2 !2
d0 e0
α 2
x + 2
0
+β 2
y + 2
0
+ f0 = 0 ,
α β
d02 e02
où f 0 = f − − 2.
α2 β
d0 e0
!
Soit O le point de coordonnées − 2 , − 2 dans le repère R0 , R00 le repère
0
α β
(O , i , j ) et (x , y ) les coordonnées dans R d’un point de coordonnées (x0 , y 0 ) dans
0 ~0 ~ 0 00 00 00
d0 e0
R0 , de sorte que x00 = x0 + 2 , y 0 = y 00 + 2 . L’équation de Γ dans R00 s’écrit donc
α β
α2 x002 + β 2 y 002 + f 0 = 0 .
Trois cas se présentent :

– si f 0 > 0, Γ est vide ;
– si f 0 = 0, Γ est réduite au point O0 ; √ √ 0
−f 0 0 −f
– si f < 0, l’équation de Γ s’écrit, en posant a =
0 0
,b = , sous la forme
α β
x002 y 002
+ 02 = 1 .
a02 b
On reconnaît :
– si a0 > b0 , une ellipse de grand axe l’axe O0 x00 ;
– si b0 > a0 , une ellipse de grand axe l’axe O0 y 00 ;
– si a0 = b0 , un cercle de centre O0 .
On dit, dans tous ces cas, que Γ est du genre ellipse.
Deuxième cas : ac − b2 < 0.
Les deux réels λ et µ sont de signes contraires ; on peut donc, quitte à multiplier
l’équation par -1, supposer λ > 0 et µ < 0 et poser λ = α2 , µ = −β 2 pour des réels
positifs α et β. L’équation de Γ dans le repère R0 s’écrit alors
!2 !2
d0 e0
α2 x0 + 2 − β2 y0 − 2 + f0 = 0 ,
α β
d02 e02
où f 0 = f − + 2.
α2 β
19
d0 e0
!
Soit O0 le point de coordonnées − 2 , 2 dans le repère R0 , R00 le repère (O0 ,~i0 , ~j 0 )
α β
et (x00 , y 00 ) les coordonnées dans R00 d’un point de coordonnées (x0 , y 0 ) dans R0 , de sorte
d0 00 e0
que x = x + 2 , y = y − 2 . L’équation de Γ dans R00 s’écrit donc
00 0 0
α β
α2 x002 − β 2 y 002 + f 0 = 0 .
Trois cas se présentent :
– si f 0 = 0 l’équation s’écrit sous la forme α2 x002 − β 2 y 002 = 0, soit encore (αx00 −
βy 00 )(αx00 + βy 00 ) = 0 : Γ est donc réunion des deux droites sécantes en O0 d’équa-
tions αx00 − βy 00 = 0 et αx00 + βy 00 = 0 ; √ 0 √ 0
−f 0 −f
– si f < 0 , l’équation de Γ s’écrit, en posant a =
0 0
,b = , sous la forme
α β
x002 y 002
− 02 = 1 ;
a02 b
Γ est donc une hyperbole d’axe focal O0 x00 ; √ 0 √
f0 0 f
– si f > 0 , l’équation de Γ s’écrit, en posant a =
0
,b =
0
, sous la forme
α β
x002 y 002
− 02 + 02 = 1 ;
a b
Γ est donc une hyperbole d’axe focal O0 y 00 .
On dit, dans tous ces cas, que Γ est du genre hyperbole.
Troisième cas : ac − b2 = 0.
On a alors λµ = 0, mais un seul des deux nombres λ et µ est nul, sinon la matrice
A serait nulle et l’équation de Γ ne serait plus du second degré. On peut donc supposer
λ = 0, µ 6= 0. L’équation de Γ dans le repère R0 s’écrit µy 02 + 2d0 x0 + 2e0 y 0 + f = 0, soit
encore !2
e0
y +
0
+ 2d00 x0 + f 0 = 0
µ
d0 0 f e02
en posant d00 = , f = − 2.
µ µ µ
Quatre cas se présentent :
– si d00 = 0 et f 0 > 0, Γ est vide ; !2
e0
– si d00 = 0 et f 0 = 0, l’équation de Γ s’écrit y 0 + = 0 ; Γ est donc une droite
µ
double ;
e0
– si d00 = 0 et f 0 < 0, Γ est réunion des deux droites parallèles d’équations y 0 + =
√ µ
± −f 0 ;
20
f0 e0
!
– si d00 6= 0, soit O0 le point de coordonnées − 00 , − dans le repère R0 , R00 le
2d µ
repère (O0 ,~i0 , ~j 0 ) et (x00 , y 00 ) les coordonnées dans R00 d’un point de coordonnées
f0 e0
(x0 , y 0 ) dans R0 , de sorte que x00 = x0 + 00 , y 00 = y 0 + ; l’équation de Γ dans
2d µ
R00 s’écrit y 002 + 2d00 x00 = 0 ; Γ est donc une parabole d’axe focal O0 x00 .
On dit, dans tous ces cas, que Γ est du genre parabole.
En résumé, on voit que toute courbe admettant une équation polynomiale du second
degré est soit une conique ou un cercle, soit vide ou réduite à un point, soit réunion
de deux droites, éventuellement confondues. Dans ce dernier cas, l’équation de Γ se
décompose en produit de deux équations du premier degré : on dit que la conique est
dégénérée.
ac − b2 Genre Nature
- Ellipse
- Cercle
>0 Ellipse
- Point
- Ensemble vide
- Hyperbole
<0 Hyperbole
- Deux droites sécantes
- Parabole
- Deux droites parallèles
=0 Parabole
- Une droite double
- Ensemble vide
Table 2 – Réduction des équations
Recherche d’un centre

En pratique, il est souvent intéressant de commencer par chercher si la conique
possède un centre de symétrie et de déterminer, s’il existe, ce centre. Un point O0 , de
coordonnées (x0 , y0 ) dans R, est centre de symétrie de Γ si et seulement si l’équation
de Γ dans le repère R0 = (O0 ,~i, ~j) ne comporte pas de termes du premier degré. Les
coordonnées (x0 , y 0 ) dans R0 du point M de coordonnées (x, y) dans R sont données
par x = x0 + x0 , y = y 0 + y0 . L’équation de Γ dans R0 s’écrit donc :
a(x0 + x0 )2 + 2b(x0 + x0 )(y 0 + y0 ) + c(y 0 + y0 )2 + 2d(x0 + x0 ) + 2e(y 0 + y0 ) + f = 0 .
Cette équation ne comporte pas de termes du premier degré si et seulement si :

ax + by0 + d = 0
0
bx0 + cy0 + e = 0 .
21
Ces équations (qui s’obtiennent en annulant les deux dérivées partielles par rapport à
x et à y de l’équation de Γ) sont en général celles de deux droites. Trois cas sont alors
possibles :
1. si b2 − ac 6= 0, ces droites sont sécantes, et Γ admet, si elle n’est pas vide, un
centre de symétrie et un seul ;
2. si ces droites sont parallèles et distinctes, Γ n’admet pas de centre de symétrie ;
3. si ces droites sont confondues, tout point de cette droite est centre de symétrie
pour Γ.
Dans le cas 1, Γ est appelée conique à centre. Dans les cas 2 et 3, Γ est du genre
parabole ; une parabole n’admet pas de centre de symétrie, mais une droite double ou
la réunion de deux droites parallèles admettent une droite de centres de symétrie.
Cette situation se retrouve dans le cas particulier où l’une de ces deux équations
n’est pas celle d’une droite :
– si a = b = 0 et d 6= 0 (ou b = c = 0 et e 6= 0), il n’y a pas de centre de symétrie ;
– si a = b = d = 0 (ou b = c = e = 0), on trouve une droite de centres de symétrie.
22
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit P une parabole de foyer F et de directrice D, M un point quelconque
de P , H son projeté orthogonal sur D. Parmi les affirmations suivantes, lesquelles sont
vraies, lesquelles sont fausses, et pourquoi ?
1. La tangente en M à P est la médiatrice de [HF ].
2. La normale à P en M passe par F .
3. Le milieu du segment [HF ] appartient à la tangente au sommet de P .
4. La normale en M à P est parallèle à la droite (HF ).
5. Toute droite perpendiculaire à D rencontre P en un point et un seul.
6. Le symétrique de M par rapport à (HF ) appartient à la tangente au sommet
de P .
7. Le symétrique de F par rapport à toute tangente à P appartient à D.
1. Par 4 points du plan tels que 3 d’entre eux ne soient jamais alignés, il passe
une ellipse et une seule.
2. Il passe par les sommets de tout rectangle non aplati une ellipse et une seule.
3. Soient F et F 0 deux points distincts. Par tout point du plan n’appartenant pas
au segment [F F 0 ], il passe une ellipse de foyers F et F 0 et une seule.
4. Soit E une ellipse. Pour toute droite du plan, il existe une tangente à E
parallèle à cette droite.
5. Soit, dans le plan rapporté à un repère orthonormé, E l’ellipse de représentation
paramétrique x = a cos t, y = b sin t. Le paramètre t d’un point M de E est une
−−→
mesure de l’angle (Ox, OM ).
6. Le disque fermé délimité par le cercle principal d’une ellipse est l’unique disque
de rayon minimal contenant l’ellipse.
7. Le projeté orthogonal d’un cercle de l’espace sur un plan est un cercle si et
seulement si le plan du cercle est parallèle au plan de projection.
1. Pour toute hyperbole, il existe un repère orthonormé dans lequel l’hyperbole
x2 y 2
a une équation de la forme 2 − 2 = 1.
a b
2. Pour toute hyperbole, il existe un repère orthonormé dans lequel l’hyperbole
a une équation de la forme xy = k.
23
3. Le segment joignant les foyers d’une hyperbole ne rencontre pas l’hyperbole.

4. Le plan est rapporté à un repère orthonormé. Soient a, b, c, d des réels tels que
ax + b
ad − bc 6= 0. La courbe d’équation y = est une hyperbole équilatère.
cx + d
5. Pour toute hyperbole, il existe un repère (O,~i, ~j) normé (k~ik = k~jk = 1) et un
réel k non nul tels que l’équation de l’hyperbole dans ce repère soit xy = k.
6. Pour toute hyperbole, il existe un repère (O,~i, ~j) normé (k~ik = k~jk = 1) tel
que l’équation de l’hyperbole dans ce repère soit xy = 1.
7. Soit, dans le plan rapporté à un repère orthonormé, H l’hyperbole d’équation
x2 y 2
− 2 = 1. La demi-distance focale c de H vérifie a2 = b2 + c2 .
a2 b
x2 y 2
8. Le plan est rapporté à un repère orthonormé. L’équation 2 − 2 = 1 est celle
a b
d ’une hyperbole d’axe focal Ox si et seulement si a > b.
9. Soit H une hyperbole. Pour toute droite du plan, il existe une tangente à H
parallèle à cette droite.
10. Soit H une hyperbole. Pour toute droite du plan non parallèle à l’une des
asymptotes de H, il existe une tangente à H parallèle à cette droite.
1. L’image d’une hyperbole par une homothétie est une hyperbole de même ex-
centricité.
2. L’image d’une ellipse par une affinité orthogonale est toujours un cercle.
3. L’image d’une ellipse par une affinité orthogonale est une ellipse de même
excentricité.
4. L’image d’une conique par une affinité orthogonale est toujours une conique.
5. Le cercle est la seule conique à posséder plus de deux axes de symétrie ortho-
gonale.
6. Une conique non dégénérée ne peut posséder deux centres de symétrie.
7. L’image d’une parabole par une symétrie centrale est une parabole.
1. Si deux ellipses ont les mêmes foyers, l’une des deux est incluse dans l’intérieur
de l’autre.
2. Si une ellipse et une hyperbole ont les mêmes foyers, elles ne se coupent pas.
3. Deux ellipses distinctes se coupent en au plus deux points.
24
4. Si deux ellipses distinctes ont en commun un foyer et la directrice associée,

elles ne se coupent pas.
5. Si deux ellipses ont les mêmes foyers, elles ont le même centre.
6. Si deux ellipses ont en commun un foyer et la directrice associée, elles ont
même centre.
7. Si une ellipse et une hyperbole ont en commun un foyer et la directrice associée,
elles ne se coupent pas.
8. Si une droite coupe une ellipse en exactement un point, elle est tangente à
l’ellipse en ce point.
9. Une droite coupe une hyperbole en au plus deux points.
10. Si une droite coupe une hyperbole en un point exactement, elle est tangente à
l’hyperbole en ce point.
Vrai-Faux 6. Soit, dans le plan rapporté à un repère orthonormal, Γ une conique non
vide et non dégénérée d’équation ax2 + 2bxy + cy 2 + 2dx + 2ey + f = 0. Parmi les
1. Si a = 0, Γ est une parabole.
2. Si Γ est une ellipse, alors ac − b2 > 0.
3. Si a = c, alors Γ est un cercle.
4. Si ac − b2 < 0, alors Γ est une hyperbole.
5. Si b = c = 0, alors Γ est une parabole.
6. Si Γ est une parabole, alors a = b = 0 ou b = c = 0.
7. Si a = c = 0, alors Γ est une hyperbole.
8. Si Γ est une ellipse, alors a et c sont de même signe.
9. Si ac − b2 6= 0, alors Γ est une conique à centre.
Vrai-Faux 7. Le plan est rapporté à un repère orthonormal. Parmi les affirmations

1. La conique d’équation 4x2 + 4xy + y 2 − 4x − 2y + 4 = 0 est une droite double.
2. La conique d’équation 3x2 − 7xy + 2y 2 − 5x − 2 = 0 est réunion de deux droites
sécantes.
3. La conique d’équation 4x2 + 4xy + y 2 − 4x − 2y + 1 = 0 est vide.
4. La conique d’équation x2 − 4xy + 4y 2 + 4x − 8y + 3 = 0 est réunion de deux
droites parallèles.
5. La conique d’équation x2 + y 2 − 2x + 6y + 10 = 0 est vide.
6. La conique d’équation 4x2 + 4xy + y 2 − 4x − 2y + 1 = 0 est une droite double.
7. La conique d’équation 3x2 − 7xy + 2y 2 − 5x − 1 = 0 est réunion de deux droites.
25
2.2 Exercices
Exercice 1. Le plan est rapporté à un repère orthonormé. Écrire l’équation de la pa-
rabole P de foyer F (−1, 2) et de directrice D d’équation 3x − 2y + 2 = 0.
Exercice 2. Le plan est rapporté à un repère orthonormé. Écrire l’équation de l’ellipse

√
E de foyer F (2, 1), de directrice D d’équation x−2y −2 = 0 et d’excentricité e = 1/ 2.
Exercice 3. Le plan est rapporté à un repère orthonormé. Écrire l’équation de l’ellipse

E de foyers F (1, 0) et F 0 (−1, 2) et de demi-grand axe de longueur 3.
Exercice 4. Déterminer l’ensemble des centres des cercles passant par un point fixe F
et tangents à un cercle fixe C (on discutera selon la position de F par rapport à C).
Exercice 5. Montrer que deux coniques sont semblables si et seulement si elles ont la
même excentricité.
Exercice 6. Montrer que deux paraboles sont isométriques si et seulement si elles ont
le même paramètre.
Exercice 7. Intersection d’une parabole et d’une droite

1. Montrer que toute parallèle à l’axe d’une parabole coupe celle-ci en exactement
un point.
2. Montrer que toute droite non parallèle à l’axe d’une parabole coupe celle-ci en
0, 1 ou 2 points. Montrer qu’elle coupe la parabole en exactement un point si et
seulement si elle est tangente à la parabole.
Exercice 8. Intersection d’une ellipse et d’une droite

1. Montrer qu’une droite d’équation αx + βy + γ = 0 rencontre l’ellipse d’équation
x2 y 2
+ 2 = 1 en :
a2 b
– 0 point si a2 α2 + b2 β 2 < γ 2 ;
– 1 point si a2 α2 + b2 β 2 = γ 2 ;
– 2 points si a2 α2 + b2 β 2 > γ 2 .
2. Montrer qu’une droite rencontre une ellipse en exactement un point si et seule-
ment si elle est tangente à l’ellipse.
Exercice 9. Soit M un point d’une parabole, m son projeté orthogonal sur l’axe, N
le point d’intersection de l’axe et de la normale en M à la parabole. Montrer que la
longueur mN (appelée sous-normale en M ) ne dépend pas du point M . Exprimer cette
longueur en fonction du paramètre de la parabole.
26
Exercice 10. Le plan est rapporté à un repère orthonormal. Soient 0 < b < a deux
réels. Montrer que la famille des courbes Γλ d’équation
x2 y2
+ =1
a2 + λ b 2 + λ
où λ est un paramètre réel > −a2 et différent de −b2 , est exactement la famille des
coniques de foyers F et F 0 , où F et F 0 sont deux points du plan dont on précisera les
coordonnées en fonction de a et b.
Exercice 11. Soit H une hyperbole de demi-distance focale c. Montrer qu’il existe un
repère normé porté par les asymptotes de H tel que l’équation de H dans ce repère
soit 4 XY = c2 .
Exercice 12. Le plan
affine euclidien estrapporté
à un repère orthonormal. Soient T de
1 1 1

coordonnées t, , U de coordonnées u, , V de coordonnées v, trois points
t u v
distincts de l’hyperbole équilatère H d’équation xy = 1.
1. Écrire l’équation de la perpendiculaire ∆ à la droite (U V ) passant par T .
2. Déterminer les coordonnées du second point d’intersection de ∆ avec H.
3. Montrer que ce point appartient aux deux autres hauteurs du triangle T U V .
4. En déduire que l’orthocentre de tout triangle dont les sommets appartiennent à
une hyperbole équilatère appartient à cette même hyperbole.
Exercice 13. Soit, dans le plan rapporté à un repère orthonormal, E l’ellipse d’équation
x2 y 2
+ 2 = 1.
a2 b
1. Montrer qu’une droite est tangente à E si et seulement si elle coupe E en un
point et un seul.
2. Soit M0 un point de coordonnées (x0 , y0 ) et m un réel. Donner une condition
nécessaire et suffisante pour que la droite de pente m passant par M0 soit tangente
à E.
27
3. Déterminer en fonction de (x0 , y0 ) le nombre de tangentes à E passant par M0 .

4. Montrer que deux droites de pentes respectives m1 et m2 sont perpendiculaires
si et seulement si m1 m2 = −1.
5. Montrer que l’ensemble des points du plan d’où l’on peut mener deux tangentes
à E perpendiculaires entre elles est un cercle de centre le centre de E dont on
précisera le rayon.
Exercice 14. Une propriété des tangentes aux coniques

Soit Γ une conique de foyer F , de directrice D et d’excentricité e, M un point de
Γ, H son projeté orthogonal sur D. On suppose que la tangente à Γ en M coupe la
directrice D en un point T .
−−→ −−→ −−→ −−→
1. Montrer que F M · M T + e2 M H · M T = 0 (on pourra dériver la relation F M 2 −
e2 M H 2 = 0).
2. En déduire que les droites (F M ) et (F T ) sont orthogonales (on pourra calculer
−−→ −→
le produit scalaire F M · F T ).
Exercice 15. Soit E une ellipse de foyers F et F 0 . Déterminer le lieu des images de F
par :
1. les symétries orthogonales par rapport aux tangentes à E ;
2. les projections orthogonales sur les tangentes à E.
Exercice 16. Montrer que toute tangente à une hyperbole coupe les asymptotes de
cette hyperbole en deux points distincts R et S et que l’aire du triangle ORS, où O
est le centre de l’hyperbole, ne dépend pas de la tangente considérée.
Exercice 17. Diamètres conjugués d’une hyperbole

Soit H une hyperbole, O son centre et D une droite passant par O et distincte des
asymptotes de H.
28
1. Montrer que les milieux des cordes de H parallèles à D appartiennent tous à une
même droite D0 passant par O.
2. Montrer que les milieux des cordes de H parallèles à D0 appartiennent tous à D.
Exercice 18. Soit, dans le plan rapporté à un repère orthonormé (O,~i, ~j), H l’hyper-
bole équilatère d’équation xy = 1, A0 un point de H de coordonnées (x0 , y0 ) et Ω le
symétrique de A0 par rapport à O. Le cercle de centre Ω passant par A0 recoupe en
général H en trois points A1 , A2 , A3 .
1. Écrire une équation polynomiale de degré 3 vérifiée par les abscisses x1 , x2 , x3
des points A1 , A2 , A3 .
2. En déduire, en utilisant les relations entre les coefficients et les racines d’un
polynôme, que Ω est l’isobarycentre du triangle A1 A2 A3 .
3. Soit T un triangle. On suppose que l’isobarycentre de T est aussi le centre du
cercle circonscrit à T . Montrer que T est équilatéral.
4. Que peut-on dire du triangle A1 A2 A3 ?
Exercice 19. Théorème d’Apollonius pour l’ellipse
Soit, dans le plan rapporté à un repère orthonormal (O,~i, ~j), E l’ellipse de repré-
sentation paramétrique x = a cos t, y = b sin t.
1. Soit M1 et M2 deux points de E de paramètres respectifs t1 et t2 , M10 et M20 leurs
symétriques par rapport à O. Donner une condition nécessaire et suffisante sur
t1 et t2 pour que les diamètres [M1 M10 ] et [M2 M20 ] de E soient conjugués.
2. Montrer que l’aire du parallélogramme construit sur deux demi-diamètres conju-
gués [OM1 ] et [OM2 ] de E est constante.
3. Montrer que la somme OM12 + OM22 des carrés des longueurs de deux demi-
diamètres conjugués [OM1 ] et [OM2 ] de E est constante.
Exercice 20. Montrer que l’image d’une ellipse ou d’un cercle par une application affine
bijective est une ellipse ou un cercle.
Exercice 21. Ellipse de Steiner d’un triangle
29
Soit ABC un triangle non aplati et G son centre de gravité. Montrer qu’il existe une
ellipse tangente aux trois côtés de ce triangle en leurs milieux et passant par les milieux
des segments [GA], [GB] et [GC]. (Indication : on se ramènera par une transformation
affine au cas où le triangle est équilatéral.)
Exercice 22. Soient (a, b, c) et (a0 , b0 , c0 ) deux triplets de réels tels que ab0 − ba0 6= 0 et
k un réel non nul. Montrer que la courbe d’équation (ax + by + c)(a0 x + b0 y + c0 ) = k
est une hyperbole dont on précisera le centre et les asymptotes.
Exercice 23. Le plan est rapporté à un repère orthonormé. Montrer que la courbe
d’équation x2 −2xy + y 2 +2x −3y +3 = 0 est une parabole. Déterminer les coordonnées
de son foyer et l’équation de sa directrice.
Exercice 24. Soit, dans le plan rapporté à un repère orthonormé, Γ la conique d’équa-
tion 5x2 + 8y 2 + 4xy + 16x − 8y = 16. Réduire l’équation de Γ. On donnera les coor-
données du centre, les équations des axes, les longueurs du grand axe et du petit axe,
les coordonnées des foyers.
Exercice 25. Soient D1 et D2 deux droites sécantes en un point O, A un point de D1
différent de O, B un point de D2 différent de O. On cherche le lieu des centres des
coniques tangentes en A à D1 et en B à D2 .
−→ −−→
1. On rapporte le plan au repère (O, OA, OB). Donner des conditions nécessaires et
suffisantes sur les coefficients a, b, c, d, e, f pour qu’une conique à centre d’équation
ax2 + 2bxy + cy 2 + 2dx + 2ey + f = 0 soit tangente en A à D1 et en B à D2 .
2. En déduire que le centre d’une telle conique appartient à une droite fixe passant
par O. Interpréter cette droite dans le triangle OAB.
3. Reprendre le problème dans le cas où les deux droites D1 et D2 sont parallèles,
A étant un point quelconque de D1 et B un point quelconque de D2 .
Exercice 26. Montrer que toute courbe de représentation paramétrique
x = a cos t + b sin t
(
(t ∈ [0, 2π[)
y = c cos t + d sin t
où a, b, c, d sont des réels, est une ellipse, un cercle ou un segment de droite de centre
l’origine (on pourra, dans le cas où la courbe n’est pas portée par une droite, en écrire
une équation cartésienne). Donner une condition nécessaire et suffisante pour que cette
courbe soit un cercle (resp. un segment de droite).
Exercice 27. Soit, dans le plan rapporté à un repère orthonormé, Γ une conique d’équa-
tion ax2 + 2bxy + cy 2 + 2dx + 2ey + f = 0 et M0 , de coordonnées (x0 , y0 ), un point de
Γ. Montrer que l’équation de la tangente en M0 à Γ s’écrit
ax0 x + b(y0 x + x0 y) + cy0 y + d(x0 + x) + e(y0 + y) + f = 0 .
30
2.3 QCM
rapporte 2 points.
Question 1. Soit, dans le plan rapporté à un repère orthonormal (O,~i, ~j), P la parabole
d’équation y = x2 .
A L’axe Ox est axe de symétrie de P.
1

B Le foyer de P a pour coordonnées 0, .
2
1
C La directrice de P a pour équation y = − .
4
1
D La directrice de P a pour équation x = − .
4
1

E Le foyer de P a pour coordonnées 0, .
4
Question 2. Soit, dans le plan rapporté à un repère orthonormé, E l’ellipse d’équation
x2 + 2y 2 = 2.
A Le demi-grand axe de E a pour longueur 1.
√
B Le demi-grand axe de E a pour longueur 2.
π
C L’aire intérieure à E est égale à .
2
D Les foyers de E ont comme coordonnées (±1, 0).
1
E La droite d’équation x = √ est une directrice de E.
2
Question 3. Soit, dans le plan rapporté à un repère orthonormal (O,~i, ~j), H l’hyperbole
d’équation xy = 1, F et F 0 ses foyers.
A Les axes de symétrie de H sont les droites d’équations y = x et y = −x.
B Les axes Ox et Oy sont axes de symétrie de H.
C La distance focale F F 0 est égale à 4.
D L’excentricité de H est égale à 2.
1 1 1 1

E Les foyers de H ont pour coordonnées , et − , − .
2 2 2 2
Question 4. Soit E l’ellipse de représentation paramétrique x = a cos t, y = b sin t
dans un repère orthonormé (O,~i, ~j), avec 0 < b < a.
A L’aire délimitée par E est égale à πab.
−→ −−→
B Le paramètre t d’un point M est une mesure de l’angle (Ox, OM ).
C Les foyers de E ont pour coordonnées (−b, 0) et (b, 0).
D E est l’image du cercle de centre O et de rayon a par l’affinité orthogonale
d’axe Oy et de rapport b/a.
31
E La valeur minimale de la longueur OM quand M parcourt E est égale à b.
Question 5. A Une ellipse est entièrement déterminée par son centre et ses deux
foyers.
B Une ellipse est entièrement déterminée par ses deux foyers et un sommet de son
grand axe.
C Si deux ellipses ont la même excentricité, il existe une isométrie transformant
la première en la seconde.
D Une ellipse est entièrement déterminée par ses deux foyers et un de ses points.
E L’excentricité d’une ellipse est égale au rapport des longueurs de ses deux axes.
Question 6. Le plan est rapporté à un repère orthonormé d’origine O. Les courbes
d’équations suivantes sont des coniques de foyer O :
A ρ = cos θ ;
1
B ρ= ;
1 + cos θ
1
C ρ= ;
cos θ
D ρ(1 − 2 sin θ) = 2 ;
E 2ρ sin θ = 1.
Question 7. Le plan est rapporté à un repère orthonormé.
A La courbe d’équation (x − 1)(y − 2) = 1 est une hyperbole.
B La courbe d’équation x2 + y 2 + xy = 1 est un cercle.
C La courbe d’équation (x + 1)(y − 3) = 0 est une hyperbole.
D La courbe d’équation (x + 1)2 − y = 0 est une parabole.
E La courbe d’équation y(2x + 3) − (x + 2) = 0 est une ellipse.
Question 8. Le plan est rapporté à un repère orthonormé. Les courbes d’équations
suivantes sont des ellipses :
A x2 + 2y 2 − 2x + 4y + 5 = 0.
B x2 + 4xy + y 2 − 2x + 4y = 0.
C x2 − 2xy + 2y 2 + 2x + 6y = 0.
D 4x2 − 2xy + 4y 2 − 1 = 0.
E x2 + 2xy + y 2 + 2x + 2y − 5 = 0.
suivantes sont des hyperboles :
A xy + 3x − y − 5 = 0.
B xy + 3x + 2y + 6 = 0.
C 3x2 − 2xy − y 2 + x + 3y − 3 = 0.
D 3x2 − 4xy + 2y 2 − 5x + y − 8 = 0.
E 2x2 − 5xy − 3y 2 + 5x − y + 2 = 0.
32
suivantes sont des paraboles :
A 9x2 − 12xy + 4y 2 − 3x + 2y − 2 = 0.
B x2 + 2xy + y 2 − 4x + 8y + 10 = 0.
C x2 + 4xy + 4y 2 − 4x + 2y − 1 = 0.
D 9x2 − 42xy + 49y 2 + 12x − 28y + 4 = 0.
E x2 − 6xy + y 2 − 3x + 2y − 4 = 0.
Réponses : 1–CE 2–BD 3–AC 4–AE 5–BD 6–BD 7–AD 8–CD 9–AC 10–BC
2.4 Devoir
répondu.
1. Donner la définition par foyer, directrice et excentricité d’une conique.
2. Rappeler quelles sont les coniques admettant deux foyers. Donner, pour ces co-
niques, une définition faisant intervenir les deux foyers.
3. Rappeler la définition d’une hyperbole équilatère. Donner une condition nécessaire
x2 y 2
et suffisante sur les réels positifs a et b pour que l’hyperbole d’équation 2 − 2 = 1
a b
dans un repère orthonormé soit équilatère.
4. Le plan est rapporté à un repère orthonormé. Donner une condition nécessaire et
suffisante sur les réels a, b, c, d, e pour que l’équation ax2 +2bxy+cy 2 +2dx+2ey =
0 soit celle d’un cercle.
5. Le plan est rapporté à un repère orthonormé. Donner la nature et une représen-
tation paramétrique de la conique d’équation x2 − y 2 = 1.
Exercice 1 : Soit p un réel positif et P la parabole d’équation y 2 = 2px dans le plan
rapporté à un repère orthonormé (O,~i, ~j).
1. Déterminer l’axe, le sommet, le foyer F et la directrice D de P .
t2
2. On considère la représentation paramétrique x = , y = t de P . Écrire l’équation
2p
de la tangente à P au point de paramètre t.
3. Soit M0 de coordonnées (x0 , y0 ) un point du plan. Écrire une équation vérifiée
par le paramètre t d’un point de P pour que la tangente à P en ce point passe
par M0 . Discuter selon la position de M0 le nombre de tangentes à P passant par
M0 .
33
4. Donner une condition nécessaire et suffisante sur M0 pour qu’il passe par M0
deux tangentes à P perpendiculaires entre elles.
5. Soit M un point de P , H son projeté orthogonal sur D. Montrer que tout point
de la tangente en M à P est équidistant de H et F .
6. En déduire une construction à la règle et au compas des tangentes à P menées
par un point M0 du plan (dans le cas où il existe de telles tangentes). Retrouver
ainsi les résultats de la question 3.
7. Déduire de la question précédente une nouvelle démonstration du résultat de la
question 4.
Exercice 2 : Le plan est rapporté à un repère orthonormal (O,~i, ~j).

1. Écrire l’équation de l’hyperbole√H de foyer F (3, 2), de directrice D d’équation
x − y + 1 = 0 et d’excentricité 2.
2. Écrire l’équation de H sous la forme (x − a)(y − b) = c pour des réels a, b, c. En
déduire les coordonnées du centre Ω de H.
3. Déterminer les axes, puis le second couple foyer-directrice (F 0 , D0 ) de H (on
donnera les coordonnées de F 0 et une équation de D0 ).
4. Montrer que la courbe E d’équation 3x2 + 3y 2 + 2xy − 14x − 26y + 27 = 0 est
une ellipse.
5. Montrer que Ω est le centre de E.
6. Déterminer les axes et l’équation réduite de E.
7. En déduire les longueurs des axes, la distance focale et l’excentricité de E.
8. Montrer que les coniques E et H ont les mêmes foyers.

1. La conique C de foyer F , de directrice D et d’excentricité e > 0, où F est un
point du plan n’appartenant pas à D, est l’ensemble des points du plan dont le
MF
rapport (où H est le projeté orthogonal de M sur D) des distances à F et
MH
à D est égal à e :
d(M, F )
( )
MF

C= M| =e = M | =e .
d(M, D) MH
2. Les coniques admettant deux couples foyer-directrice sont les ellipses et les hy-
perboles.
34
Une ellipse E de foyers F et F 0 est l’ensemble des points M du plan dont la somme
M F + M F 0 des distances à ses deux foyers est une constante 2a strictement
supérieure à la distance focale F F 0 :
E = {M | M F + M F 0 = 2a} avec 2a > F F 0 .
Une hyperbole H de foyers F et F 0 est l’ensemble des points M du plan dont la

différence M F − M F 0 des distances à ses deux foyers est égale en valeur absolue
à une constante 2a strictement inférieure à la distance focale F F 0 :
H = {M | | M F − M F 0 | = 2a} avec 2a < F F 0 .
3. Une hyperbole est dite équilatère si ses asymptotes sont perpendiculaires. Une
condition nécessaire et suffisante
√ pour qu’une hyperbole soit équilatère est que
son excentricité soit égale à 2.
x2 y 2
L’hyperbole d’équation 2 − 2 = 1 admet comme asymptotes les droites d’équa-
a b
x y
tions = ± . Si le repère est orthonormé, elle est équilatère si et seulement si
a b
a = b.
4. L’équation ax2 + 2bxy + cy 2 + 2dx + 2ey = 0 en repère orthonormal est celle d’un
cercle si et seulement si a = c 6= 0 et b = 0. On remarque que l’ensemble des
points vérifiant cette équation n’est jamais vide puisqu’il contient l’origine (ce
cercle est réduit à un point si d = e = 0).
5. La courbe d’équation x2 − y 2 = 1 dans un repère orthonormal est une hyperbole
équilatère de centre l’origine, d’axe focal l’axe Ox et d’asymptotes les bissectrices
des axes.
Elle admet les représentations paramétriques
• x = ε ch t, y = sh t (t∈ R,ε ∈ {−1, +1}) ;
1 π π π 3π

• x= , y = tan t t∈ − , ∪ , ;
cos
t 2 2 2 2
1 1 1 1

• x= t+ , y= t− (t ∈ R∗ ).
2 t 2 t
Exercice 1 :
1. L’axe Ox est axe de symétrie pour P , puisque si le point (x, y) appartient à P ,
le point (x, −y) appartient aussi à P .
Il en résulte que le sommet de P est l’origine O du repère.
Le foyer F a donc comme coordonnées (c, 0) pour un réel c et la directrice D
comme équation x = −c. Un point M de coordonnées (x, y) appartient à P si
et seulement si M F = M H, où H est le projeté orthogonal de M sur D, i.e. le
point de coordonnées (−c, y), d’où l’équation de P : (x − c)2 + y 2 = (x + c)2 , soit
encore y 2 = 4cx. En identifiant cette équation à celle de P , on obtient c = p/2,
d’où les coordonnées de F (p/2, 0) et l’équation de D : x = −p/2.
35
2. Le vecteur dérivé (t/p, 1) du vecteur (t2 /2p, t) est un vecteur directeur de la

tangente à P au point de paramètre t. Une équation de cette tangente est donc :

t/p x − t2 /p
=0

1 y−t

ou encore
2ty − 2px − t2 = 0 .
3. La tangente à P au point de paramètre t passe par M0 si et seulement si
t2 − 2ty0 + 2px0 = 0 . (∗)
Cette équation du second degré en t admet des solutions réelles si et seulement

si son discriminant réduit ∆0 = y02 − 2px0 est positif ou nul. Si ∆0 = 0, le point
M0 appartient à P et l’unique solution de l’équation est t = y0 , ce qui traduit le
fait que cette droite est la tangente à P en M0 .
Si ∆0 > 0, le point M0 est situé à l’extérieur de la parabole P (en convenant
d’appeler intérieur de la parabole la partie convexe du plan délimitée par celle-ci
et extérieur son complémentaire) et il passe par M0 deux tangentes à P .
4. Pour qu’il passe par M0 deux tangentes à P perpendiculaires, il faut que ∆0 soit
strictement positif et que le produit des pentes des tangentes à P passant par
p2
M0 soit égal à 1, i.e. que = −1, où t1 et t2 sont les deux racines de (∗).
t1 t2
Or t1 t2 = 2px0 , d’où la condition x0 = −p/2. Si cette condition est vérifiée, on
a ∆0 > 0 et il passe donc bien par M0 deux tangentes à P . Il en résulte que
l’ensemble des points d’où l’on peut mener à P deux tangentes perpendiculaires
entre elles est la directrice D de P .
5. On sait que la tangente en M à P est la médiatrice du segment [F H] (proposition
4). Tout point de cette tangente est donc équidistant de F et H.
On pouvait aussi redémontrer ce résultat : le point F a pour coordonnées (p/2, 0)
et le point H (−p/2, t) ; il en résulte que la médiatrice de [F H] a pour équation
(x − p/2)2 + y 2 = (x + p/2)2 + (y − t)2
soit encore
2ty − 2px − t2 = 0
qui est l’équation de la tangente en M à P .
6. Si un point M0 du plan appartient à la tangente en M à P , le cercle de centre M0
et de rayon M0 F coupe D en H. Pour construire les tangentes à P passant par
M0 , il suffit donc de tracer le cercle de centre M0 et de rayon M0 F . Si ce cercle
ne coupe pas D, il ne passe pas par M0 de tangente à P (cette condition équivaut
à d(M0 , D) > M0 F et signifie que M0 est à l’intérieur de la parabole). S’il coupe
36
D en un unique point H, le point M0 appartient à P et la tangente à P en M0

est l’unique tangente à P passant par M0 . S’il coupe D en deux points distincts
H1 et H2 , on construit deux points M1 et M2 de P en prenant l’intersection de
la médiatrice de [F Hi ] avec la perpendiculaire à D en Hi , et les tangentes à P
en M1 et M2 sont les deux tangentes à P passant par M0 .
7. Les tangentes à P menées par M0 sont donc les médiatrices des segments [F H1 ]
et [F H2 ], où H1 et H2 sont les points d’intersection du cercle C de centre M0
passant par F avec D. Ces deux tangentes sont perpendiculaires si et seulement
si les droites (F H1 ) et (F H2 ) le sont, ce qui signifie que le point F appartient au
cercle de diamètre [H1 H2 ]. Mais ce cercle n’est autre que C, puisqu’il passe par
les trois points F , H1 et H2 . Son centre M0 est le milieu de [H1 H2 ] et appartient
donc à D. Réciproquement, si M0 appartient à D, il ressort immédiatement de la
construction précédente qu’il passe par M0 deux tangentes à P perpendiculaires
entre elles. La directrice est ce qu’on appelle la courbe orthoptique de la parabole
(ensemble des points d’où l’on voit la parabole sous un angle droit).
37
Exercice 2 :
1. Le point M de coordonnées (x, y) appartient à H si et seulement si M F 2 =
2d(M, D)2 , i.e.si et seulement si (x − 3)2 + (y − 2)2 = (x − y + 1)2 , ou encore
xy − 4x − y + 6 = 0.
2. Cette équation s’écrit encore (x − 1)(y − 4) = −2, soit, en posant X = x − 1,
Y = y − 4, XY = −2. Mais (X, Y ) sont les coordonnées du point M dans
le repère (Ω,~i, ~j), où Ω est le point de coordonnées (1, 4) dans le repère initial
(O,~i, ~j). L’équation de H dans ce nouveau repère est donc XY = −2, ce qui
montre que la symétrie centrale de centre Ω laisse H invariante. On en déduit
que Ω est le centre de l’hyperbole H.
3. Le foyer F 0 (resp. la directrice associée D0 ) est symétrique de F (resp. de D)
par rapport à Ω. La symétrie centrale de centre Ω est donnée par les formules
x0 = 2 − x, y 0 = 8 − y, où (x, y) sont les coordonnées d’un point et (x0 , y 0 ) celles de
son image. Il en résulte que F 0 a pour coordonnées dans le repère initial (−1, 6)
et D0 pour équation dans ce repère y − x − 5 = 0.
4. La courbe E d’équation 3x2 + 3y 2 + 2xy − 14x − 26y + 27 = 0 est une conique du
genre ellipse, puisque la forme quadratique (x, y) 7→ 3x2 + 3y 2 + 2xy est définie
positive. Cette courbe n’est pas vide, puisqu’elle possède par exemple deux points
d’abscisse 0, et ce n’est pas un cercle ; c’est donc une ellipse.
5. Les coordonnées du centre de E sont solution du système

6x + 2y − 14 = 0
2x + 6y − 26 = 0
obtenu en annulant les dérivées partielles de 3x2 + 3y 2 + 2xy − 14x − 26y + 27.
Ce système admet l’unique solution x = 1, y = 4.
6. En utilisant les formules de changement de repère x = X + 1, y = Y + 4, on voit
que E admet comme équation 3X 2 + 3Y 2!+ 2XY − 32 = 0 dans le repère (Ω,~i, ~j).
3 1
Des vecteurs propres de la matrice sont (1, 1) et (1, −1). Les coordonnées
1 3
(X, Y ) d’un point M dans le repère (Ω,~i, ~j) sont reliées aux!coordonnées (X 0 , Y 0 )
~i + ~j −~i + ~j
de ce point dans le repère orthonormal Ω, √ , √ déduit par rotation
2 2
de centre Ω et d’angle π/4 par
X0 − Y 0 X0 + Y 0
X= √ , Y = √ .
2 2
Il en résulte que E a comme équation 4X 02 + 2Y 02 − 32 = 0, soit encore
X 02 Y 02
+ =1
8 16
38
dans ce nouveau repère.

√
7. Le demi-grand axe de E vaut donc a = 4 et le demi-petit √ axe b = 2 2. La
demi-distance focale c est définie
√ par c = a − b , d’où c = 2 2. L’excentricité
2 2 2
de E est donnée par e = c/a = 2/2. Le grand axe de E est porté par la droite
d’équation x + y − 5 = 0 (axe ΩY 0 du nouveau repère) et le petit axe par la droite
d’équation x − y + 3 = 0 (axe ΩX 0 du nouveau repère) dans le repère (O,~i, ~j).
8. L’hyperbole H et l’ellipse E ont même centre, même axe focal, et même distance
focale. Il en résulte qu’elles ont les mêmes foyers.
39
3 Compléments
3.1 Sections planes des cônes et des cylindres de révolution
Les mathématiciens grecs étudiaient déjà les coniques, qu’ils définissaient comme
sections planes des cônes de révolution. On attribue à Apollonius de Perge (v. 262-
v. 190 av. J.-C.) l’introduction, dans son traité en huit volumes intitulé les Coniques, de
la terminologie ellipse, hyperbole, parabole, mais ces termes étaient peut-être utilisés
avant lui et beaucoup de propriétés de ces courbes étaient déjà connues. Ménechme
(v. 380-v. 320 av.J.-C.) s’en servait pour tenter de résoudre le problème de la duplication
du cube (voir le chapitre « Géométrie euclidienne »). En effet, si on veut introduire
entre deux nombres a et b deux réels x et y tels que a, x, y, b constitue une progression
x y x b
géométrique, on a = et = , de sorte que x2 = ay et xy = ab ; on est donc
a x a y
ramené à construire l’intersection d’une parabole et d’une hyperbole ; mais on peut aussi
y b
écrire = , ou encore x2 = ay et y 2 = bx, ce qui amène à construire l’intersection
x y
de deux paraboles. C’est à Pappus (290-350) qu’on attribue la définition des foyers et
directrices, mais là encore ces notions étaient peut-être déjà connues avant lui.
De fait, l’intersection d’un cône de révolution C par un plan P ne passant pas par
le sommet S de C est :
– un cercle si P est perpendiculaire à l’axe de C ;
– une ellipse si l’intersection de C et du plan parallèle à P passant par S est réduite
à S (sans que P soit perpendiculaire à l’axe de C) ;
– une parabole si le plan parallèle à P mené par S est tangent à C le long d’une
génératrice ;
– une hyperbole si l’intersection de C et du plan parallèle à P passant par S est la
réunion de deux génératrices de C.
L’intersection d’un cylindre de révolution avec un plan est :
40
– soit vide, soit constituée d’une ou deux génératrices si l’axe du cylindre est pa-
rallèle au plan ;
– un cercle si le plan est perpendiculaire à l’axe du cylindre ;
– une ellipse si le plan n’est ni parallèle ni perpendiculaire à l’axe du cylindre.
3.2 Les théorèmes belges

Alors que la définition et les propriétés des coniques étaient bien connues depuis
l’antiquité grecque, ce n’est qu’au XIXième siècle que le théorème de Dandelin (1822) (ou
de Dandelin-Quételet) 1 est venu caractériser les foyers et les directrices d’une conique
obtenue comme section plane d’un cône de révolution.
Théorème 1. La section d’un cône de révolution par un plan est une conique dont les
foyers sont les points de contact avec ce plan des deux sphères inscrites dans le cône
et tangentes à ce plan et les directrices les intersections avec ce plan des deux plans
contenant les cercles de contact de ces sphères avec le cône.
Dans le cas de l’ellipse, les deux sphères sont situées de part et d’autre du plan,
dans le cas de l’hyperbole du même côté du plan de section. Dans le cas de la parabole,
il n’y a qu’une sphère (et un couple foyer-directrice).
La figure ci-dessus représente le cas de l’ellipse : les deux sphères de centres O1 et

O2 inscrites dans le cône sont tangentes en T1 et T2 au plan de section ; ces points sont
les foyers de l’ellipse ; les directrices (représentées en vert) sont les intersections avec le
plan de section des deux plans contenant les cercles de contact des deux sphères avec
le cône.
1. Germinal Pierre Dandelin (1794-1847) et Adolphe Quételet (1796-1874) étaient deux mathéma-
ticiens belges, d’où le titre de cette section. Quételet est surtout connu pour ses travaux en statistique.
41
3.3 Lois de Kepler

Les astronomes grecs plaçaient la terre au centre de l’univers, les planètes et le soleil
tournant autour d’elle sur des cercles ou des sphères, seules figures à leurs yeux suffi-
samment parfaites pour accueillir le mouvement des astres. Ils ne tardèrent pourtant
pas à s’apercevoir que ce système ne parvenait pas à expliquer les observations qu’ils
effectuaient. Ils imaginèrent donc un système plus compliqué, de planètes tournant sur
des cercles (les épicycles) dont les centres tournaient eux-mêmes sur d’autres cercles
(les déférents) centrés en la terre, l’important étant de préserver l’idée de mouvements
circulaires uniformes et de la position centrale de la terre (géocentrisme).
Ce système connut son apogée au IIème siècle de notre ère avec le système de Ptolé-
mée, développé dans son traité l’Almageste, qui fit référence pendant plus de dix siècles,
jusqu’à ce que Nicolas Copernic (1473-1543) propose son système héliocentrique. Celui-
ci, perfectionné par Johannes Kepler (1571-1630), s’appuyant sur les observations de
l’astronome danois Tycho Brahe (1546-1601), puis par Galilée (1564-1642), mit cepen-
dant longtemps à s’imposer face à l’opposition de l’Église et des partisans du géocen-
trisme.
Kepler énonça au début du XVIIième siècle les trois lois décrivant le mouvement des
planètes autour du soleil, lois qui portent aujourd’hui son nom.
Première loi (1609) : Les planètes du système solaire décrivent des trajectoires
elliptiques dont le Soleil occupe l’un des foyers.
Deuxième loi (loi des aires) : L’aire balayée par le segment joignant le soleil à une
planète entre deux instants est proportionnelle à la durée séparant ces deux instants.
Troisième loi (loi des périodes) : Le carré de la période de la rotation d’une
planète autour du soleil est directement proportionnel au cube du grand axe de l’ellipse
constituant la trajectoire de cette planète.
Ce fut finalement Isaac Newton (1643-1727) qui développa le modèle mathématique
permettant de déduire le mouvement elliptique des planètes autour du Soleil de sa
théorie de la gravitation universelle (1687).
3.4 Optique géométrique

D’après la loi de la réflexion de Descartes-Snell, quand un rayon lumineux se réfléchit
sur une surface, le rayon incident, le rayon réfléchi et la normale à la surface au point
d’incidence sont coplanaires, et l’angle de réflexion est égal à l’angle d’incidence. Il
résulte alors des propriétés des tangentes à la parabole (voir section 1.3) qu’un miroir
parabolique concentre tous les rayons lumineux parallèles à son axe en son foyer. Par
miroir parabolique, il faut entendre ici un miroir concave obtenu en faisant tourner une
parabole autour de son axe, i.e. un miroir obtenu en rendant réfléchissant l’intérieur
d’un paraboloïde de révolution. Si on oriente l’axe de ce paraboloïde vers le soleil, tous
les rayons solaires se concentreront au foyer de la parabole. C’est le principe des fours
42
Figure 1 – Le four solaire d’Odeillo

2
solaires (en fait, comme on ne peut orienter facilement l’axe de grands paraboloïdes vers
le soleil, les rayons lumineux sont d’abord redirigés vers le miroir parabolique principal
par des héliostats, miroirs secondaires orientables). Le grand four solaire d’Odeillo, dans
les Pyrénées-Orientales, possède un miroir parabolique d’une surface de 1830 mètres
carrés et permet d’atteindre en quelques secondes en son foyer une température de
3500°C.
Le procédé n’est pas entièrement nouveau. La légende raconte qu’Archimède aurait

mis le feu à la flotte romaine qui assiégeait la ville de Syracuse en utilisant des miroirs
paraboliques. Beaucoup pensent qu’il ne s’agit que d’une légende ; des élèves-ingénieurs
du MIT ont récemment tenté de refaire l’expérience et sont parvenus à mettre le feu à
un navire (immobile et bien sec) situé à une trentaine de mètres en utilisant des miroirs
achetés dans le commerce (vous pouvez lire ici le compte-rendu de leur expérience).
Ce même principe de concentration des rayons est utilisé dans les antennes para-
boliques (les « paraboles »), les radars et même les phares d’automobiles (l’ampoule
étant située au foyer, les rayons lumineux dirigés vers l’arrière se réfléchissent en un
faisceau parallèle).
2. Photo Björn Appel, Wikipedia
43
Figure 2 – Le télescope de Cassegrain

3
Figure 3 – Principe des télescopes de Newton et de Cassegrain
Il est également utilisé dans les télescopes. Un télescope réfléchit les rayons lumi-
neux et son miroir principal est un paraboloïde concave qui concentre ces rayons au
foyer. Comme l’observateur (humain ou récepteur photographique) ne peut se situer
en ce foyer, un miroir secondaire est utilisé. Dans le télescope de Newton, un mi-
roir secondaire plan détourne les rayons vers un oculaire latéral. Dans le télescope de
Schmidt-Cassegrain, un miroir secondaire hyperbolique convexe, dont un foyer coïn-
cide avec le foyer du miroir parabolique principal, concentre les rayons lumineux en
son second foyer (voir les propriétés des tangentes à l’hyperbole) ; l’oculaire est ainsi
situé dans l’axe du télescope.
3.5 L’hexagramme mystique

Le théorème de Pascal (dit aussi hexagramme mystique de Pascal) dit que si les
côtés opposés d’un hexagone inscrit dans une conique se coupent en des points I, J,
K, les trois points I, J, K sont alignés.
Théorème 2. Soient dans un plan A, B, C, A0 , B 0 , C 0 six points distincts tels que

trois d’entre eux ne soient jamais alignés et que les droites (BC 0 ) et (CB 0 ) (resp. (CA0 )
3. Image Szöcs Tamás, Wikipedia
44
et (AC 0 ), (AB 0 ) et (BA0 )) se coupent en un point I (resp. J, K). Alors les six points
A, B, C, A0 , B 0 , C 0 sont situés sur une même conique non dégénérée si et seulement
si les trois points I, J, K sont alignés.
Une conséquence en est que, par cinq points en position générale, il passe une
conique et une seule. Le théorème de Pascal donne précisément un moyen de construire
point par point cette conique : si A, B, C, A0 , B 0 sont les points donnés, pour construire
un point supplémentaire C 0 de la conique, il suffit de tracer une droite D passant par
A ; si les droites (AB 0 ) et (A0 B) se coupent en K, les droites (CA0 ) et D en J, et les
droites (CB 0 ) et (KJ) en I, le point d’intersection C 0 des droites D et (BI) appartient
à la conique (en supposant bien sûr ces droites sécantes).
Ce théorème a été énoncé par Blaise Pascal (1623-1662) dans son Essai pour les
coniques, composé avant qu’il ait atteint l’âge de dix-sept ans et publié à Paris en
février 1640. La démonstration originale de Pascal n’est pas connue dans sa totalité,
mais l’idée essentielle en est qu’il suffit de démontrer le théorème pour le cercle. En
effet, on peut passer du cercle à n’importe quelle conique par une transformation géo-
métrique simple qui préserve le concours des droites et l’alignement des points. Cette
idée, développée par Girard Desargues (1591-1661) dans son Brouillon Project d’une
Atteinte aux Evènemens des Rencontres du Cone avec un Plan, paru en 1639, permet
de considérer que, du point de vue de la géométrie projective (la partie de la géométrie
qui traite justement des propriétés de concours et d’alignement), toutes les coniques
sont équivalentes, et repose sur la remarque suivante : si on considère deux sections
planes d’un même cône de révolution, on peut établir une correspondance naturelle de
l’une sur l’autre en associant à tout point de la première le point de la seconde situé
sur la même génératrice du cône.
45
Dans le cas où trois des points donnés (et trois seulement) sont alignés, la conique
passant par les cinq points est dégénérée : il s’agit de la réunion des deux droites portant
les cinq points.
De fait, dans le cas où la conique dégénère en la réunion de deux droites, le théorème
de Pascal se réduit au théorème de Pappus :
Théorème 3. Soient dans un plan A, B, C trois points distincts alignés sur une
droite D et A0 , B 0 , C 0 trois points distincts alignés sur une droite D0 . On suppose que
les droites (BC 0 ) et (CB 0 ) (resp. (CA0 ) et (AC 0 ), (AB 0 ) et (BA0 )) se coupent en un
point I (resp. J, K). Alors les trois points I, J, K sont alignés.
3.6 Billards
Si on étudie la trajectoire d’un rayon lumineux issu de l’intérieur d’une ellipse et se
réfléchissant sur le bord suivant la loi de Descartes, le rayon réfléchi restera toujours
46
tangent à une ellipse ou une hyperbole ayant les mêmes foyers que l’ellipse de départ.
En optique, cette courbe s’appelle une caustique (du grec kaustikos : qui brûle).
On peut aussi voir cette figure comme la trajectoire d’une boule de billard rebon-
dissant sur le bord d’un billard elliptique.
On constate en particulier qu’il y a toujours une région du billard dans laquelle la
boule ne pénétrera jamais.
47
Université Joseph Fourier, Grenoble I
Mathématiques, Informatique et Mathématiques Appliquées
Licence Sciences et Technologies 2e année
Courbes et surfaces
Boris Thibert
Les courbes et les surfaces interviennent naturellement dans divers domaines. À titre
d’exemple, la modélisation de voitures dans un logiciel de CAO (Conception Assistée
par Ordinateur) comme CATIA se fait avec des surfaces. De même, la trajectoire d’un
objet, le tracé d’une route et bien d’autres exemples encore se modélisent par des
courbes. Dans ce cours, nous allons présenter quelques notions de base qui concernent
les courbes et les surfaces qui sont dites paramétrées. Une courbe paramétrée est une
application γ : I → R3 (avec I un intervalle de R) et une surface paramétrée est une
application g : U ⊂ R2 → R3 . Ainsi, pour étudier les courbes et surfaces paramétrées,
nous utiliserons des fonctions d’une et de deux variables. Aussi, une connaissance sur
les fonctions d’une et de deux variables réelles, sur les développements limités sera
utile, même si nous rappellerons certaines des notions utilisées.
Table des matières

1 Cours 2
1.1 Courbes paramétrées : généralités et étude métrique . . . . . . . . . . . 2
1.2 Allure locale des courbes planes . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Allure locale des courbes gauches . . . . . . . . . . . . . . . . . . . . . 14
1.4 Surfaces paramétrées . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2 Entraînement 26
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3 Compléments 45
3.1 Courbes de Bézier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.2 Theorema Egregium de Gauss . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Surfaces développables . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
Maths en L1̇gne Courbes et surfaces UJF Grenoble
1 Cours
Dans ce cours, on se place dans un espace affine qui est de dimension soit deux, soit
trois. Un point M dans un espace de dimension d ∈ {2, 3} sera repéré par ses coordon-
nées (u1 , ..., ud ) dans un repère orthonormé (O, →
−
e1 , ..., →
−
ed ). Cet espace est naturellement
d
identifié à R . Le produit scalaire de deux vecteurs u = (u1 , ..., ud ) et v = (v1 , ..., vd )
est donné par :
d
X
u.v = ui vi .
i=1
1.1 Courbes paramétrées : généralités et étude métrique

Intuitivement, une courbe dans l’espace de dimension d est un objet qui peut être
décrit par un point qui évolue au cours du temps. Autrement dit, il suffit d’un paramètre
pour le décrire, le temps. On dit d’un tel objet qu’il est 1-dimensionnel. Le fait de
décrire une courbe par un paramètre qui évolue revient à considérer une application
γ : I ⊂ R → Rd . Quand le paramètre t parcourt l’intervalle I, le point γ(t) parcourt
la courbe. Une telle application γ est une courbe paramétrée. On se concentre ici sur
l’étude des courbes paramétrées de R2 et de R3 .
Définition des courbes paramétrées
Définition 1. Soit d ∈ {2, 3}. On appelle courbe paramétrée de classe C k de Rd une

application de classe C k
γ : I ⊂ R → Rd ,
où I est un intervalle ouvert de R.
L’ensemble C = γ(I) = {γ(t), t ∈ I} est appelé le support géométrique de γ : I →

d
R . On dit que C est une courbe géométrique et que γ est une paramétrisation de C. On
peut remarquer que la courbe paramétrée comporte plus d’informations que la courbe
géométrique : quand t parcourt l’intervalle I, le point γ(t) parcourt C. Autrement dit, la
courbe paramétrée donne non seulement le support géométrique, mais aussi une façon
de le parcourir. Dans la suite, quand on considèrera la restriction d’une courbe γ à un
intervalle fermé [a, b] ⊂ I, on écrira γ : [a, b] → Rd . Si d = 2, on dit que la courbe est
plane.
Exemple : Le support géométrique de la courbe paramétrée γ : R → R3 donnée par
γ(t) = (R cos(t), R sin(t), t) est une hélice (Figure 2).
Prenons une route allant de Grenoble à Chamrousse et modélisons la par une courbe
géométrique C ! Prenons maintenant une voiture qui part de Grenoble à un instant
t = 0 et arrive à Chamrousse à un instant t = 45 minutes. Le trajet de cette voiture
est naturellement modélisé par la courbe paramétrée γ : [0, 45] → C ⊂ R3 qui à
2
Figure 1 – Courbe paramétrée
Figure 2 – Hélice
chaque instant t, donne la position γ(t) de la voiture. Prenons maintenant un vélo qui
va parcourir ce même trajet mais en mettant bien entendu un peu plus de temps, par
exemple 180 minutes. Cela nous définit une autre paramétrisation γe : [0, 180] → C ⊂ R3
qui est différente de γ, mais qui a exactement le même support géométrique C.
De même, pour prendre un exemple "plus mathématique", considérons √ la courbe
2
paramétrée γ : [0, 1] → R donnée par γ(t) = (x(t), y(t)) = (Rt, R 1 − t ). De l’équa-
2
tion x2 (t) + y 2 (t) = R2 , on déduit que γ(t) appartient au cercle de rayon R et de centre
(0, 0). Plus précisément, le support géométrique de γ est le quart de cercle entre les
points (R, 0) et (0, R). Or ce support géométrique admet aussi une autre paramétrisa-
tion γe : [0, π2 ] → R2 donnée par γe (θ) = (R cos(θ), R sin(θ)). Ainsi, une même courbe
géométrique peut avoir plusieurs paramétrisations.
Reparamétrisation
Il est possible de reparamétrer une courbe. Pour cela, on rappelle la notion de
difféomorphisme.
Définition 2. Soient U et V deux domaines ouverts de Rd .
Une application f : U → V est un C 1 difféomorphisme si :
3
— f est une bijection de U dans V .

— f et f −1 sont toutes les deux de classe C 1 .
Prenons maintenant une courbe paramétrée γ : I → Rd de classe C 1 et un difféo-

morphisme ϕ : J → I (avec J un intervalle ouvert de R). Alors γ ◦ ϕ : J → Rd est une
courbe paramétrée qui a exactement le même support géométrique que γ. On dit alors
que ϕ est un changement de variable admissible et que γ ◦ ϕ est une reparamétrisation
de γ.
Courbes régulières, espace tangent

Intuitivement, la tangente en un point γ(t0 ) à une courbe paramétrée γ : I → Rd
est la limite des droites passant par γ(t) et γ(t0 ) quand t tend vers t0 . Cela peut se
formaliser de la manière suivante :
Définition 3. On dit que →

−
v0 est est un vecteur tangent à la courbe γ en γ(t0 ) si
−−−−−→
γ(t0 )γ(t) = λ(t)→
−
v0 + λ(t) (t), avec λ(t) ∈ R et lim (t) = (0, 0).
t→t0
La droite passant par γ(t0 ) et de vecteur directeur →

−
v0 est alors appelée la droite tangente
à γ en γ(t0 ).
La proposition suivante indique qu’une dérivée non nulle de la paramétrisation

donne un vecteur tangent.
Proposition 1. Soit γ : I → Rd une courbe paramétrée de classe C 1 . Si γ 0 (t0 ) 6= 0,

alors γ 0 (t0 ) est un vecteur tangent à la courbe γ en γ(t0 ).
Démonstration : Comme γ est de classe C 1 , on a :
γ(t) = γ(t0 ) + γ 0 (t0 )(t − t0 ) + (t − t0 )(t), avec lim (t) = (0, 0),
t→t0
ce qui permet de conclure.
Définition 4. Une courbe paramétrée γ : I → Rd de classe C 1 est dite régulière si pour

tout t ∈ I γ 0 (t) 6= 0.
Remarques :
— Si γ : I → Rd est régulière et si γe = γ ◦ ϕ est une reparamétrisation de γ, alors
γe est aussi régulière. En effet, comme ϕ : J → I est un C 1 -difféomorphisme, on
a
∀t ∈ J, γe 0 (t) = γ 0 (ϕ(t))ϕ0 (t) 6= 0.
4
Figure 3 – Tangente à une courbe paramétrée
— Une courbe paramétrée régulière admet une tangente en tout point. La réci-
proque n’est pas vraie. Considérons la courbe paramétrée suivante :
γ(t) = (t2 , t4 ) avec t ∈ R.
La courbe géométrique associée est la parabole d’équation y = x2 qui a un
vecteur tangent horizontal au point γ(0). Pourtant γ 0 (0) est nul !
Longueur d’une courbe

Comment mesurer la longueur d’une courbe ? Une façon naturelle de procéder
consiste à approcher cette longueur par la longueur d’une ligne polygonale dont les
sommets sont sur la courbe. La longueur de la ligne polygonale est clairement infé-
rieure à celle de la courbe, mais on imagine bien que si on rajoute des sommets en
diminuant la distance entre deux sommets consécutifs, la longueur de la ligne polygo-
nale va tendre vers la longueur de la courbe. La définition de la longueur d’une courbe
repose sur cette idée (Figure 4) :
Définition 5. La longueur d’une courbe paramétrée γ : [a, b] → Rd est donnée par :
n−1
X −−−−−−−−→

l(γ) = sup γ(ti )
γ(ti+1 ) ,
a=t0 <t1 <...<tn =b k=0
où le supremum est pris sur toutes les subdivisions a = t0 < t1 < ... < tn = b de
l’intervalle [a, b], n étant quelconque.
De plus, si l(γ) est fini, on dit que la courbe γ est rectifiable.
Remarque : La longueur ne dépend pas de la paramétrisation.

La définition précédente est géométrique et correspond à l’intuition que l’on peut
avoir de la longueur. Ceci dit, elle n’est pas forcément pratique pour effectuer des
calculs. Le théorème suivant exprime la longueur d’une courbe paramétrée par une
formule intégrale.
5
Figure 4 – Longueur d’une courbe paramétrée γ : I → R2 . Si on augmente la densité

des sommets de la ligne polygonale Pn le long de la courbe, alors la longueur de Pn
approche celle de la courbe.
Théorème 1. Soit γ : [a, b] → R3 une courbe paramétrée de classe C 1 . Alors γ est

rectifiable et on a : Z b
l(γ) = kγ 0 (t)kdt.
a
Démonstration : Considérons une subdivision a = t0 < t1 < ... < tn = b de l’intervalle

[a, b]. Nous avons pour tout i ∈ {0, ..n − 1} :
Z t Z ti+1
i+1 0
kγ 0 (t)k dt.

kγ(ti+1 ) − γ(ti )k = γ (t) dt ≤
ti ti
Cela implique en sommant sur i :

n−1
X −−−−−−−−→
Z b
γ(ti )
γ(ti+1 ) ≤ kγ 0 (t)k dt.
k=0 a
En passant maintenant au supremum sur toutes les subdivisions, on obtient que γ est
rectifiable et vérifie : Z b
l(γ) ≤ kγ 0 (t)k dt.
a
Montrons maintenant l’égalité souhaitée. Pour cela, introduisons la fonction φ : [a, b] →
R qui donne la longueur de la courbe entre les paramètres a et t :

∀t ∈ [a, b], φ(t) = l γ|[a,t] .
Prenons t ∈ [a, b] et h vérifiant t + h ∈ [a, b]. La longueur de la courbe entre les

paramètres t et t + h étant plus longue que la longueur du segment reliant γ(t) à
γ(t + h), on a :
1 −−−−−−−−→ φ(t + h) − φ(t)

γ(t)γ(t + h) ≤ .
|h| h
6
On en déduit l’encadrement suivant :

1 −−−−−−−−→ φ(t + h) − φ(t) 1 Z t+h 0

γ(t)γ(t + h) ≤ ≤ kγ (u)k du.
|h| h h t
Les membres de droite et de gauche ont la même limite kγ 0 (t)k, ce qui implique que φ
est dérivable en t et que l’on a φ0 (t) = kγ 0 (t)k.
Exemple : La longueur de l’hélice paramétrée par γ(t) = (R cos(t), R sin(t), at) avec
γ : [0, 2π] → R3 est donnée par :
Z 2π Z 2π √ √
0
l(γ) = kγ (t)k dt = R2 + a2 dt = 2π R 2 + a2 .
0 0
Remarquons au passage que si a = 0, on retrouve que la longueur d’un cercle de rayon

R vaut 2πR.
Paramétrisation par abscisse curviligne

Maintenant que l’on sait calculer la longueur d’une courbe, il est possible de paramé-
trer une courbe par sa longueur. Pour expliquer ce que représente cette paramétrisation,
on peut reprendre l’exemple de la courbe C qui modélise la route Grenoble-Chamrousse.
On a déjà donné deux paramétrisations possibles de cette courbe, mais il est aussi pos-
sible d’en définir une troisième en repérant chaque point de C par sa distance au point
d’origine, à savoir Grenoble. La longueur du trajet étant de 30 kilomètres, cela nous
définit naturellement la courbe paramétrée γ : [0, 30] → R3 qui à chaque longueur
s ∈ [0, 30] associe le point γ(s) sur la courbe C qui est à une distance s du point de
départ. Cette paramétrisation est dite normale ou par abscisse curviligne. Elle est assez
naturelle dans le sens ou elle ne dépend pas de la vitesse d’un véhicule qui parcourt
cette courbe (plus exactement, cette vitesse est constante). Formellement, on définit :
Définition 6. Une paramétrisation γ : I → Rd d’une courbe géométrique est dite

normale (ou par abscisse curviligne) si pour tout [t1 , t2 ] ⊂ I la longueur de la courbe
géométrique entre les points γ(t1 ) et γ(t2 ) est exactement t2 − t1 :
l(γ|[t1 ,t2 ] ) = t2 − t1 .
En pratique, on n’a pas forcément une paramétrisation normale. Si on veut en avoir

une, il faut reparamétrer. Pour cela, on a besoin de la notion d’abscisse curviligne.
Définition 7. Soit γ : I → Rd une courbe paramétrée de classe C 1 et t0 ∈ I. L’abscisse

curviligne à partir du point de paramètre t0 est la fonction st0 : I → R donnée par :
Z t
∀t ∈ I st0 (t) = kγ 0 (u)k du.
t0
7
Géométriquement, st0 (t) est la longueur de la courbe géométrique C = γ(I) entre

les points γ(t0 ) et γ(t). Le résultat suivant nous indique que toute courbe paramétrée
régulière de classe C 1 peut être reparamétrée par abscisse curviligne.
Théorème 2. Soient γ : I → Rd une courbe paramétrée régulière de classe C 1 et t0 ∈ I.

Alors l’abscisse curviligne s−1
t0 : J → I est un changement de variable admissible et
γe = γ ◦ s−1
t0 : J → R
d
est une paramétrisation normale qui a le même support géométrique que γ.
Démonstration : Admise.
Corollaire 1. Soient γ : [a, b] → Rd une courbe paramétrée régulière de classe C 1 . On

note l = l(γ) la longueur de γ. Alors la courbe
γe = γ ◦ s−1
a : [0, l] → R
d
est une reparamétrisation normale de γ.
Intuitivement, si on "déroule" une courbe géométrique C de longueur l le long d’une

droite, on obtient un segment qui est aussi de longueur l et qui peut être identifié à
l’intervalle I = [0, l]. La correspondance point par point entre I et C donne naturel-
lement une paramétrisation normale γe : [0, l] → C. Par convention, on note souvent s
le paramètre d’une courbe paramétrée par abscisse curviligne et on note souvent t le
paramètre dans le cas d’une paramétrisation quelconque.
Proposition 2. Soit γ : I → Rd une courbe paramétrée de classe C 1 . Alors on a :
la paramétrisation γ est normale ⇔ ∀s ∈ I kγ 0 (s)k = 1.
Démonstration : Si la paramétrisation est normale, alors l’abscisse curviligne à partir

du point t0 de γ vérifie pour tout t ∈ I :
Z t
st0 (t) = kγ 0 (u)k du = t − t0 .
t0
En dérivant, cela donne pour tout t ∈ I : s0t0 (t) = kγ 0 (t)k = 1.

Réciproquement, si pour tout s ∈ [I on a kγ 0 (s)k = 1, alors pour tout [t1 , t2 ] ⊂ I :
Z t2
l(γ|[t1 ,t2 ] ) = kγ 0 (s)kds = t2 − t1 .
t1
8
Exemple
√ : On considère la courbe paramétrée γ :]0, 1[→ R2 définie par γ(t) =
(t, 1 − t2 ). L’abscisse curviligne s0 :]0, 1[→ R est donnée par :
Z t
0
Z t
1
s0 (t) = kγ (u)kdu = √ du = arcsin(t).
0 0 1 − u2
La fonction arcsin : [0, 1[→]0, π/2[ est une bijection. La reparamétrisation γe = γ ◦ s0−1 :
]0, π/2[→ R2 est donnée par :
q
γe (s) = γ(sin s) = sin s, 1 − sin2 (s) = (sin(s), cos(s)).
On remarque que cela correspond à une paramétrisation du quart de cercle de rayon

1 entre les points de coordonnées (0, 1) et (1, 0). Le paramètre s correspond à l’angle
−−−→
entre 0γ(s) et le vecteur de coordonnées (0, 1).
1.2 Allure locale des courbes planes

Dans cette partie, on s’intéresse à l’allure locale des courbes planes régulières. Une
notion centrale pour connaître cette allure est la courbure. On verra que celle-ci est
fortement liée à la dérivée seconde de la paramétrisation. Rappelons que le déterminant
det(u, v) de deux vecteurs u = (u1 , u2 ) et v = (v1 , v2 ) de R2 est donné par :
det(u, v) = u1 v2 − u2 v1 .
Repère de Serret-Frenet
On définit tout d’abord le repère de Serret-Frenet. Il s’agit d’un repère orthonormé
qui varie le long d’une courbe paramétrée.
Définition 8. Soit γ : [a, b] → R2 une courbe paramétrée régulière de classe C 1 . Le
repère de Serret-Frenet de γ au point γ(t) est le repère orthonormé :
→
− →
−
(γ(t), T (t), N (t)),
→
− γ 0 (t) →
− →
−
où T (t) = kγ 0 (t)k
et ( T (t), N (t)) est une base orthonormée directe du plan affine.
→
− →
−
Le vecteur T (t) est tangent à la courbe au point γ(t) et le vecteur N (t) est un
vecteur qui est normal à la courbe en γ(t).
Remarque : La droite tangente à la courbe γ au point γ(t) ne dépend pas de la
→
−
paramétrisation. Par contre, le vecteur T (t) en dépend : si on change le sens de parcours
de la courbe, alors ce vecteur sera remplacé par son opposé. Le repère de Serret-Frenet
dépend ainsi du sens de parcours de la paramétrisation ainsi que de l’orientation du
plan affine.
9
Courbure
Quelle est l’allure locale d’une courbe paramétrée γ : I → R2 régulière de classe
C 2 ? On peut supposer, sans restriction, que cette courbe est paramétrée par abscisse
curviligne. Pour connaître la forme, on va effectuer un développement limité de γ à
l’ordre 2 en s0 :
0 (s − s0 )2 00
γ(s) = γ(s0 ) + (s − s0 )γ (s0 ) + γ (s0 ) + o((s − s0 )2 ).
2
→
−
On sait que le vecteur T (s) = γ 0 (s0 ) est tangent à la courbe en γ(s0 ). Si γ 00 (s0 ) 6= 0,
le développement limité nous indique qu’à l’ordre deux, la courbe est "attirée" dans la
direction γ 00 (s0 ). Autrement dit, le vecteur γ 00 (s0 ) nous donne des informations sur la
forme de la courbe au voisinage de γ(s0 ). Intuitivement, on voit aussi que plus kγ 00 (s0 )k
est grand, plus la courbe est courbée. Effectivement, cette norme va nous permettre de
définir la courbure (Figure 5).
Figure 5 – Dérivée première et seconde d’une courbe paramétrée par abscisse curvi-
ligne
Proposition 3. Si γ : I → R2 est une courbe paramétrée régulière de classe C 2 , alors

→
−
γ 00 (s) est un vecteur colinéaire à N (s). En particulier, il existe une application continue
κ : I → R telle que :
→
− →
−
∀s ∈ I, γ 00 (s) = T 0 (s) = κ(s) N (s).
→
− →
− →
−
Démonstration : Pour tout s ∈ I, on a T (s). T (s) = k T (s)k2 = 1. En dérivant, cela
→
− →
− →
−
donne T 0 (s). T (s) = 0. On pose alors κ(s) = γ 00 (s). N (s).
On est maintenant en mesure de définir la courbure d’une courbe paramétrée par
abscisse curviligne.
Définition 9. Soit γ : I → R2 une courbe paramétrée normale régulière de classe C 2
et p = γ(s) un point de la courbe.
10
— La courbure algébrique κ(s) de γ en p est :

→
− →
− →
−
κ(s) = γ 00 (s). N (s) = T 0 (s). N (s).
— La courbure κ(s) de γ en p est :
κ(s) = |κ(s)| = kγ 00 (s)k.
— Le point p = γ(s) de γ est birégulier si κ(s) 6= 0.
— On dit que p est un point d’inflexion de γ si la droite tangente à γ en p "traverse"
la courbe en p dans tout voisinage de p.
Exemple : Prenons la paramétrisation γ(θ) = (R cos Rθ , R sin Rθ ), avec θ ∈ [0, 2π]. On

remarque que cette paramétrisation est normale car pour tout θ on a kγ 0 (θ)k = 1. La
courbure au point γ(θ) vaut :
!
00
1 θ 1 θ 1
κ(θ) = kγ (θ)k = − cos , − sin = .

R R R R R
La courbure d’un cercle de rayon R est donc constante et vaut R.
Proposition 4. La courbure ne dépend pas de la paramétrisation et la courbure al-
gébrique est défini au signe près (et dépend du sens de parcours de la courbe et de
l’orientation du plan).
Plus précisément, prenons γ1 : I → R2 une courbe paramétrée normale et γ2 : J → R2
une reparamétrisation de γ. Alors il existe ∈ {−1, 1} tel que :
∀p = γ1 (s) = γ2 (u) ∈ C κ1 (s) = κ2 (u) et κ1 (s) = κ2 (u)
où κi et κi sont les courbures et courbures algébriques de γi (avec i ∈ {1, 2}).
Interprétation géométrique
Si une courbe paramétrée γ : I → R2 est normale, le point γ(s) avance à la
même vitesse que son paramètre s (cela correspond au fait que la norme de la dé-
rivée est constante égale à 1). Avec cette paramétrisation, on a vu que le vecteur
→
− →
−
γ 00 (s) = κ(s) N (s) est orthogonal à T (s) et le développement limité de γ à l’ordre deux
peut se réécrire naturellement dans le repère de Serret-Frenet :
→
− (s − s0 )2 →
−
γ(s) = γ(s0 ) + (s − s0 ) T (s0 ) + κ(s) N (s0 ) + o((s − s0 )2 ).
2
En un point de paramètre s, si la courbure κ(s) est strictement positive, les vecteurs
→
− →
−
N (s) et γ 00 (s) sont égaux et le vecteur N (s) pointe vers le centre de courbure. Si la
→
−
courbure est négative, alors N (s) = 1/κ(s) γ 00 (s) pointe dans la direction opposée au
centre de courbure (Figure 6).
11
Figure 6 – Repère de Serret-Frenet Ri = (γ(si ), T~ (si ), N ~ (si )) au point de paramètre

si (avec i ∈ {1, 2, 3}) : en γ(s1 ), la courbure algébrique est négative et le vecteur N~ (s1 )
pointe dans la direction opposée au centre de courbure C(s1 ). En γ(s2 ), la courbure
algébrique est nulle, il n’y a pas de centre de courbure. En γ(s3 ) la courbure algébrique
est positive et le vecteur N ~ (s3 ) pointe vers le centre de courbure C(s3 ).
Proposition 5. Si γ a un point d’inflexion en s0 , alors κ(s0 ) = 0.
Démonstration : Il suffit de reprendre le développement limité.

En général, si on prend une courbe paramétrée quelconque, il n’y a pas de raison
pour que la paramétrisation soit normale. On peut alors utiliser la proposition suivante
pour calculer la courbure :
Proposition 6. Soit γ : I → R2 une courbe paramétrée régulière de classe C 2 . Alors
pour tout t ∈ I, on a :
det(γ 0 (t), γ 00 (t)) |det(γ 0 (t), γ 00 (t))|
κ(t) = et κ(t) = .
kγ 0 (t)k3 kγ 0 (t)k3
Démonstration : On note γe = γ ◦ s−1 t0 la paramétrisation par abscisse curviligne (avec

t0 ∈ I) et on pose s = st0 (t). La formule :
1 1
(s−1 0
t0 ) (s) = =
s0t0 (s−1
t0 (s)) kγ 0 (s−1
t0 (s))k
implique
γ 0 (s−1
t0 (s))
γe 0 (s) = (γ ◦ s−1 0 0 −1 −1 0
t0 ) (s) = γ (st0 (s)) (st0 ) (s) = −1 .
kγ 0 (st0 (s))k
En dérivant une deuxième fois, on a :
γ 00 (s−1
t0 (s))
γe 00 (s) = 0 −1 + λ(s)γ 0 (s−1
t0 (s)),
kγ (st0 (s))k2
12
1
où λ est la dérivée de la fonction s 7→ kγ 0 (s−1
. On a donc :
0t (s))k
det(γ 0 (t), γ 00 (t))

det(γe 0 (s), γe 00 (s)) = .
kγ 0 (t)k3
Par ailleurs, on a :
→
− →
−
det(γe 0 (s), γe 00 (s)) = det( T (s), κ(s) N (s)) = κ(s),
ce qui permet de conclure.

1
Le cercle de rayon κ(t) et tangent à la courbe γ au point γ(t) s’appelle le cercle
osculateur au point γ(t).
Définition 10. Soit γ : I → R2 une courbe paramétrée régulière et de classe C 2 .

— Le centre de courbure en γ(t) en un point de courbure non nulle est le point :
1 → −
C(t) = γ(t) + N (t).
κ(t)
1
— Le cercle osculateur est le cercle de centre C(t) et de rayon κ(t)
.
Sur la Figure 6, on observe que les cercles osculateurs aux points γ(s1 ) et γ(s3 )
"épousent" bien la forme de la courbe. En fait, ils ont un contact d’ordre deux avec la
courbe : plus précisément on peut montrer que la courbe paramétrée par abscisse cur-
viligne et le cercle osculateur paramétré par abscisse curviligne ont un développement
limité qui coïncide à l’ordre deux au voisinage du point γ(si ) (avec i ∈ {1, 3}).
Formules de Serret-Frenet
Le repère de Serret Frenet est défini en chaque point d’une courbe paramétrée
régulière. Les formules de Serret-Frenet expriment la façon dont ce repère bouge le
long de la courbe. Plus précisément, elles donnent les dérivées de ce repère dans la base
de Serret-Frenet.
Proposition 7 (Formules de Serret Frenet). Soit γ : I → R2 une courbe paramétrée

normale régulière de classe C 2 . Alors pour tout s ∈ I, on a :

→
−0 →
−
 T (s) = κ(s) N (s)
 →
−0 →
−
N (s) = −κ(s) T (s)
→
−
Démonstration : La première formule a déjà été montrée. Le vecteur N (s) étant
unitaire, on a :
→
− →
−
∀s ∈ I N (s). N (s) = 1.
13
En dérivant, on obtient
→
−0 →
−
∀s ∈ I N (s). N (s) = 0.
→
− →
−
Le vecteur N 0 (s) est donc colinéaire à T (s). Par ailleurs, on a :
→
− →
−
∀s ∈ I T (s). N (s) = 0.
→
−0 →
− →
− →
−
T (s). N (s) + T (s). N 0 (s) = 0,
→
− →
−
et donc κ(s) = − N 0 (s). T (s), ce qui permet de conclure.
1.3 Allure locale des courbes gauches

Une courbe gauche est une courbe de R3 qui n’est pas plane. Dans cette partie, on
considère les courbes paramétrées régulières gauches de classe C 2 de la forme :
γ : I → R3 .
L’étude de l’allure locale est plus compliquée que pour les courbes planes. En effet,
pour une courbe plane paramétrée régulière, il n’y a qu’une seule direction normale
en chaque point de la courbe. Pour une courbe gauche, il y a tout un plan qui est
orthogonal au vecteur tangent à la courbe en chaque point, ce qui complique un peu
son étude et introduit une nouvelle notion, celle de torsion.
Courbure et normale principale

Dans le cas des courbes planes, le signe de la courbure algébrique est lié au sens de
parcours de la courbe et à l’orientation du plan. Pour une courbe gauche, il n’est plus
possible d’avoir un signe de courbure cohérent : intuitivement, quand on se promène
sur la courbe, on ne peut pas de manière naturelle dire où est la droite, et où est la
gauche. On ne définit donc pas de courbure algébrique, mais uniquement une courbure
(qui est toujours positive).
Définition 11. Soit γ : I → R3 une courbe paramétrée normale régulière de classe C 2 .

La courbure de γ au point γ(s) est :
κ(s) = kγ 0 (s)k.
Proposition 8. La courbure d’une courbe paramétrée régulière γ : I → R3 de classe

C 2 au point de paramètre t vaut :
kγ 0 (t) ∧ γ 00 (t)k
κ(t) = .
kγ 0 (t)k3
14
Démonstration : La preuve est similaire à celle pour les courbes planes.

Définition 12. Soit γ : I → R3 une courbe régulière paramétrée normale de classe C 2 .
— Un point γ(s) est dit birégulier si κ(s) 6= 0 (i.e. γ 00 (s) 6= 0).
— La normale principale de γ en un point birégulier γ(s) est donnée par
→
− 1 → −0 γ 00 (s)
N (s) = T (s) = 00 .
κ(s) kγ (s)k
De même que pour les courbes planes, la dérivée seconde γ 00 (s) est orthogonale à
0
γ (s) et indique la direction dans laquelle la courbe est courbée à l’ordre deux. Nous
introduisons maintenant plusieurs définitions
Définition 13. Soit γ : I → R3 une courbe régulière paramétrée par abscisse curviligne
de classe C 2 et γ(s) un point birégulier.
→
− →
−
— Le plan osculateur en γ(s) est le plan vectoriel engendré par T (s) et N (s)
1
— Le rayon de courbure en γ(s) est R(s) = κ(s) .
→
−
— Le centre de courbure en γ(s) est C(s) = γ(s) + R(s) N (s).
— La développée de γ est l’ensemble des centres de courbure.
— La sphère osculatrice est la sphère de centre C(s) et de rayon R(s).
Remarque : Comme pour les courbes planes, on peut montrer que ces définitions ne
dépendent pas de la paramétrisation de la courbe géométrique.
Binormale et repère de Serret-Frenet

Comme dans le cas des courbes planes, le repère de Serret-Frenet est un repère
→
−
orthonormé qui varie le long d’une courbe paramétrée. Le vecteur T (s) est unitaire
→
− →
−
tangent à la courbe, la normale principale N (s) est orthogonale à T (s). Il est naturel
de compléter cela en une base orthonormée en posant :
→
− →
− →
−
B (s) = T (s) ∧ N (s),
où ∧ est le produit vectoriel défini par :
(u1 , u2 , u3 ) ∧ (v1 , v2 , v3 ) = (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ).
Définition 14. Soit γ : I → R3 une courbe régulière paramétrée régulière et γ(s) un

point birégulier.
— La binormale à γ au point γ(s) est le vecteur :
→
− →
− →
−
B (s) = T (s) ∧ N (s).
— Le repère de Serret-Frenet de γ au point γ(s) est le repère orthonormé direct :

→
− →
− →
−
(γ(s), T (s), N (s), B (s)).
15
Torsion d’une courbe

On va maintenant étudier la torsion d’une courbe, autrement dit chercher à savoir
comment "tourne" le repère de Serret-Frenet autour de la droite tangente à la courbe.
→
− →
−
Pour mesurer cela, on a besoin de la dérivée du vecteur binormal B . Comme B fait
intervenir la dérivée seconde de la paramétrisation, on est obligé de considérer ici des
paramétrisation de classe C 3 .
On considère ici une courbe γ : I → R3 paramétrée normale de classe C 3 et γ(s)
un point birégulier.
→
− →
−
Proposition 9. Le vecteur B 0 (s) est colinéaire à N (s). En particulier, il existe une
application continue τ : I → R qui vérifie :
→
− →
−
∀s ∈ I B 0 (s) = τ (s) N (s).
→
− →
− →
−
Démonstration : Pour tout s ∈ I, on a B (s). B (s) = k B (s)k2 = 1. En dérivant, on a :
→
− →
−
∀s ∈ I B 0 (s). B (s) = 0.
→
− →
−
De même, en dérivant le fait que pour tout s ∈ I B (s). T (s) = 0, on a :
→
− →
− →
− →
− →
− →
−
∀s ∈ I B 0 (s). T (s) + B (s). T 0 (s) = B 0 (s). T (s) = 0.
→
− →
− →
− →
−
Le vecteur B 0 (s) est donc orthogonal à T (s) et B (s). Il est alors colinéaire à N (s) et
→
− →
−
on pose τ (s) = B 0 (s). N (s).
Définition 15. La torsion τ (s) d’une courbe paramétrée par abscisse curviligne γ en
un point γ(s) est :
→
− →
−
τ (s) = B 0 (s). N (s).
Proposition 10. La torsion est donnée pour tout s ∈ I par :
det(γ 0 (s), γ 00 (s), γ 000 (s))
τ (s) = − .
kγ 00 (s)k2
Démonstration : Cela consiste à faire le calcul suivant :

→
− →
−0
τ (s) = N (s). B (s)
→
− → −0 →
− →
− →
−
= N (s). T (s) ∧ N (s) + T (s) ∧ N 0 (s)
→
− → − →
−
= N (s). T (s) ∧ N 0 (s)
→
− →
− →
−
= det( N (s), T (s), N 0 (s))
→
− →
− →−
= −det( T (s), N (s), N 0 (s))
= −det(γ 0 (s), R(s)γ 00 (s), R0 (s)γ 00 (s) + R(s)γ 000 (s))
= −R(s)2 det(γ 0 (s), γ 00 (s), γ 000 (s))
= − det(γ (s),γ (s),γ (s))
0 00 000
kγ 00 (s)k2
16

En pratique, le résultat suivant peut permettre de calculer la torsion pour une
paramétrisation générale.
Proposition 11. La torsion d’une courbe paramétrée γ : I → R3 de classe C 3 en un
point γ(t) vaut
det(γ 0 (t), γ 00 (t), γ 000 (t))
τ (t) = − .
kγ 0 (t) ∧ γ 00 (t)k2
→
−
La torsion mesure comment "tourne" le vecteur B . Une interprétation géométrique
de la torsion est donnée par la proposition suivante
Proposition 12. Soit γ : I → R3 une courbe paramétrée régulière de classe C 3 dont
tous les points sont biréguliers. Alors
la courbe γ est plane ⇐⇒ ∀t ∈ I, τ (t) = 0.
Démonstration : Voir exercice 15.
Formules de Serret-Frenet
Comme pour les courbes planes, en chaque point d’une courbe gauche paramétrée
régulière, on a un repère de Serret Frenet. Ce repère bouge avec le paramètre de la
courbe. Les formules de Serret-Frenet expriment justement la dérivée de ce repère.
Proposition 13 (Formules de Serret Frenet). Soit γ : I → R3 une courbe paramétrée
normale régulière de classe C 3 et γ(s) un point birégulier. Alors on a :
 →−0 →
−

 →T (s) = κ(s) N 0 (s)
−0 →
− →
−

N (s) = −κ(s) T (s) − τ (s) B (s)
 →−0 →
−


B (s) = τ (s) N (s)
Démonstration : Il ne reste que la deuxième formule à montrer. Pour cela, on va

→
−
calculer les coordonnées de N 0 (s) dans la base de Serret-Frenet.
→
− →
−
Pour tout s ∈ I, on a N (s). N (s) = 1. En dérivant, cela donne :
→
−0 →
−
N (s). N (s) = 0.
→
− →
−
En dérivant le fait que pour tout s ∈ I B (s). N (s) = 0, on a :
→
−0 →
− →
− →
− →
− →
−
N (s). B (s) = − N (s). B 0 (s) = − N (s).(τ (s) N (s)) = −τ (s).
→
− →
−
De même, en dérivant le fait que pour tout s ∈ I N (s). T (s) = 0, on a :
→
−0 →
− →
− →
− →
− →
−
N (s). T (s) = − N (s). T 0 (s) = − N (s).(κ(s) N (s)) = −κ(s).

17
1.4 Surfaces paramétrées

Dans cette partie, on va donner quelques rudiments concernant les surfaces paramé-
trées régulières. Comme dans le cas des courbes, la notion d’espace tangent est liée à la
différentielle première et la forme de la surface est donnée par la différentielle seconde.
Définition des surfaces paramétrées
Définition 16. Une surface paramétrée de classe C k (k ≥ 1) est une application de

classe C k
f : U ⊂ R2 → R3 ,
où U est un domaine de R2 (ouvert connexe de R2 ).
L’ensemble S = f (U ) = {f (x, y), (x, y) ∈ U } est appelé le support géométrique de
la surface paramétrée f : U → R3 .
Figure 7 – Surface paramétrée
Reparamétrisation
Comme dans le cas des courbes, il est possible de reparamétrer les surfaces para-
métrées par des difféomorphismes. Prenons une surface paramétrée f : U ⊂ R2 → R3
de classe C 1 et ϕ : V ⊂ R2 → U un C 1 difféomorphisme. Alors
f ◦ ϕ : V → R3
est une surface paramétrée qui a exactement le même support géométrique que f . On
dit que ϕ est un changement de variable admissible et que f ◦ϕ est une reparamétrisation
de f .
Rappel sur les différentielles
Le but de cette partie n’est pas de faire un cours précis sur les différentielles, mais
de rappeler les notions utiles pour les surfaces. Pour plus de précisions, le lecteur pourra
regarder le chapitre Fonctions de plusieurs variables de Maths en L1̇gne. Prenons une
application f : U ⊂ R2 → Rn (avec n ≥ 1).
18
Définition 17.
— On dira que f est une application de classe C 1 si les dérivées partielles de f
existent et sont continues.
— On appelle alors différentielle de f au point (a, b) l’application linéaire de R2
dans R, notée Df (a, b) définie par :
∂f ∂f
Df (a, b) : (hx , hy ) ∈ R2 7→ hx (a, b) + hy (a, b).
∂x ∂y
On a alors la proposition suivante :
Proposition 14. Si f est une application de classe C 1 , le développement limité de f

à l’ordre un est donné par :
q
f (x, y) = f (a, b) + Df (a, b).(hx , hy ) + o h2x + h2y ,
avec hx = (x − a) et hy = (y − b).
De même, on dit qu’une application f : U ⊂ R2 → Rn est de classe C 2 si les dérivées

partielles d’ordre deux existent et sont continues. La différentielle seconde D2 f (a, b) :
R2 × R2 → Rn est alors une application bilinéaire donnée pour tout (hx , hy ), (kx , ky ) ∈
R2 × R2 par :
∂ 2f ∂ 2f ∂ 2f
hx kx (a, b) + (h k
x y + h k
y x ) (a, b) + h k
y y (a, b).
∂x2 ∂x∂y ∂y 2
On a alors la proposition suivante :
Proposition 15. Si f ⊂ R2 → Rn est de classe C 2 , le développement limité de f à

l’ordre deux est donné par :
1
f (x, y) = f (a, b) + Df (a, b)(hx , hy ) + D2 f (a, b)(hx , hy )2 + o((h2x + h2y )),
2
avec hx = (x − a) et hy = (y − b).
Espace tangent à une surface

Prenons une surface paramétrée f : U ⊂ R2 → R3 de classe C 1 . Remarquons que si
γ : I ⊂ R → U est une courbe paramétrée plane dont le support géométrique vit dans
l’espace des paramètres U , alors l’application
f ◦ γ : I → R3
est une courbe paramétrée dont le support est inclus dans le support S = f (U ) (Figure
8).
19
Figure 8 – Courbe sur une surface
En particulier, prenons un point m0 = f (x0 , y0 ) de la surface et considérons deux

intervalles I1 et I2 de R tels que (x0 , y0 ) ∈ I1 × I2 ⊂ U . On peut considérer la courbe
coordonnée γx0 (avec x0 ∈ I1 ) :
γx0 : y ∈ I2 7→ f (x0 , y).
Clairement, γx0 est une courbe paramétrée dont le support est inclus dans S = f (U ). Si
cette courbe est régulière en y = y0 cela signifie que le vecteur γx0 0 (y0 ) est tangent à la
courbe γx0 au point m0 = γx0 (y0 ). De même, on peut considérer la courbe coordonnées
γy0 (avec y0 ∈ I2 ) :
γy0 : x ∈ I1 7→ f (x, y0 ).
Si cette courbe est régulière en x = x0 cela signifie que le vecteur γy0 0 (x0 ) est tangent
à la courbe γy0 au point m0 = γy0 (x0 ). Or, par définition des dérivées partielles, nous
avons :
∂f ∂f
γx0 0 (y0 ) = (x0 , y0 ) et γy0 0 (x0 ) = (x0 , y0 ).
∂x ∂y
Ceci motive la définition d’espace tangent à une surface :
Définition 18. L’espace tangent à une surface paramétrée f : U → R3 au point
m0 = f (x0 , y0 ) est l’espace affine, noté Tm0 S (avec S = f (U )) passant par m0 et
engendré par les vecteurs ∂f∂x
(x0 , y0 ) et ∂f
∂y
(x0 , y0 ).
En pratique, l’espace tangent Tm0 S désigne aussi l’espace vectoriel qui dirige l’espace
affine défini ci-dessus à savoir donc l’espace vectoriel engendré par les vecteurs ∂f
∂x
(x0 , y0 )
∂f
et ∂y (x0 , y0 ).
Définition 19.
— La surface paramétrée f : U → R3 est dite régulière au point m = f (x, y) si les
deux vecteurs ∂f
∂x
(x, y) et ∂f
∂y
(x, y) sont libres.
20
Figure 9 – Dérivées partielles de la paramétrisation
— La surface paramétrée f : U → R3 est dite régulière si elle est régulière en tout

point.
On peut montrer que cette définition ne dépend pas de la paramétrisation choisie.

Au final, on peut retenir que si la surface est régulière, alors l’espace tangent Tm S
définit en tout point m par l’application f est de dimension deux : on l’appelle aussi
plan tangent.
Figure 10 – Espace tangent d’une surface paramétrée régulière
Longueur et aire
Prenons une surface paramétrée f : U ⊂ R2 → R3 de classe C 1 et γ : [a, b] ⊂
R → U une courbe paramétrée plane dont le support géométrique vit dans l’espace des
21
paramètres U . Alors f ◦ γ est une courbe paramétrée dont le support est inclus dans
le support S = f (U ) (Figure 8). Sa longueur est donnée par :
Z b Z b
l(f ◦ γ) = k(f ◦ γ)0 (t)k dt = k(Df (γ(t)).γ 0 (t)k dt.
a a
Autrement dit, pour connaître la longueur de la courbe f ◦ γ, on a besoin de la diffé-

rentielle Df et de la dérivée de γ. Par ailleurs, on donne sans preuve le résultat qui
donne l’aire d’une surface :
Proposition 16. Soit f : U ⊂ R2 → R3 une surface paramétrée régulière de classe

C 1 . Alors l’intégrale :
Z ∂f

∂f

(x, y) ∧ (x, y) dudv
U ∂x ∂y
ne dépend pas de la paramétrisation.
Définition 20. L’aire de la surface S = f (U ) paramétrée par f : U → R3 est :

Z ∂f

∂f
(x, y) ∧ (x, y) dudv.

U ∂x ∂y
Exemple : On considère le tore de révolution f : [0, 2π[×[0, 2π[→ R3 paramétré par :

 
(R + r cos u) cos v
f (x, y) =  (R + r cos u) sin v 

.
r sin u
L’aire de cette surface est donnée par :

Z 2π Z 2π
∂f
Z 2π Z 2π
∂f
Aire =
(x, y) ∧ (x, y) dxdy =

|r(R + r cos x)| dxdy = 4π 2 rR.
0 0 ∂x ∂x 0 0
Allure locale d’une surface

On s’intéresse ici à la forme de la surface localement. Rappelons que pour les courbes
paramétrées régulières, la dérivée de la paramétrisation donne un vecteur tangent à la
courbe, et la dérivée seconde permet de calculer la courbure. Pour les surfaces, il en est
de même : la différentielle de la paramétrisation f permet de définir l’espace tangent.
Pour avoir une idée de la forme, on peut faire un développement limité à l’ordre deux.
Cas particulier
Pour simplifier, on va supposer que la surface est paramétrée par une application de la
forme :
f (x, y) = (x, y, φ(x, y)),
22
avec φ : U ⊂ R2 → R. (En fait, on peut montrer que l’on peut toujours se ramener
localement à une telle forme, et que cette hypothèse n’est pas restrictive.) D’autre part,
quitte à faire un changement de repère, on peut supposer que φ(0, 0) = 0 et que
Dφ(0, 0) = 0. Dans le nouveau repère, cela revient à avoir que la surface passe par le
point de coordonnées (0, 0, 0) et que le plan tangent en ce point est horizontal. Dans
ce cas là, le développement limité de φ en (0, 0) est :
1
φ(x, y) = D2 φ(0, 0)(x, y)2 + o((x2 + y 2 )),
2
avec
∂ 2φ ∂ 2φ 2
2∂ φ
D2 φ(0, 0)((x, y), (x, y)) = x2 (0, 0) + 2xy (0, 0) + y (0, 0).
∂x2 ∂x∂y ∂y 2
La forme bilinéaire symétrique D2 φ(0, 0)((x, y), (x, y)) donne ainsi des informations
sur l’allure de la surface au voisinage du point m = f (0, 0) = (0, 0, 0). Il s’agit de la
deuxième forme fondamentale.
Cas général
Dans le cas d’une paramétrisation régulière quelconque, la définition de la deuxième
forme fondamentale fait aussi intervenir la différentielle première. Rappelons que si
f : U → R3 est une surface paramétrée régulière de classe C 2 , alors les vecteurs
∂f
∂x
(x, y) et ∂f
∂y
(x, y) forment une base de l’espace tangent Tm S à S = f (U ) au point
m = f (x, y). Tout vecteur de Tm S s’exprime donc dans cette base :
∂f ∂f
∀v ∈ Tm S ∃(vx , vy ) ∈ R2 v = vx (x, y) + vy (x, y).
∂x ∂y
On note K(x, y) le vecteur orthogonal à l’espace tangent Tm S donné par :
∂f ∂f
(x, y) ∧ ∂y (x, y)
K(x, y) = ∂x .
∂f ∂f
∂x (x, y) ∧ ∂y (x, y)

Définition 21. Soit f : U → R3 une surface paramétrée régulière de classe C 2 . La

deuxième forme fondamentale IIm en un point m = f (x, y) est la forme quadratique
sur l’espace tangent Tm S définie par :
∂f ∂f
∀v = vx (x, y) + vy (x, y) ∈ Tm S, IIm (v) = vx2 Lm + 2vx vy Mm + vy2 Nm ,
∂x ∂y
où
∂ 2f ∂ 2f ∂ 2f
Lm = (x, y).K(x, y) Mm = (x, y).K(x, y) Nm = (x, y).K(x, y).
∂x2 ∂x∂y ∂y 2
On peut montrer que la deuxième forme fondamentale IIm au point m ne dépend
pas (au signe près) du choix de la paramétrisation.
Remarques :
23
— Si f : (x, y) ∈ U 7→ (x, y, φ(x, y)) est une surface paramétrée de classe C 2 ,

avec φ : U → R une application vérifiant φ(0, 0) = 0 et Dφ(0, 0) = 0, alors la
deuxième forme fondamentale de f au point m = f (0, 0) est donnée par :
IIm = D2 φ(0, 0).
— L’espace vectoriel Tm S est naturellement munit d’un produit scalaire : en effet,

comme Tm S ⊂ R3 , deux vecteurs de Tm S sont aussi des vecteurs de R3 et on
peut faire leur produit scalaire.
Comme Tm S est un espace vectoriel de dimension deux munit d’un produit scalaire,
on peut utiliser le résultat d’algèbre suivant :
Proposition 17. Soient V est un espace vectoriel de dimension deux munit d’un pro-
duit scalaire et Q : V → R une forme quadratique sur V . Alors il existe une base
orthonormée (e1 , e2 ) de V telle que :
∀v = (vx , vy ) = vx e1 + vy e2 ∈ V Q(vx , vy ) = vx2 λ1 + vy2 λ2 ,
où
Q(v) Q(v)
λ1 = min et λ2 = max .
v6=0 kvk2 v6=0 kvk2
On peut montrer que si λ1 6= λ2 , alors la base orthogonale (e1 , e2 ) dans laquelle
la forme quadratique est diagonale est unique (à l’orientation près des vecteurs). En
appliquant cette proposition à la deuxième forme fondamentale IIm au point m =
f (x, y), on sait qu’il existe une base orthonormée (e1 , e2 ) de Tm S telle que :
∀v = (vx , vy ) = vx e1 + vy e2 ∈ Tm S IIm (vx , vy ) = vx2 λ1 + vy2 λ2 ,
où
Q(v) Q(v)
λ1 = min et λ2 = max .
v6=0 kvk2 v6=0 kvk2
On définit alors :
Définition 22.
— Les directions principales de S au point m sont les vecteurs e1 et e2 .
— Les courbures principales de S au point m sont les nombres λ1 et λ2 .
— La courbure de Gauss de S au point m est le produit λ1 λ2 .
Interprétation géométrique
Pour tout vecteur v ∈ Tm S, IIm (v) est la courbure de la surface au point m dans
la direction v. En particulier, λ1 est la courbure de la surface S dans la direction e1 et
λ2 est la courbure de la surface S dans la direction e2 . Le résultat d’algèbre précédent
est assez surprenant dans la mesure où il nous dit que pour tout point de toute surface
24
Figure 11 – Allure locale de la surface en fonction du signe des courbures principales
régulière de classe C 2 , la direction dans laquelle la surface est la plus courbée et

la direction dans laquelle la surface est la moins courbée sont orthogonales.
D’autre part, si on exprime localement la surface S comme un graphe au-dessus
de son espace tangent et que l’on met l’origine au point m, on peut supposer que
f (x, y) = (x, y, φ(x, y)) avec m = (0, 0, 0) = f (0, 0) et Df (0, 0) = 0. De plus, si on
exprime φ dans la base des directions principales (e1 , e2 ) du plan tangent Tm S on a :
1
f (x, y) = (x, y, φ(x, y)) avec φ(x, y) = λ1 x2 + λ2 y 2 + o(x2 + y 2 ).
2
Il est clair sur cette formule que l’allure de la surface au voisinage du point m dépend
du signe de λ1 et de λ2 , (Figure 11) :
— Si λ1 λ2 > 0, la surface ressemble localement à un paraboloïde.
— Si λ1 λ2 < 0 la surface ressemble localement à une "selle de cheval".
— Si λ1 = 0 et λ2 6= 0, la surface ressemble localement à un cylindrique.
25
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Les phrases suivantes sont-elles justes ?
1. Toute courbe paramétrée de classe C 2 est régulière.
2. Toute courbe paramétrée régulière a un espace tangent en tout point.
3. Si une courbe paramétrée admet une droite tangente en un point, alors elle
est régulière en ce point.
4. Toute paramétrisation de la courbe géométrique d’équation y = x2 est régu-
lière.
5. Il existe une paramétrisation régulière de la courbe géométrique d’équation
y = x2 .
q
6. Toute paramétrisation de la courbe géométrique d’équation y = |x| (avec
x ∈ R) est régulière.
7. Il q
existe une paramétrisation régulière de la courbe géométrique d’équation
y = |x| (avec x ∈ R).
1. Pour toute courbe paramétrée, il existe une paramétrisation non régulière.
2. Toute courbe normale est régulière.
3. Si une courbe une courbure nulle alors elle est plane.
4. La tangente à une courbe en un point d’inflexion traverse la courbe.
5. La tangente à une courbe en un point d’inflexion ne traverse jamais la courbe.
6. Si m est un point d’inflexion d’une courbe, alors la coubure en ce point est
nulle.
1. Une courbe rectifiable a une longueur finie.
2. La longueur d’une courbe paramétrée sur un intervalle [a, b] de longueur finie
est forcément finie.
3. Si une courbe est rectifiable, alors elle est de classe C 1 .
4. Si une courbe paramétrée est de classe C 1 , alors elle est rectifiable.
5. Si une courbe paramétrée est rectifable, alors il existe toujours un reparamé-
trage qui soit de classe C 1 .
6. La longueur de la courbe paramétrée γ : t ∈ [0, 4π] 7→ (R cos t, R sin t, 3) vaut
2πR.
26
1. La courbe paramétrée γ : t 7→ (t2 , t3 , t4 ) n’admet pas de droite tangente en

t = 0.
2. La droite tangente à la courbe paramétrée γ : t 7→ (t, t2 − 1, 4 + t5 ) en t = 0
a pour équation 
 x=u

y = −1 avec u ∈ R


z=4
3. La droite tangente à la courbe paramétrée γ : t 7→ (2 + t3 , 2t2 , t5 ) en t = 0 a
pour équation 
 x=2


y=u avec u ∈ R

z=0
4. La droite tangente à la courbe paramétrée γ : t 7→ (cos t, sin t) en t = π/4 a
pour équation ( √
x=√ − 2/2
avec u ∈ R
y = 2/2
5. La droite tangente à la courbe d’équation y = 3x3 au point (2, 24) a pour
équation (
x=2+u
avec u ∈ R
y = 24 + 36u
6. La droite tangente à la courbe d’équation y = −2x2 + 1 au point (1, −1) a
pour équation (
x=2+u
avec u ∈ R
y =4+u

1. La surface paramétrée f : (x, y) 7→ (x, |x + 3| + 1, y) est régulière.
2. La surface paramétrée f : (x, y) ∈ R2 7→ (x2 − 5y 2 + 3, 2x2 − y 2 , 15x2 ) est
régulière en tout point.
3. Il existe une paramétrisation régulière de la surface paramétrée
f : (x, y) ∈ R2 7→ (x2 − 5y 2 + 3, 2x2 − y 2 , 15x2 ).
4. Le tore admet une paramétrisation régulière
5. Toute paramétrisation du carré {(x, y, 0), x ∈ [0, 1] et y ∈ [0, 1]} est réguliere.
6. Il existe une paramétrisation régulière du cube {(x, y, z), sup(|x|, |y|, |z|) =
1}.

1. la torsion de l’hélice paramétrée par t ∈ R 7→ (cos t, sin t, t) est constante.
27
2. Toute courbe sur la sphère a une torsion qui est non nulle en au moins un
point.
3. Pour chaque courbe paramétrée régulière rectifiable, il existe une infinité de
reparamétrisation par abscisse curviligne.
4. Une courbe paramétrée a une courbure identiquement nulle si et seulement
si son support géométrique est un segment.
5. Une courbe paramétrée γ : I ⊂ R → R3 à courbure constante κ 6= 0 est
forcément inclus dans un cercle.

1. Une surface paramétrée de la forme (x, y) ∈ R2 7→ (x, y, z = φ(x, y)) est
toujours régulière.
2. Le support de f : (x, y) ∈ R2 7→ (2x − 5y + 2, 2x − 26y, 15) est une sphère.
3. Le support de f : (x, y) ∈ R2 7→ (x − 5y + 3, 2x − y, 15x) est un plan affine.
4. Le support de f : (x, y) ∈ R2 7→ (x2 − 5y 2 + 3, 2x2 − y 2 , 15x2 ) est un plan
affine.
5. Le support de f : (x, y) ∈ R2 7→ (x3 − 5y 3 + 3, 2x3 − y 3 , 15x3 ) est un plan
affine.
6. Le support de f : (t, θ) ∈ R2 7→ (t cos θ, t sin θ, t) est un cône.

1. Le support de la surface paramétrée f : (t, θ) ∈ R2 7→ (cos t cos θ, cos t cos θ, sin t)
est une sphère.
2. Le support de la surface paramétrée f : (t, θ) ∈ R2 7→ (cos θ, cos θ, t) est un
cylindre.
3. Le support de la surface paramétrée f : (t, θ) ∈ R2 7→ ((2 + cos t) cos θ, (2 +
cos t) cos θ, sin t) est un paraboloïde.
4. Si les courbures principales au point m sont de même signe et non nulles,
alors la surface est localement du même coté de l’espace tangent.
5. Si les courbures principales au point m sont de signe opposé, alors l’espace
tangent en m traverse localement la surface.
6. Si les deux courbures principales au point m sont nulles, alors la surface est
localement un plan.
7. Si une des deux courbures principales au point m est nulles, alors l’espace
tangent en m traverse localement la surface.
8. Si une des deux courbures principales au point m est nulles, alors l’espace
tangent en m ne traverse pas localement la surface.
28
2.2 Exercices
Exercice 1. Pour chacune des courbes paramétrées suivantes :
γ1 : t 7→ (t3 − t4 , t6 ) γ2 : t 7→ (t2 , t2 + t4 ) γ3 : t 7→ (t3 , t3 + t5 ),
répondre aux questions suivantes

1. La courbe est-elle régulière en t = 0 ?
2. En faisant un développement limité, indiquer la forme de la courbe au voisinage
de t = 0.
Exercice 2.
1. Déterminer la droite tangente à la courbe γ : t 7→ (R cos t, R sin t, 3t) en t = π.
2. Déterminer la droite tangente à la courbe γ : t 7→ (R cos t, R sin t, 3t) en t = 2π.
3. Déterminer la droite tangente à la courbe γ : t 7→ ((t − 1)2 , (t − 1)4 ) en t = 1.
4. Déterminer la droite tangente à la courbe γ : t 7→ (t, cos t) en t = π/4.
5. Déterminer la droite tangente à la courbe γ : t 7→ (t+2, 3t+4, t−5) en t = 1056.
Exercice 3. On considère la courbe paramétrée donnée pour tout t ∈ R par
√
γ(t) = 3 t, |t|
1. Montrer que la courbe n’est pas régulière en γ(0).

2. Montrer que la courbe admet une tangent en γ(0).
Exercice 4. On considère les deux courbes paramétrées suivantes :
2
γ1 : R → R( 3 γ2 : R → R2
(t, t 2 ) si t > 0
t 7→ 3 t 7→ (t2 , t3 )
(|t|, −|t| 2 ) si t ≥ 0
1. Ces deux courbes sont-elles régulières ?

2. Quelle est la régularité de chacune de ces deux courbes ? (sont elles continues,
de classe C 1 , C 2 , C n , ... ?)
3. Donner l’allure locale de γ au voisinage de t = 0.
4. Que pouvez-vous dire du support géométrique de chacune de ces deux courbes ?
5. Quelle(s) conclusion(s) en tirez-vous ?
Exercice 5 (Courbe non rectifiable). On considère la courbe paramétrée γ : [0, 1] → R2
définie par (
(t, t sin(π/t)) si t 6= 0
γ(t) =
(0, 0) si t = 0.
29
1. Montrer que γ est continue.

2. Montrer, géométriquement, que la longueur de la portion de courbe entre les
paramètres 1/(n + 1) et 1/n est au moins 2/(n + 21 ).
3. En déduire que la longueur de la courbe sur l’intervalle [1/N, 1] est plus grande
que
N
X 2
.
n=1 n + 1
4. Montrer que la longueur de la courbe γ est infinie.

Exercice 6. Dans l’espace euclidien de dimension trois, on considère le segment C =
[A, B], où A et B sont deux points de l’espace.
1. Donner une paramétrisation de la courbe C.
2. Donner une paramétrisation par abscisse curviligne de a courbe C.
3. Quelle est la courbure de cette courbe ?
4. Quelle est sa torsion ?
Exercice 7. Calculer la longueur de l’arc de parabole y = x2 entre les points (0, 0) et
(0, 1).
Exercice 8. Calculer la longueur des courbes suivantes
— La courbe paramétrée par t ∈ [−1, 2] 7→ (3t, 3t2 ).
— La courbe paramétrée par t ∈ [0, π] 7→ (cos t + cos2 t, sin t + sin t cos t).
Exercice 9. Déterminer une abscisse curviligne de la courbe paramétrée
(
x(t) = t − sh(t)ch(t)
γ(t) =
y(t) = 2ch(t)(t)
Exercice 10. On considère l’ellipse d’équation
x2 y 2
+ 2 = 1.
a2 b
1. Donner une paramétrisation de l’ellipse.
2. Calculer la longueur de l’ellipse.
3. Calculer la courbure de l’ellipse en tout point.
4. Quels sont les points les plus courbés ?
5. Que pouvez-vous dire de la torsion de l’ellipse ?
Exercice 11. Calculer la courbure et la torsion des courbes paramétrées γi : R → R3
suivantes (avec i ∈ {1, 2, 3, 4}) :
1. γ1 (t) = (t, t + 1, 1 − t2 ).
30
2. γ2 (t) = (a(t − sin(t)), a(1 − cos(t)), bt), avec a ∈ R et b ∈ R.

√
3. γ3 (t) = (et , et , 2t).
4. γ4 (t) = (et sin(t), et cos(t), et ).
Exercice 12. Déterminer la courbure et la torsion de la courbe paramétrée γ : R → R3

donnée pour tout t ∈ R par γ(t) = (t3 , t, t2 ).
Exercice 13. Soit γ : I → R2 une courbe paramétrée par abscisse curviligne, régulière
et de classe C 2 . On suppose qu’il existe une application ϕ : I → R telle que pour tout
t ∈ I γ(t) = (t, ϕ(t)).
1. Montrer que la courbure algébrique de la courbe est donnée par
ϕ00
κ= 3 .
(1 + ϕ02 ) 2
2. À quelle condition γ est-elle paramétrée par abscisse curviligne ?

3. Expliquer le résultat précédent à partir d’un dessin.
Exercice 14. Une courbe plane est souvent définie en coordonnées polaires par r = r(θ).
Autrement dit, la paramétrisation de la courbe est de la forme :
γ(θ) = (r(θ) cos θ, r(θ) sin θ),
où θ appartient à un intervalle I de R.
1. Calculer la longueur d’arc en coordonnées polaires.
2. Calculer la courbure en coordonnées polaires.
Exercice 15 (Caractérisation de la torsion). Soit γ : I → R3 une courbe paramétrée

régulière de classe C 3 dont tous les points sont biréguliers. Montrer que :
la courbe γ est plane ⇐⇒ ∀t ∈ I, τ (t) = 0.
(Indication : on pourra prendre une paramétrisation par abscisse curviligne.)
Exercice 16 (Courbes cycloïdales). Soit a ∈ [0, 1] et γa : R → R2 la courbe définie par

γa (t) = (t − a sin t, 1 − a cos t). Cette courbe paramétrise le trajet d’un point d’une roue
(de rayon 1), lorsque celle-ci se déplace en ligne droite. Ce point se situe à une distance
a du centre de la route.
1. Montrer que γa est régulier en 0 si et seulement si a 6= 0.
2. Pour a = 1 et a = 1/2, déterminer l’allure locale de la courbe au voisinage de 0.
3. Tracer les deux courbes correspondants à a = 1 et a = 1/2.
31
Exercice 17 (La tractrice ou "courbe du chien"). La tractrice est la courbe paramétrée

γ :]0, π/2[→ R2 donnée pour tout t ∈]0, π/2[ par :
t

γ(t) = sin t, cos t + ln tan .
2
1. Montrer que γ est régulière.
2. Déterminer une équation paramétrique de la droite Dt tangente à γ au point
γ(t).
3. On note pt le point d’intersection des droites Dt et (0y). Montrer que le segment
[γ(t), pt ] est de longueur 1.
4. Dessiner cette courbe. Pourquoi, à votre avis, cette courbe s’appelle-t-elle aussi
la courbe du chien ?
Exercice 18 (Interpolation d’Hermite). On s’intéresse au problème suivant : étant donné
→
− →
−
deux points p et q du plan, et deux vecteurs tp et tq , on cherche une courbe paramétrée
→
−
joignant p à q dont la dérivée (à droite) en p vaut tp et la dérivée (à gauche ) en q vaut
→
− →
−
tq . On note (xp , yp ), (xq , yq ), (up , vp ) et (uq , vq ) les coordonnées respectives de p, q, tp
→
−
et tq . On suppose que xp 6= xq , up = vp = 1.
1. Montrer qu’il existe un unique polynôme P1 tel que
P1 (xp ) = 1 et P10 (xp ) = P10 (xq ) = P1 (xq ) = 0.
2. Montrer qu’il existe un unique polynôme P2 tel que
P20 (xp ) = 1 et P20 (xq ) = P1 (xp ) = P1 (xq ) = 0.
3. Déterminer un polynôme P de degré trois tel que
P (xp ) = yp , P (xq ) = yq , P 0 (xp ) = vp et P 0 (xq ) = vq .
4. Que pouvez-vous dire de la courbe paramétrée γ : t ∈ [xp , xq ] 7→ (t, P (t)) ?
Exercice 19 (Polynôme de Bézier). On considère la courbe plane paramétrée qui à
t ∈ [0, 1] associe γ(t) = (t, t2 ). On rappelle que l’ensemble des polynômes de degré
inférieur ou égaux à 2 est une R-espace vectoriel de dimension 3, dont la base des
monômes (e0 , e1 , e2 ) est :
e0 : t 7→ 1 e1 : t 7→ t e2 : t 7→ t2 .
On définit les polynômes de Bernstein pour tout t ∈ R par :
B02 (t) = (1 − t)2 , B12 (t) = 2t(1 − t), B22 (t) = t2 .
1. Déterminer des points P0 , P1 , P2 tels que γ = P0 e0 + P1 e1 + P2 e2 .

2. Déterminer des points Q0 , Q1 , Q2 tels que γ = Q0 B02 + Q1 B12 + Q2 B22 .
3. Que représentent les points Q0 et Q2 pour γ ?
4. Que représente le vecteur Q1 − Q2 et Q2 − Q1 pour γ ?
32
Exercice 20 (Difficile). On considère une courbe paramétrée par abscisse curviligne,

birégulière γ : I ⊂ R → R3 de classe C 3 (avec I un intervalle de R). On suppose que la
torsion τ ne s’annulle pas. On note κ la courbure et (T, N, B) la base de Serret-Frenet.
Par définition, on dit que γ est une hélice généralisée s’il existe un vecteur constant V0
tel que pour tout s ∈ I l’angle entre les vecteurs T (s) et V0 est constant.
Le but de cet exercice est de donner des caractérisations des hélices généralisées.
1. Dessiner une hélice généralisée.
2. On suppose que γ est une hélice généralisée. Montrer que le rapport κτ est
constant. (indication : on pourra dériver deux fois le produit scalaire de T (s)
et V0 ).
3. Réciproque : on suppose maintenant que le rapport κτ est constant. Montrer que
γ est une hélice généralisée. (indication : on pourra chercher V0 sous la forme
T (s) + λB(s) avec λ ∈ R)
4. Montrer que γ est une hélice généralisée si et seulement si N appartient à un
plan vectoriel constant.
5. Montrer que γ est une hélice généralisée si et seulement si il existe un vecteur
constant W0 tel que pour tout s ∈ I l’angle entre les vecteurs B(s) et V0 est
constant.
Exercice 21 (Difficile). On considère une courbe γ : I ⊂ R → R3 paramétrée par

abscisse curviligne (avec I un intervalle de R). On rappelle qu’un point γ(s) est dit
birégulier si γ 00 (s) 6= 0. En un point birégulier γ(s), on note (γ(s), T (s), N (s), B(s)) le
repère de Serret-Frenet.
On suppose tout d’abord que pour tout s ∈ I, γ(s) est inclus dans une sphère de rayon
R et de centre O.
a) Montrer que pour tout s ∈ I, γ(s) appartient au plan vectoriel engendré par
N (s) et B(s)
b) Montrer que γ est une courbe birégulière.
(Indication pour a) et b) : on pourra dériver s 7→ kγ(s)k2 ).
On suppose maintenant en plus que la torsion τ ne s’annulle pas. On pose alors ρ = 1/k
et σ = 1/τ .
c) Montrer que pour tout s ∈ I, < γ(s), N (s) >= −ρ(s).
d) En dérivant l’expression précédente, exprimer γ(s) comme combinaison linéaire
de N (s) et B(s).
e) En déduire que l’on a :
!2
dρ
ρ2 + σ 2 = constante
ds
33
Exercice 22 (Difficile). On s’intéresse ici à la réciproque de l’exercice 21. On considère

une courbe γ : I ⊂ R → R3 paramétrée par abscisse curviligne (avec I un intervalle de
R). On rappelle qu’un point γ(s) est dit birégulier si γ 00 (s) 6= 0. En un point birégulier
γ(s), on note (γ(s), T (s), N (s), B(s)) le repère de Serret-Frenet.
On suppose que :
i) γ est une courbe birégulière ;
ii) la torsion τ de γ ne s’annulle pas ;
iii) ρ0 ne s’annulle pas (avec ρ = 1/k) ;
iv) on a l’équation :
!2
2 2 dρ
ρ +σ = constante.
ds
Le but de cette partie est de montrer que la courbe γ est inclue dans une sphère.
1. Montrer que la dérivée de la fonction
dρ
s 7→ γ(s) + ρ(s)N (s) + σ(s) (s)B(s)
ds
est nulle.
2. En déduire qu’il existe un point Ω de R3 tel que kγ(s) − Ωk soit constant.
3. Conclure.
Surfaces
Exercice 23. Trouver une équation du plan tangent pour chaque surface ci-dessous, au
point (x0 , y0 , z0 )
√
1. f : (x, y, z) 7→= (x, y, 21 − x2 − y 2 ) avec (x0 , y0 , z0 ) = (1, 2, 4).
2. f : (x, y) 7→ (15x − 2y, 3x + 17y + 9, 23x + 17y + 22) avec (x0 , y0 , z0 ) = f (2, 3)
Exercice 24. On demande à un étudiant de donner une équation du plan tangent à la

surface paramétrée f : (x, y) 7→ (x2 − 3y, 2x3 − y 4 , x) au point f (0, 0). Sa réponse est
z = 4x2 − 3y 2 .
1. Expliquer, sans calcul, pourquoi la réponse est mauvaise.
2. Donner la réponse exacte.
Exercice 25. Calculer l’aire des surfaces paramétrées suivantes :

1. f : (t, θ) ∈]0, π[×]0, 2π[7→ (R cos t cos θ, R cos t cos θ, R sin t) avec R ∈ R.
2. f : (t, θ) ∈]0, H[×]0, 2π[7→ (a cos θ, a sin θ, t) (avec a, H ∈ R)
3. f : (t, θ) 7→ ((2 + cos t) cos θ, (2 + cos t) cos θ, sin t).
34
Exercice 26. Soient a et b deux nombres réels et f : R2 → R3 la surface paramétrée

par !
x2 y 2
f (x, y) = x, y, 2 − 2 .
a b
Montrer que l’intersection du plan tangent avec le support géométrique de la surface
est la réunion de deux droites sécantes.
Exercice 27. Soient a et b deux nombres réels, f1 : R2 → R3 et f2 : R2 → R3 les
surfaces paramétrées par
! !
x2 y 3 x2 y 4
f1 (x, y) = x, y, 2 − 2 et f2 (x, y) = x, y, 2 − 2
a b a b
1. Pour i ∈ {1, 2}, déterminer l’espace tangent à la surface fi au point m =

fi (0, 0) = (0, 0, 0).
2. Donner la deuxième forme fondamentale en m dans chacun des deux cas.
3. Quel est la position par rapport au plan tangent au point m dans chacun des
deux cas.
4. Que pouvez-vous en déduire ?
Exercice 28. Les deux surfaces paramétrées suivantes ont-elles le même support géo-
métrique ?
1. f1 : R2 → R3 définie par f1 (x, y) = (x, y, x2 + y 2 )
2. f2 : R2 → R3 définie par f2 (t, θ) = (t cos θ, t sin θ, t2 )
Exercice 29. Une surface de révolution d’axe (0z) est une surface paramétrée de la
forme
f (t, θ) = (α(t) cos θ, β(t) sin θ, β(t))
avec θ ∈ [0, 2π[, α : I → R et β : I → R.
1. Pourquoi une telle surface s’appelle-t-elle “surface de révolution" ?
2. Calculer la deuxième forme fondamentale.
3. En déduire les deux courbures principales.
4. Application : calculer avec cette méthode les courbures principales de la sphère.
Exercice 30 (Difficile). On considère la surface paramétrée f : [0, 2π] × R → R3 donnée
par :
f (s, v) = (cos s, sin s, 0) + v(− sin s, cos s, 1).
1. Cette surface est dite réglée. Voyez-vous pourquoi ? Donner une description géo-
métrique de cette surface basée sur des droites.
2. Notons x(s, v) y(s, v) et z(s, v) les coordonnées de f (s, v). Calculer x(s, v)2 +
y(s, v)2 − z(s, v)2 . Qu’en déduisez-vous ?
35
3. Une surface de révolution est obtenue en faisant tourner une courbe autour d’un
axe (voir l’exercice précédent pour une paramétrisation). Cette surface est-elle
une surface de révolution ? Si oui, donner l’axe de révolution ainsi que l’équation
d’une courbe plane qui engendre la surface.
4. Calculer la deuxième forme fondamentale.
5. Que pouvez-vous dire du signe du produit des courbures principales ?
2.3 QCM
rapporte 2 points.
Question 1.
A La longueur de la courbe γ : t ∈ [−2π, 2π[7→ (R sin t, R cos t, 1) est 2πR.
B La longueur de la courbe γ : t ∈ [−2π, 2π[7→ (R sin t, R cos t, 2) est 4πR.
√
C La longueur de la courbe γ : t ∈ [0, 2π[7→ (R sin t, R cos t, 2t) est 2π R2 + 2.
D La longueur de la courbe γ : t ∈ [0, 3[7→ (t, 2t2 ) est sh(2argsh(12))
16
+ argsh(12)
8
.
E La longueur de la courbe γ : t ∈ [0, 2π[7→ (t − sin t, 1 − cos t) est 10.
Question 2. On considère la courbe paramétrée

2
γ: R → R(
(t2 , t2 ) si t ≥ 0
t 7→
(t2 , −t2 ) si t < 0
A La courbe γ est régulière.

B La courbe γ admet une tangente en tout point.
C La courbe γ est de classe C 1 .
D La courbe γ est de classe C 2 .
E La droite tangente au point de paramètre π passe par 0.
γ : R → R2
t 7→ (t − sh t ch t, 2ch t)
A Une abscisse curviligne est donnée par s(t) = sh2 (t) pour tout t ∈ R
B Une abscisse curviligne est donnée par s(t) = sh2 (t) si t ≥ 0 et par s(t) =
−sh2 (t) si t < 0.
36
C La courbe est de classe C 3

D La courbe paramétrée γ est régulière.
E La droite tangente au point de paramètre 1 est horizontale.
Question 4. On considère la courbe γ : R → R3 paramétrée par abscisse curviligne

régulière de classe C 3 .
A La courbe est plane si et seulement si sa torsion est nulle.
B La courbe est inclus dans une sphère si et seulement si sa courbure est constante.
C La courbe est inclus dans un cercle si et seulement si sa courbure est constante.
D Si la courbe a un une courbure nulle, alors elle a un point d’inflexion.
E La longueur de la courbe entre les paramètres −10 et 10 est forcément finie.
γ : R → R2
t 7→ (t2 − 2t3 , 5t3 + 1)
A La droite tangent au paramètre t = 0 est verticale.

B La droite tangente au point de paramètre t = 1 a pour équation
(
x = −1 − 4u
avec u ∈ R
y = 6 + 15u
C La droite tangente au point de paramètre t = 1 a pour équation

(
x = −5 − 4u
avec u ∈ R
y = 2 + 5u
D La droite tangente au point de paramètre t = 0 a pour équation

(
x=u
avec u ∈ R
y=0
E La droite tangente au point de paramètre t = 1 a pour équation

(
x = u2 + 1
avec u ∈ R
y=1
Question 6.
D La longueur de la courbe γ : t ∈ [0, 2[7→ (t, 2t2 ) est sh(2argsh(4))
16
+ argsh(4)
8
.
3 3
B La longueur de la courbe γ : t ∈ [0, 2[7→ (cos t, sin t) est 2π.
C La courbure de la courbe γ : t ∈ [0, 2π[7→ (R sin t, R cos t, 2t) est constante égale
R
à 4+R 2.
37
D La torsion de la courbe γ : t ∈ [0, 2π[7→ (R sin t, R cos t, 2t) est constante égale
R
à 4+R 2.
E La développée de la courbe γ : t ∈ [0, 2π[7→ (R sin t, R cos t, 2t) est une hélice.
Question 7. On considère la surface paramétrée f : (x, y) ∈ R2 7→ (x2 +3, x2 −y 2 , 5x2 +

7)
A Le support de f est inclus dans un plan affine.
B Le support de f est inclus dans un paraboloïde.
C La surface paramétrée f est régulière.
D La surface paramétrée f admet une reparamétrisation régulière.
E La courbure de cette surface est non nulle aux points de paramètres (x, y) 6=
(0, 0).
Question 8. On considère la surface paramétrée
f : (x, y) ∈ R2 7→ (5x − 3y 2 + 3, −x + y 2 , 3x − 4y 2 )
A L’espace tangent au point de paramètres (0, 0) est donné par



 3 + 5u
−u avec u, v ∈ R2


3u
B L’espace tangent au point de paramètres (1, 1) est donné par



 3 + 5u − 6v
−u + 2v avec u, v ∈ R2
3u − 8v


C L’espace tangent au point de paramètres (0, 1) est donné par



 −6v
1 + 2v avec u, v ∈ R2
−4 − 8v


D L’espace tangent au point de paramètres (1, 0) est donné par



 5u − 6v
−u + 2v avec u, v ∈ R2
3u − 8v


E La surface est régulière en tout paramètres (x, y) 6= (0, 0).
38
Question 9. Soit f : R×R2 ×R2 → R3 la surface paramétrée par f (x, y) = (x, y, 15x2 +
13y 3 + 7).
A Le plan tangent en f (0, 0) est horizontal.
B Le plan tangent en f (0, 0) traverse la surface.
C Les deux courbures principales en f (0, 0) sont strictement positives.
D La surface est un paraboloïde de révolution.
E Le plan tangent en f (0, 0) passe par le point (0, 0, 0).
Question 10. Soit f : R×[0, 2π] → R3 la surface paramétrée par f (t, θ) = (t cos θ, t sin θ, t).
A Le support géométrique est un cylindre.

B Le support géométrique est un cône.
C La paramétrisation est régulière en tout point.
D La paramétrisation admet un espace tangent en (0, 0, 0).
E Il existe une infinité de points réguliers.
Réponses : 1–BD 2–CE 3–BC 4–AE 5–BC 6–CE 7–AD 8–AC 9–AB 10–BE
2.4 Devoir
Essayez de bien rédiger vos réponses, sans vous reporter ni au cours, ni au corrigé.
Si vous souhaitez vous évaluer, donnez-vous deux heures ; puis comparez vos réponses
avec le corrigé.
Question de cours : Soit γ : I ⊂ R → R3 une courbe paramétrée de classe C 3 , dont

tous les points sont biréguliés.
— Donner la définition du repère de Serret-Frenet.
— Donner les formules de Serret-Frenet.
Exercice 1. Montrer que les courbes planes régulières de classe C 2 à courbure constante
sont des arcs de cercle.
(On pourra considérer les paramétrisations par abscisse curviligne et montrer que le
centre de courbure est constant.)
Exercice 2. Soient R et a deux nombres réels. On considère la courbe paramétrée

suivante :
γ : R → R3
t 7→ (R cos t, R sin t, at)
1. Que représente géométriquement cette courbe ?
2. Déterminer une paramétrisation par abscisse curviligne.
39
3. Calculer le repère de Serret-Frenet.

4. Calculer la courbure κa de γ en tout point. Que remarquez-vous ?
5. Calculer la torsion τa de γ en tout point ? Que remarquez-vous ?
6. Calculer les limites
lim κa et lim τa
a→0 a→0
Pouvait-on s’attendre à ce résultat ?

Exercice 3. On prend deux nombres réels 0 < r < R. On considère le tore de révolution
f : [0, 2π[×[0, 2π[→ R3 paramétré par
 
(R + r cos u) cos v
f (u, v) =  (R + r cos u) sin v 

.
r sin u
1. Représenter cette surface en 3D. Pourquoi, à votre avis, cette surface est-elle
dite "de révolution" ?
2. Calculer l’aire de cette surface.
3. Que représentent géométriquement les courbes C1 = {f (0, v), v ∈ [0, 2π[} et
C2 = {f (u, 0), u ∈ [0, 2π[} ?
4. Montrer que les vecteurs tangents à ces courbes au point d’intersection m =
f (0, 0) sont orthogonaux.
5. Calculer en tout point m de la surface la deuxième forme fondamentale IIm ,
ainsi que les courbures et directions principales.
6. En tout point m = f (u, v) de la surface, calculer le produit Gm des deux cour-
bures principales.
— Déterminer les points m pour lesquels Gm > 0
— Déterminer les points m pour lesquels Gm < 0
— Déterminer les points m pour lesquels Gm = 0
7. Interpréter géométriquement ces résultats.

Exercice 1. Prenons une courbe plane régulière de classe C 2 à courbure constante κ et
considérons une paramétrisation γ : I → R2 par abscisse curviligne. Par définition, le
centre de courbure en γ(t) est donné par :
1→−
C(s) = γ(s) + N (s).
κ
1→−0
C 0 (s) = γ 0 (s) + N (s).
κ
40
→
− →
−
Or les formules de Serret-Frenet indiquent que N 0 (s) = −κ(s) T (s), et donc
→
− →
−
C 0 (t) = T (s) − T (s) = 0.
Le centre de courbure C(s) est donc constant égal à C0 . Donc pour tout s ∈ I
1 →− 1

kγ(s) − C0 k = k N (s)k = .

κ κ
Le point γ(s) appartient donc au cercle de centre C0 et de rayon 1/κ. Comme l’appli-
cation γ est continue (et que I est un intervalle), le support géométrique est un arc de
cercle.
Exercice 2.
1. Le support géométrique de cette courbe est une hélice (Figure 12).
Figure 12 – Hélice
2. Il faut tout d’abord calculer une abscisse curviligne. On choisit le paramètre

t0 = 0 et on calcule la fonction st0 : R → R donnée par
Z t Z t√ √
st0 (t) = kγ 0 (u)k du = R2 + a2 du = R2 + a2 t.
0 0
Nous remarquons que l’application st0 : R → R est un C 1 -difféomorphisme. La

paramétrisation par abscisse curviligne γe = γ ◦ s−1
t0 est donc donnée par

√ s

R cos
R2 +a2
!
s
γe (s) = γ √
 
= R sin √R2s+a2 .
R 2 + a2  
a √R2s+a2
41
→
− →
− →
−
3. Calculons le repère (γe (s), T (s), T (s), T (s)) de Serret-Frenet en tout point de
paramètre s. On a :
 
−R sin √ s
→
− 1 R2 +a2
T (s) = γe 0 (s) = √ 2
 
 R cos √R2s+a2 .
R + a2  
a
D’autre part, on a :
 
−R cos √ s
1 R2 +a2
γe 00 (s) =
 
 −R sin √R2s+a2 .
R2 + a2  
0
On en déduit que γ 00 (s) ne s’annulle jamais et que tout point est birégulier.
 
− cos √ s
→
− γe 00 (s)  R2 +a2 
N (s) = 00 = − sin √R2s+a2 .
kγe (s)k  
0
 
√ s
a sin
→
− →
− →
− 1 R2 +a2
B (s) = T (s) ∧ N (s) = √ 2
 
 −a cos √R2s+a2 .
R + a2  
R
4. La courbure est donnée par :
R
κa (s) = kγe 00 (s)k = .
R2 + a2
On remarque que cette courbure est constante.
→
− →
−
5. La torsion est donnée par la formule τ (s) = B 0 (s). N (s). Or on a
 
a cos √R2s+a2
→
−0 1 
 a sin √ s

B (s) = 2 2
,
R +a  2
R +a2 
0
ce qui donne
→
− →
− −a
τa (s) = B 0 (s). N (s) = .
R2 + a2
En passant à la limite, on a :
6.
lim κa = et lim τa = 0
a→0 a→0
On observe que la courbe γ tend vers une paramétrisation du cercle quand a
tend vers 0. On observe également que la courbure κa tend vers la courbure R1
du cercle et que la torsion τa (s) tend vers la torsion du cercle qui vaut 0.
42
Exercice 3.
1. Cette surface est appelée surface de révolution, car elle est obtenue en faisant
tourner un cercle de rayon r paramétré par
u ∈ [0, 2π[7→ (R + r cos u, 0, r sin u)
autour de l’axe (0, 0, 1) (Voir Figure 13).
Figure 13 – Tore de révolution (image prise sur wikipedia)
2. L’aire de cette surface est donnée par

Z 2π Z 2π
∂f
Z 2π Z 2π
∂f
Aire = (u, v) ∧ (u, v) dxdy = |r(R + r cos u)| dudv = 4π 2 rR.

0 0 ∂u ∂v 0 0
3. La courbe C1 est le cercle de centre (0, 0, 0) et de rayon (R + r). La courbe C2

est le cercle de centre (R, 0, 0) et de rayon r.
4. Les deux cercles C1 et C2 s’intersectent au point m = (R + r, 0, 0). Un vecteur
tangent à la courbe C1 au point m est donné par ∂f∂u
f (0, 0) et un vecteur tangent à
∂f
la courbe C2 au point m est donné par ∂v f (0, 0). Calculons ces dérivées partielles
pour tout (u, v) :
   
−r sin u cos v −(R + r cos u) sin v
∂f ∂f
(u, v) =  −r sin u sin v  (u, v) =  (R + r cos u) cos v 
   
∂u ∂v
r cos u 0
On remarque que pour tout (u, v) ∈ [0, 2π[×(0, 2π[, on a

∂f ∂f
(u, v). (u, v) = 0.
∂u ∂v
On en déduit que ces deux vecteurs sont orthogonaux. En particulier, les vecteurs
tangents aux deux cercles C1 et C2 au point d’intersection m = f (0, 0) sont
orthogonaux.
43
5. On note K(u, v) le vecteur orthogonal à l’espace tangent Tm S à la surface au

point m = f (u, v) donné par :
∂f ∂f
(u, v) ∧ ∂v (u, v)
K(u, v) = ∂u .
∂f ∂f
∂u (u, v) ∧ ∂v (u, v)

En reprenant les formules ci-dessus, on a

 
cos u cos v
∂f ∂f
(u, v) ∧ (u, v) = −r(R + r cos u)  cos u sin v 
 
∂u ∂v
sin u
et donc on a :  
− cos u cos v
K(u, v) =  − cos u sin v 
 
− sin u
On a donc :
   
−r cos u cos v − cos u cos v
∂ 2f
L(u, v) = 2
(u, v).K(u, v) = 
−r cos u sin v   − cos u sin v  = r.
.
  
∂u

−r sin u − sin u
   
2 r sin u sin v − cos u cos v
∂ f
M (u, v) = (u, v).K(u, v) =  −r sin u cos v  .  − cos u sin v  = 0.
   
∂u∂v
0 − sin u
   
2 −(R + r cos u) cos v − cos u cos v
∂ f
 −(R + r cos u) sin v  .  − cos u sin v  = (R+r cos u) cos u.
N (u, v) = 2 (u, v).K(u, v) =    
∂v
0 − sin u
Comme M (u, v) = 0, cela signifie que ladeuxième fondamentale II(u, v) est
diagonale dans la base ∂f ∂u
(u, v), ∂f
∂v
(u, v) . Or cette base est orthogonale car
∂f ∂f
les deux vecteurs ∂u (u, v) et ∂v (u, v) sont orthogonaux. Les deux directions
principales sont donc
   
∂f − sin u cos v ∂f − sin v
(u, v) (u, v)
e1 = ∂u =  − sin u sin v 

et e2 = ∂v =  cos v 

.
∂f  ∂f
∂u (u, v) ∂v (u, v)

cos u 0
Les courbures principales associées sont
L(u, v) 1 N (u, v) cos u

λ1 = 2 = et λ2 = 2 = .
∂f
∂u (u, v)
r ∂f
∂v (u, v)
R + r cos u
44
6. La courbure de Gauss Gm = G(u, v) est donnée par

cos u
Gm = λ1 λ2 = .
r(R + r cos u)
On a donc
Gm > 0 ⇐⇒ cos u > 0 ⇐⇒ u ∈ [0π/2[∪[3π/2, 2π[
Gm < 0 ⇐⇒ cos u < 0 ⇐⇒ u ∈]π/2, 3π/2[
Gm > 0 ⇐⇒ cos u = 0 ⇐⇒ u ∈ {−π/2, π/2}
L’ensemble des points où la courbure s’annulle est l’union des deux cercles ho-
rizontaux de rayon R formés par les points d’altitude la plus haute z = r et la
plus basse z = −r. Cet ensemble s’écrit :
     

 R cos v   R cos v
[ 

 , v ∈ [0, 2π[
R sin v   R sin v  , v ∈ [0, 2π[ .
  

−r
   

r   
L’ensemble des point m où Gm > 0 est la partie "extérieure" de la surface bordée

par ces deux cercles. En effet, on observe que le plan tangent en tout point de
cette partie là est d’un même coté de la surface. L’ensemble des point m où
Gm < 0 est la partie "intérieure" de la surface bordée par ces deux cercles. En
effet, on observe que le plan tangent en tout point de cette partie là traverse la
surface.
3 Compléments
3.1 Courbes de Bézier
Les courbes de Bézier sont des courbes paramétrées polynômiales qui ont été dé-
couvertes par l’ingénieur français Pierre Bézier (1910-1999) dans les années 60. Elles
ont joué un rôle important dans le développement des logiciels de CAO, ont donné
naissance à de nombreux objets mathématiques et sont encore utilisées dans des lo-
giciels de dessin vectoriel. Pierre Bézier (pour plus de renseignements, on peu aussi
regarder le site http://rocbo.lautre.net/bezier/pb-indus.htm) a travaillé chez
Renault toute sa carrière. Une de ses préoccupation était de créer un moyen simple de
modéliser des formes à partir de machines à commande numérique. L’idée lumineuse
qu’il a eu consiste à exprimer une courbe comme combinaison linéaire de points (ap-
pelés points de contrôles). Ceci est bien illustré sur la Figure 14 : à gauche, on a des
points (ordonnés) ; à droite, on a une courbe dont les extrémités sont deux points de
cette courbe et qui est "attirée" par les autres points.
La définition de ces courbes est assez simple et utilise les polynômes de Bernstein.
La courbe de Bézier associée à n + 1 points P0 , ..., Pn de R2 est la courbe paramétrée
45
Figure 14 – Points de contrôles P0 , P1 , P2 , P3 , P4 (à gauche) et courbe de Bézier

associée (à droite)
P : [0, 1] → R2 donnée pour tout t ∈ [0, 1] par :

n
Bin (t)Pi ,
X
P (t) =
i=0
où Bin est le polynôme de Bernstein Bin : t 7→ Cin ti (1 − t)n−i . La courbe de Bézier a

des propriétés assez sympathiques :
— Elle a pour extrémités les points P0 et P1 (P (0) = P0 et P (1) = Pn ).
−−→
— Le vecteur P0 P1 est tangent à la courbe de Bézier au point de paramètre t = 0.
−−−−→
— Le vecteur Pn−1 Pn est tangent à la courbe de Bézier au point de paramètre
t = 1.
— La courbe est "attirée" par les points P1 ,...,Pn−1 (cette propriété est précisée
ci-dessous).
— La courbe de Bézier ne dépend pas du repère choisi. Si on effectue une rotation
des points de contrôles, la forme de la courbe de Bézier reste la même.
Les points P0 , ..., Pn sont appelés points de contrôles de la courbe de Bézier, ce qui
est assez naturel. En effet, la courbe dépend de ces points. Quand on les bouge, on
modifie la courbe qui est "attirée" par ces points. Plus précisément, chaque point P (t0 )
de la courbe de Bézier est combinaison linéaire des points de contrôles P0 ,...,Pn :
n
avec λi = Bin (t0 ).
X
P (t0 ) = λi Pi ,
i=0
En fait, les propriétés sympathiques des courbes de Bézier proviennent de propriétés

sur les polynômes de Bernstein, comme par exemple celle de la partition de l’unité :
n
Bin (t) = 1.
X
∀t ∈ [0, 1]
i=1
On peut remarquer que cette propriété implique que le point P (t0 ) dans la formule
ci-dessus est barycentre des points P0 ,...,Pn .
46
Figure 15 – Polynômes de Bernstein dans le cas n = 2 (à gauche), n = 3 (au milieu)

et n = 4 (à droite)
Les courbes de Bézier forment un outil de base qui est utilisé pour définir d’autres
notions utiles en modélisation. C’est le cas par exemple des courbes B-splines, beaucoup
utilisées dans les logiciels de dessin, qui sont des courbes obtenues en mettant "bout à
bout" des courbes de Bézier.
3.2 Theorema Egregium de Gauss

Le theorema egregium 1 est un important théorème de géométrie dû à Carl Friedrich
Gauss (1977-1855) qui porte sur la courbure de Gauss des surfaces. Dans cette partie,
on va essayer de comprendre ce que signifie ce théorème. On a vu dans la section 1.4
que la courbure de Gauss d’une surface en un point est le produit des deux courbures
principales en ce point (Figure 16).
Figure 16 – La courbure de Gauss G(p) au point p est le produit des deux courbures
principales λ1 (p) et λ2 (p) (λ1 (p) est la courbure de la courbe bleue au point p et λ2 (p)
est la courbure de la courbe rouge au même point p).
Le Theorema egregium peut s’énoncer de la manière suivante :

1. Gauss a lui-même qualifié son résultat de "egregium", ce qui signifie "excellent".
47
Théorème 3. La courbure de Gauss d’une surface est invariante par isométrie locale.
Ce résultat nous indique que si on modifie une surface sans modifier ses longueurs,
alors sa courbure de Gauss est inchangée. La courbure de Gauss est donc une courbure
qui ne dépend pas de la forme de la surface, mais juste des distances mesurées sur cette
surface.
Ce résultat est un résultat important de géométrie différentielle. On peut essayer de
le comprendre au travers de l’exemple de l’hélicoïde et de la caténoïde. Une caténoïde et
une hélicoïde sont représentées sur la Figure 17. Il est possible transformer la caténoïde
en l’hélocoïde de manière continue et sans modifier les distance, comme illustré sur
la Figure 18. Le théorème de Gauss implique alors que ces deux surfaces (qui sont
isométriques) ont des courbures de Gauss identiques.
Figure 17 – Caténoïde (à gauche) et hélicoïde (à droite) (source http://en.

wikipedia.org/wiki/File:Helicatenoid.gif)
Figure 18 – De la caténoïde a l’hélicoïde : la transformation se fait en conservant les

distances (source http://en.wikipedia.org/wiki/File:Helicatenoid.gif)
48
3.3 Surfaces développables

Les surfaces développables sont des surfaces qui peuvent être "remises à plat" sans
étirement ni déchirement. Ce type de surface intervient naturellement dans de nom-
breux domaines où la modélisation se fait justement avec des surfaces qui étaient planes
et qui ont été déformées sans que leurs distances ne le soient. Citons plusieurs exemples :
— Une boule de papier froissée peut être modélisée par une surface qui était plane
et qui a été déformée sans étirement ni déchirement.
— Certaines strates géologiques étaient planaires (c’est le cas si les sédiments se
sont déposés sur une roche plane) et se sont déformées au cours du temps sans
trop d’étirement ou de déchirement (cela peut être le cas si la roche est suffi-
semment dure). Elles peuvent être modélisées par des surfaces développables.
— Un vêtement est obtenu à partir d’un patron qui correspond justement à une
surface planaire. Si l’on néglige l’élasticité du vêtement, il est encore naturel
de le modéliser par une surface qui peut être remise à plat sans étirement ni
déchirement, c’est à dire une surface développable.
La modélisation des surfaces développables est un problème compliqué, surtout si
l’on n’impose pas à la surface d’être régulière de classe C 2 . Dans ce cas, le theorema
egregium nous indique que la courbure de Gauss d’une surface développable est forcé-
ment nulle en tout point 2 .
Prenons l’exemple du cône et du cylindre. Ces deux surfaces peuvent être obtenues
en plissant une surface planaire sans étirement ni déchirement : ce sont donc des surfaces
développables (Figure 19). Le theorema egregium de Gauss implique que leur courbure
de Gauss est identiquement nulle. Effectivement, quand on fait directement le calcul de
la courbure de Gauss, on trouve que celle-ci est identiquement nulle : cela provient du
fait qu’une des courbures principales est nulle (celle qui correspond à la courbe rouge
sur la Figure 19).
Figure 19 – Le plan, le cône et le cylindre sont des surfaces développables

2. En fait, en géométrie différentielle, la définition usuelle des surfaces développables est la suivante :
une surface de classe C 2 est dite développable si sa courbure de Gauss est identiquement nulle
49
On remarque sur les exemples de la Figure 19 un fait surprenant : pour tout point
p de la surface, il existe un segment de droite Cp qui contient p et qui est inclus dans
la surface. Une surface qui vérifie cette propriété est dite réglée. Cette constatation est
en fait générale : toute surface régulière de classe C 2 à courbure de Gauss nulle est
réglée. Mais attention, la réciproque n’est pas vraie : il existe des surfaces réglées non
développables (les exemples de la Figure 21 permettent de s’en convaincre).
On peut voir sur les Figures 22 et 23 des exemples de modélisation de surfaces
basées sur les surfaces développables. Dans ces deux cas, la surface sous-jacente n’est
pas régulière de classe C 2 . Un autre domaine où les surfaces développables sont utilisées
est l’architecture. On peut par exemple citer le célèbre architecte Frank Gehry, qui les
utilise dans la conception de ses bâtiments (Figure 24).
Figure 20 – Exemple de surfaces réglées et développables
Figure 21 – Exemple de surfaces réglées non développables
50
Figure 22 – Modélisation d’une feuille de papier (développable) un peu froissée à

partir de son du bord
(source http://www-ljk.imag.fr/Publications/Basilic/com.lmc.publi.PUBLI_Inproceedings@1376f732f04_4b6ccc5c/RCHT_EG11.pdf)
Figure 23 – Modélisation d’un vêtement (développable par morceaux) à partir de son

bord (à gauche)
(source http://www-ljk.imag.fr/Publications/Basilic/com.lmc.publi.PUBLI_Inproceedings@117681e94b6_dffda2/garments.png)
Figure 24 – Musée Guggenheim de Bilbao. Ce bâtiment comporte des bouts de sur-

faces développables (source http://fr.wikipedia.org/wiki/Frank_Gehry)
51
Géométrie affine
Jean-Marc Decauwert
La géométrie affine est l’étude des propriétés géométriques qui sont conservées par
toute transformation affine, comme l’alignement, le parallélisme, les milieux, et plus
généralement les rapports de mesures algébriques pour des points alignés. Le cadre
naturel en est un espace affine, généralisation en dimension quelconque du plan et de
l’espace que vous avez déjà étudiés. Ses éléments sont des points et un espace vectoriel
lui est attaché, qui permet d’associer à tout couple de points un vecteur. La notion de
barycentre, issue de la mécanique, y joue un rôle essentiel, analogue à celui que joue
la notion de combinaison linéaire dans un espace vectoriel. Nous étudierons ensuite
les applications affines : ce sont celles qui conservent les barycentres. Leur importance
vient de ce que la quasi-totalité des transformations géométriques que vous avez pu
rencontrer, en particulier les isométries et plus généralement les similitudes, sont affines.
Mais l’étude des notions spécifiquement euclidiennes, comme celles de distances et
d’angles, sera abordée dans un autre chapitre.
Table des matières

1 Cours 2
1.1 Espace affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Barycentres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Sous-espaces affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Repérage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Convexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.6 Applications affines . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.7 Le groupe affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.8 Homothéties et translations . . . . . . . . . . . . . . . . . . . . . . . . 28
1.9 Projections, symétries, affinités . . . . . . . . . . . . . . . . . . . . . . 30
2 Entraînement 35
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3 Compléments 58
3.1 Notations de Grassmann . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.2 Courbes de Bézier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
8 novembre 2011
Maths en Ligne Géométrie affine UJF Grenoble
3.3 Perspective centrale et géométrie projective . . . . . . . . . . . . . . . . 60

3.4 Desargues dans le plan et dans l’espace . . . . . . . . . . . . . . . . . . 61
3.5 Birapport . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.6 La formule d’Euler pour les polyèdres . . . . . . . . . . . . . . . . . . . 66
3.7 Le théorème fondamental de la géométrie affine . . . . . . . . . . . . . 67
1
1 Cours
1.1 Espace affine
Une fois qu’on a choisi un repère, le plan s’identifie à R2 (resp. l’espace à R3 ),
autrement dit à un espace vectoriel de dimension 2 (resp. 3) sur R muni d’une base
particulière (la base canonique de R2 ou R3 ). On pourrait donc se contenter de faire de la
géométrie dans R2 ou dans R3 . Mais cette identification repose sur le choix d’un repère
et il est souvent plus agréable et plus clair de raisonner de manière intrinsèque. De plus,
se fixer un repère une fois pour toutes n’est souvent pas la meilleure solution : il est
préférable, même quand on calcule en coordonnées, d’avoir la liberté de choisir un repère
bien adapté au problème posé. De fait, le cadre naturel pour faire de la géométrie serait
un espace homogène, dont tous les points jouent le même rôle, ce qui n’est pas le cas
dans un espace vectoriel, où le vecteur nul joue un rôle particulier et tient naturellement
lieu d’origine. Moralement, un espace affine n’est rien d’autre que cela : un espace
vectoriel dont on a oublié où se trouve l’origine. Cette définition est naturellement
beaucoup trop vague pour être utilisable telle quelle. Nous allons commencer par lui
donner un sens précis. Nous verrons alors que tout espace vectoriel est naturellement
muni d’une structure d’espace affine et que, inversement, tout espace affine s’identifie
à un espace vectoriel dès qu’on y choisit une origine (mais cette identification dépend
du choix de l’origine). Mathématiquement, la définition est la suivante :
→
−
Définition 1. Soit E un espace vectoriel sur un corps K. Un espace affine de direction
→
− −−→
E est un ensemble non vide E muni d’une application (M, N ) 7−→ M N de E × E dans
→
−
E vérifiant :
1. pour tout triplet (M, N, P ) de points de E :
−−→ −−→ −−→
M N + N P = M P (relation de Chasles) ;
−−→ →
−
2. pour tout point O de E, l’application M 7−→ OM de E dans E est bijective.
→
−
Les éléments de E s’appellent des points, ceux de E des vecteurs.
→
−
On appelle dimension de l’espace affine E la dimension de l’espace vectoriel E .
Dans le cadre de la géométrie élémentaire usuelle, le corps de base est toujours le
corps R des nombres réels. On supposera donc toujours dans ce qui suit que K = R
(cette hypothèse sera même indispensable dès qu’on abordera les notions de convexité),
mais la plupart des résultats restent vrais si K est le corps des nombres complexes ou
même un corps fini.
→
−
Exemple fondamental. Tout espace vectoriel E est muni d’une structure naturelle
d’espace affine sur lui-même.
→
−
Il suffit de prendre dans la définition E = E et de définir l’application de E × E
→
−
dans E par (~u, ~v ) 7→ ~v − ~u.
2
→
− →
− →
−
Plus généralement, l’image F + ~v = { ~u + ~v | ~u ∈ F } d’un sous-espace vectoriel F
→
− →
−
d’un espace vectoriel E par une translation de vecteur ~v ∈ E est un espace affine de
→
−
direction F . Il suffit ici aussi de considérer l’application (~u1 + ~v , ~u2 + ~v ) 7→ ~u2 − ~u1 .
Réciproquement, le choix d’une origine permet de munir un espace affine d’une
structure d’espace vectoriel : si O est l’origine, il suffit d’identifier un point M de E
−−→
et le vecteur OM . Mais attention : cette structure dépend du choix de l’origine ; on ne
peut définir la somme de deux points d’un espace affine sans se référer explicitement à
une origine, c’est pourquoi on n’additionnera jamais des points.
Figure 1 – L’addition dépend de l’origine.
Exemples en algèbre et en analyse

La structure d’espace affine ne se rencontre pas qu’en géométrie : elle intervient
de manière naturelle dans tous les problèmes linéaires. L’ensemble des solutions d’un
sytème linéaire avec second membre en constitue l’exemple type : ce n’est pas un es-
pace vectoriel, mais c’est un espace affine de direction l’espace vectoriel des solutions
du système homogène associé. De même l’ensemble des solutions d’une équation diffé-
rentielle linéaire avec second membre constitue un espace affine de direction l’espace
vectoriel des solutions du système homogène associé, l’ensemble des suites vérifiant une
relation de récurrence du type un+1 = aun + b constitue un espace affine de direction
l’espace vectoriel des suites vérifiant la relation de récurrence un+1 = aun , l’ensemble
des fonctions f d’une variable réelle vérifiant f (0) = 1 est un espace affine de direction
l’espace vectoriel des fonctions nulles en 0.
Ce dernier exemple est un espace affine de dimension infinie. Nous ne nous intéres-
serons ici qu’à des espaces affines de dimension finie (principalement 2 ou 3). Dans
toute la suite de ce chapitre, espace affine signifiera donc toujours espace
affine de dimension finie.
Définition 2. On appelle droite (resp. plan) affine tout espace affine de dimension 1
(resp. 2).
3
On emploiera parfois le terme espace (sans autre qualificatif) pour désigner un

espace affine de dimension 3, comme dans l’expression géométrie dans l’espace.
Conséquences immédiates de la définition
Proposition 1. Pour tous points M , N , O de E, on a :
−−→
1. M N = ~0 si et seulement si M = N ;
−−→ −−→
2. N M = −M N ;
−−→ −−→ −−→
3. M N = ON − OM .
Démonstration : 1) En faisant N = M dans la relation de Chasles, on voit que

−−→ −−→ −−→ −−→ −−→
M M + M P = M P pour tout point P , d’où M M = ~0. Réciproquement, si M N = ~0,
−−→ −−→ −−→
il résulte de la relation M N = M M et de l’injectivité de l’application N 7→ M N que
N = M.
2) En faisant P = M dans la relation de Chasles, on obtient
−−→ −−→ −−→ ~
MN + NM = MM = 0
−−→ −−→
d’où N M = −M N .
3) Par la relation de Chasles et la propriété précédente
−−→ −−→ −−→ −−→ −−→
M N = M O + ON = ON − OM .
Translations
→
−
Soit E un espace affine de direction E . Pour tout point M de E, l’application
−−→ →
− →
−
N 7→ M N est une bijection de E sur E . Pour tout vecteur ~u de E , il existe donc un
−−→
point N de E et un seul tel que M N = ~u.
→
−
Notation 1. Pour tout point M de E et tout vecteur ~u de E , on note M + ~u l’unique
−−→
point N de E vérifiant M N = ~u.
Avec cette notation, la relation de Chasles s’écrit sous la forme suivante : pour tout
point M et tout couple (~u, ~v ) de vecteurs, on a :
(M + ~u) + ~v = M + (~u + ~v ) .
−−→ −−→
En effet, en posant N = M + ~u et P = N + ~v , on a M N = ~u, N P = ~v et
−−→ −−→ −−→
M P = M N + N P = ~u + ~v .
→
− →
−
Définition 3. Soit E un espace affine de direction E . Pour tout vecteur ~u de E , on
appelle translation de vecteur ~u, et on note t~u , l’application de E dans E qui à tout
point M associe le point M + ~u.
4
Proposition 2. L’ensemble T des translations d’un espace affine E est un sous-groupe

du groupe des permutations de E et l’application ~u 7→ t~u est un isomorphisme du groupe
→
−
additif de E sur T .
Démonstration : La translation de vecteur nul est l’identité, qui appartient donc à T .

La relation de Chasles implique, comme on l’a vu
t~v ◦ t~u = t~u+~v pour tout couple (~u, ~v ) de vecteurs. (∗)
La composée de deux translations est donc une translation, et toute translation t~u
admet une application réciproque, qui est la translation t−~u . Il en résulte que toute
translation est bijective et que T est un sous-groupe du groupe des permutations de E
(applications bijectives de E sur E).
La relation (∗) montre que l’application ~u 7→ t~u est un morphisme du groupe additif
→
−
de E sur T . Ce morphisme est surjectif par définition de T et il est injectif car son
noyau est réduit à ~0 : la translation t~u est l’identité si et seulement si ~u = ~0.
→
−
Remarque : la proposition précédente montre que le groupe additif ( E , +) opère sur
l’ensemble E au moyen des translations ; cette opération est transitive et fidèle.
Bipoints, équipollence
En géométrie élémentaire classique, on commence par introduire les points et on
définit ensuite les vecteurs à partir des points. On suit donc la démarche inverse de la
nôtre.
Dans ce cadre, les vecteurs sont introduits de la manière suivante. On appelle bipoint
un couple de deux points, i.e. un élément du produit cartésien E ×E, où E est le plan ou
l’espace. On dit que deux bipoints (A, B) et (C, D) sont équipollents si le quadrilatère
ABDC est un parallélogramme, i.e. si les bipoints (A, D) et (B, C) ont même milieu.
−→ −−→
On verra plus loin que cette condition équivaut à la relation AB = CD, qui signifie que
c’est la même translation qui transforme A en B et C en D. On montre alors que la
relation d’équipollence est une relation d’équivalence sur E × E et on définit l’ensemble
→
−
E des vecteurs comme l’ensemble quotient de E × E par cette relation d’équivalence.
Dans notre approche, il est immédiat que la relation R définie sur l’ensemble E × E
−→ −−→
par (A, B)R(C, D) si et seulement si AB = CD est une relation d’équivalence et que
→
−
l’ensemble quotient de E × E par cette relation d’équivalence est en bijection avec E :
−→
à la classe d’équivalence d’un bipoint (A, B), on associe le vecteur AB.
1.2 Barycentres
La notion de barycentre est essentielle en géométrie affine. Elle joue un rôle identique
à celui que tient la notion de combinaison linéaire en algèbre linéaire.
5
Définition 4. Un système de points pondérés d’un espace affine E est une famille
finie (Ai , λi )i=1,...,n de couples (Ai , λi ), où, pour tout i, Ai est un élément de E et λi un
n
P
réel. Le poids total du système est le réel λi .
i=1
→
−
À tout système de points pondérés de E, on associe une fonction f~ de E dans E ,
appelée fonction vectorielle de Leibniz du système, par :
n
−−→
f~(M ) =
X
λi M A i .
i=1
Proposition 3. Soit (Ai , λi )i=1,...,n un sytème de points pondérés d’un espace affine E.
1. Si le poids total du système est nul, la fonction vectorielle de Leibniz associée est
constante.
2. Si le poids total du système n’est pas nul, la fonction vectorielle de Leibniz associée
→
−
est une bijection de E sur E . En particulier, il existe un point de E et un seul
où cette fonction s’annule.
Démonstration : Soit O un point fixé de E. On a pour tout point M de E :

n n n
!
−−→ X −−→ −−→ −−→
f~(M ) = λi M O + f~(O) .
X X
λi M Ai = λi (M O + OAi ) =
i=1 i=1 i=1
n
λi = 0, alors f~(M ) = f~(O) pour tout point M de E. Sinon, pour
P
Il en résulte que si
i=1
→
−
tout vecteur ~u de E , il existe un unique point M de E vérifiant f~(M ) = ~u, ce point
−−→ 1 h~ i
étant défini par OM = P n f (O) − ~u .
λi
i=1
Définition 5. Soit (Ai , λi )i=1,...,n un système de points pondérés d’un espace affine E
n
λi 6= 0. On appelle barycentre de ce système l’unique point
P
de poids total non nul :
i=1
n −−→
λi GAi = ~0.
P
G de E vérifiant
i=1
Le barycentre d’un système de points pondérés n’est donc défini que si le poids
total du système n’est pas nul.
Propriétés du barycentre
Proposition 4. 1. Le barycentre ne dépend pas de l’ordre des points.

2. Homogénéité : le barycentre d’un système de points pondérés ne change pas lorsque
l’on multiplie tous les poids par un même réel non nul.
6
3. Associativité : le barycentre d’un système de points pondérés ne change pas lorsque

l’on remplace certains de ces points par leur barycentre affecté de la somme des
coefficients correspondants (à condition naturellement que cette somme ne soit
pas nulle).
4. Si G est le barycentre du système de points pondérés (Ai , λi )i=1,...,n , on a, pour
tout point O de E :
Pn −−→
λ OAi
−→ i=1 i
OG = P n .
λi
i=1
Démonstration : Les deux premières propriétés sont évidentes. Pour démontrer la

troisième, soit G le barycentre du système pondéré (Ai , λi )1≤i≤n . Il suffit de considé-
rer (en réordonnant éventuellement les points) le cas où les points que l’on regroupe
sont A1 , . . . , Ap avec pi=1 λi 6= 0. En notant H le barycentre du système pondéré
P
−−→
(Ai , λi )1≤i≤p , on a alors pi=1 λi HAi = ~0 et
P
p ! n p n
X −−→ X −−→ X −−→ −−→ X −−→
λi GH + λi GAi = λi (GAi + Ai H) + λi GAi
i=1 i=p+1 i=1 i=p+1
n p
X −−→ X −−→
= λi GAi + λi Ai H
i=1 i=1
p
−−→
= ~0 −
X
λi HAi
i=1
= ~0
Pp
ce qui montre que G est le barycentre du système pondéré [(H, i=1 λi ), (Ap+1 , λp+1 ), . . . ,
(An , λn )].
La dernière propriété provient de la relation
n n n n
!
−−→ X −→ −−→ −→ X −−→
λi OAi = ~0 .
X X
λi GAi = λi (GO + OAi ) = λi GO +
i=1 i=1 i=1 i=1
Définition 6. On appelle isobarycentre d’une famille finie A1 , . . ., An de points de E

le barycentre des points de cette famille affectés de poids tous égaux. En particulier, on
appelle milieu d’un couple de points l’isobarycentre de ces deux points.
La notion de milieu est donc purement affine et ne fait pas appel à la notion de
distance, ce qui n’empêche naturellement pas le milieu I d’un couple (A, B) de points
d’être caractérisé, en géométrie euclidienne, par la double égalité IA = IB = AB/2.
7
Notations de Grassmann
Si (Ai , λi )i=1,...,n est un système de points pondérés d’un espace affine E de poids
n
P −→ P n −−→
total λi = 1, le barycentre G de ce système vérifie OG = λi OAi pour tout point
i=1 i=1
n
P
O de E. On le notera G = λi Ai .
i=1
On définit ainsi sans se référer à une origine un calcul sur les points qui satisfait aux
règles habituelles du calcul vectoriel. Par exemple, si G est l’isobarycentre des sommets
d’un triangle ABC, on peut écrire
1 1 1 1 2 1 1 1 2

G= A+ B+ C = A+ B + C = A + A0
3 3 3 3 3 2 2 3 3
1 1
où A0 = B + C est le milieu de BC (cette égalité ne fait que refléter l’associativité
2 2
du barycentre).
Mais attention : cette notation (parfois appelée notation de Grassmann) n’a de
sens que pour un système de points pondérés de poids total 1. L’écriture A + B ou −A
(où A est un point) n’a pas de sens.
On a par ailleurs vu, en étudiant la fonction vectorielle de Leibniz, que si (Ai , αi )i=1,...,n
n
P
est un système de points pondérés de poids total nul : αi = 0, le vecteur ~u défini par
i=1
n
P −−→ n
P
~u = αi OAi ne dépend pas du choix de O. On peut donc noter également ~u = αi Ai .
i=1 i=1
−−−→
Par exemple, si n = 2, α1 = 1 et α2 = −1, A1 − A2 est le vecteur A2 A1 . Mais une
1
expression telle que 2A − 3B, ou A + B, ou A, ne représente ni un point ni un vecteur.
2
1.3 Sous-espaces affines

Définition 7. Une partie F d’un espace affine E est un sous-espace affine de E s’il
→
− −−→
existe un point A de F tel que F = {AM | M ∈ F } soit un sous-espace vectoriel de
→
−
E.
→
−
On a alors F = {A + ~u | ~u ∈ F }.
→
− →
−
Notation 2. Pour tout point A de E et tout sous-espace vectoriel F de E , l’ensemble
→
− →
−
Aff(A, F ) = { A + ~u | ~u ∈ F }
est un sous-espace affine de E. On l’appellera sous-espace affine de E passant par A

→
− →
−
de direction F . Si ~u est un vecteur non nul de E , on notera D(A, ~u) la droite affine
passant par A et de direction la droite vectorielle R~u. De même, si ~u et ~v sont deux
vecteurs linéairement indépendants, on notera P (A, ~u, ~v ) le plan affine passant par A
et de direction le plan vectoriel R~u ⊕ R~v engendré par les deux vecteurs ~u et ~v .
8
→
−
Proposition 5. Soit F = Aff(A, F ) un sous-espace affine de E. On a alors, pour tout
−−→ →
−
point B de F , {BM | M ∈ F } = F .
−→ →
− −−→
Démonstration : Puisque B appartient à F , le vecteur AB appartient à F . Or BM =
−−→ −→ −→ →
− →
− →
−
AM − AB et l’application ~u 7→ ~u − AB est une bijection de F sur F , puisque F est
→
−
un sous-espace vectoriel de E . Il en résulte que
−−→ −−→ −→ −→ →
− →
−
{BM | M ∈ F } = {AM − AB | M ∈ F } = {~u − AB | ~u ∈ F } = F .

→
− →
−
Le sous-espace vectoriel F de E ne dépend donc pas du choix de A dans F . On
l’appelle direction du sous-espace affine F . La restriction de l’application (M, N ) 7−→
−−→ →
−
M N à F × F munit F d’une structure naturelle d’espace affine de direction F . Sa
→
−
dimension dim(F ) est celle de F .
Un sous-espace affine de dimension 0 est constitué d’un point, un sous-espace affine
de dimension 1 est une droite, un sous-espace affine de dimension 2 un plan.
Définition 8. On appelle hyperplan d’un espace affine E de dimension finie tout sous-
espace affine de E de dimension dim(E) − 1.
Caractérisation en termes de barycentres
Proposition 6. Une partie non vide F d’un espace affine E est un sous-espace affine
de E si et seulement si tout barycentre de points de F appartient à F .
Démonstration : Si F est un sous-espace affine de E, A un point de F et (Ai , λi )i=1,...,n

un système de points pondérés de F de poids total non nul, le barycentre G de ce
n
P −−→
λ AAi
−→ i=1 i −→ →
− →
−
système vérifie AG = P n . Il en résulte que AG appartient à F , puisque F est
λi
i=1
→
−
un sous-espace vectoriel de E , et donc que G appartient à F .
Réciproquement, soit F une partie non vide de E telle que tout barycentre de
points de F affectés de coefficients quelconques (de somme non nulle) appartient à F ,
et A un point de F . Pour tout couple (M, N ) de points de F et tout couple (λ, µ) de
−→ −−→ −−→
réels, le point P de E défini par AP = λAM + µAN est le barycentre du système de
points pondérés [(A, 1 − λ − µ), (M, λ), (N, µ)] et appartient donc à F . Il en résulte
→
− −−→ →
− −→ →
−
que F = {AM | M ∈ F } est un sous-espace vectoriel de E (~0 = AA appartient à F ,
qui n’est donc pas vide), et donc que F est un sous-espace affine de E.
9
Parallélisme
Définition 9. Deux sous-espaces affines F et G d’un même espace affine E sont dits
→
− →
−
parallèles s’ils ont même direction : F = G .
Le parallélisme est une relation d’équivalence sur l’ensemble des sous-espaces af-
fines de E. Deux sous-espaces affines parallèles, au sens de cette définition, ont même
dimension.
→
− →
−
Si deux sous-espaces affines F et G d’un même espace affine E vérifient F ⊂ G ,
on dit que F est parallèle à G (ou parfois faiblement parallèle à G) ; cette relation n’est
naturellement pas symétrique.
Intersection, sous-espace engendré
Proposition 7. L’intersection de toute famille (finie ou infinie) de sous-espaces af-

fines d’un même espace affine est soit vide, soit un sous-espace affine de direction
l’intersection des directions de ces sous-espaces affines.
Démonstration : Soit (Fi )i∈I une famille de sous-espaces affines de E. Si l’intersection

T
Fi de cette famille est vide, il n’y a rien à démontrer. Sinon, soit A un point de cette
i∈I
intersection. Pour tout i ∈ I, un point M de E appartient à Fi si et seulement si le
−−→ →
−
vecteur AM appartient à la direction F i de Fi , puisque A appartient à Fi . Il en résulte
T −−→
que M appartient à Fi si et seulement si AM appartient au sous-espace vectoriel
i∈I
T →
− →
− T T →
−
F i de E , ce qui montre que Fi est un sous-espace affine de E de direction F i.
i∈I i∈I i∈I

Cette stabilité par intersection permet de poser la définition suivante :
Définition 10. Soit A une partie non vide d’un espace affine E. On appelle sous-espace
affine engendré par A l’intersection de tous les sous-espaces affines de E contenant A.
Proposition 8. Le sous-espace affine engendré par une partie non vide A d’un espace
affine E est le plus petit (au sens de l’inclusion) sous-espace affine de E contenant A.
C’est aussi l’ensemble de tous les barycentres de tous les systèmes de points pondérés
de A affectés de coefficients quelconques (de somme non nulle).
Démonstration : Soit A une partie non vide de E et FA le sous-espace affine de E

engendré par A. FA est non vide, car il contient A, et c’est un sous-espace affine,
comme intersection de sous-espaces affines . Par définition, il est inclus dans tout sous-
espace affine de E contenant A, c’est donc bien le plus petit sous-espace affine de E
contenant A.
Soit GA l’ensemble de tous les barycentres de tous les systèmes de points pondérés
de A affectés de coefficients quelconques (de somme non nulle). GA n’est pas vide, car il
10
contient A (considérer un système réduit à un point), et tout barycentre d’un système

de points pondérés de GA appartient encore à GA par associativité du barycentre. Il
résulte de la proposition 6 que GA est un sous-espace affine de E. Comme il contient
A, il contient FA . Mais FA est un sous-espace affine de E et tout point de A appartient
à FA . Il en résulte que tout barycentre de points de A appartient à FA , donc que GA
est inclus dans FA . On a donc FA = GA .
Proposition 9. Soient F et G deux sous-espaces affines d’un espace affine E, A un

point de F et B un point de G. L’intersection F ∩ G est non vide si et seulement si
−→ →
− → −
le vecteur AB appartient à la somme F + G des directions de ces deux sous-espaces.
→
− →
− →
−
En particulier, si F et G sont deux sous-espaces vectoriels supplémentaires de E ,
l’intersection F ∩ G consiste en un point.
Démonstration : Si l’intersection F ∩ G n’est pas vide, soit I un point de cette intersec-

−
→ →
− −→ → −
tion. Le vecteur AI appartient à F et le vecteur IB à G . Il en résulte que le vecteur
−→ − → −→ →
− → −
AB = AI + IB appartient à F + G .
−→ →
− →
− →
−
Réciproquement, si AB appartient à F + G , il existe un vecteur ~u de F et un
→
− −→ −
→
vecteur ~v de G tels que AB = ~u + ~v . Soit I le point de E défini par AI = ~u. Le point
−→ →
−
I appartient à F puisque AI appartient à F . L’égalité
−→ − → −→
BI = AI − AB = ~u − (~u + ~v ) = −~v
−→ →
−
montre que BI appartient à G et donc que I appartient à G. Il en résulte que I
appartient à l’intersection de F et de G, qui n’est donc pas vide.
→
− →
− →
−
Dans le cas où F et G sont des sous-espaces vectoriels supplémentaires de E , tout
→
− −→ →
− →
− → −
vecteur de E , en particulier le vecteur AB, appartient à E = F + G . L’intersection
→
− → −
F ∩ G n’est donc pas vide, et sa direction est F ∩ G = {~0} (proposition 7). Cette
intersection est donc réduite à un point.
1.4 Repérage
1) Coordonnées cartésiennes
Repères cartésiens
On a déjà remarqué que le choix d’une origine O permet d’identifier un espace affine
→
−
E de dimension n à sa direction E , c’est-à-dire à un espace vectoriel. Le choix d’une
→
−
base B = (~e1 , . . . , ~en ) de E permet d’identifier cet espace vectoriel à Rn . Le couple
R = (O, B) = (O, ~e1 , . . . , ~en ) est appelé repère cartésien de E. Pour tout point M de
−−→ Pn
E, il existe alors un unique n-uplet (x1 , . . . , xn ) de réels vérifiant OM = xi~ei . Ces
i=1
nombres sont appelés coordonnées cartésiennes de M dans le repère R. Si n = 2, on
notera souvent ces coordonnées (x, y) et, si n = 3, (x, y, z).
11
Mesure algébrique
Un repère cartésien d’une droite affine D est un couple (O, ~u), où O est un point
→
−
de D et ~u un vecteur non nul de D (on dit que ~u est un vecteur directeur de D). Si
−−→ −−→
M et N sont deux points de D, le vecteur M N s’écrit de manière unique M N = λ~u
pour un réel λ. Ce réel λ est appelé mesure algébrique de M N et noté M N . La mesure
algébrique M N dépend donc du choix d’un vecteur directeur de D : si on remplace ~u
par λ~u, où λ est un réel non nul, toutes les mesures algébriques sur D sont divisées
par λ. Mais le rapport M N /P Q de mesures algébriques de couples de points de D ne
dépend pas du choix du vecteur directeur : il est donc défini de manière intrinsèque.
Equation d’un hyperplan
Proposition 10. Soit E un espace affine de dimension n et R = (O, ~e1 , . . . , ~en ) un

repère cartésien de E. Tout hyperplan H de E admet dans R une équation de la forme
n
ai xi = 0, où les ai sont des réels vérifiant (a1 , . . . , an ) 6= (0, . . . , 0) ; cette
P
a0 +
i=1
équation est unique à multiplication près par un réel non nul. Réciproquement, toute
→
−
équation de ce type représente un hyperplan. L’hyperplan vectoriel H (direction de H)
n
P →
−
a pour équation ai xi = 0 dans la base (~e1 , . . . , ~en ) de E .
i=1
n
Il en résulte que deux hyperplans H et H 0 , d’équations respectives a0 +
P
ai xi = 0 et
i=1
n
a00 + a0i xi = 0, sont parallèles si et seulement si les n-uplets (a1 , . . . , an ) et (a01 , . . . , a0n )
P
i=1
de réels sont proportionnels.
Démonstration : Soit H un hyperplan de E, B un point de H de coordonnées (b1 , . . . , bn )

dans le repère R, et a1 x1 + · · · + an xn = 0, où les ai sont des réels non tous nuls, une
→
− →
−
équation de l’hyperplan vectoriel H dans la base (~e1 , . . . , ~en ) de E . Un point M de E
−−→
de coordonnées (x1 , . . . , xn ) appartient à H si et seulement si le vecteur BM appar-
→
−
tient à H , i.e. si et seulement si a1 (x1 − b1 ) + · · · + an (xn − bn ) = 0. Il en résulte que
a0 + a1 x1 + · · · + an xn = 0, où a0 = −a1 b1 − · · · − an bn , est une équation de H dans le
repère R.
Réciproquement, soient a0 , a1 , . . . , an des réels vérifiant (a1 , . . . , an ) 6= (0, . . . , 0) et
B un point de coordonnées (b1 , . . . , bn ) vérifiant a0 + a1 b1 + · · · + an bn = 0 (un tel point
existe puisque a1 , . . . , an ne sont pas tous nuls). L’équation a0 + a1 x1 + · · · + an xn = 0
−−→
s’écrit encore a1 (x1 −b1 )+· · ·+an (xn −bn ) = 0 et signifie que le vecteur BM appartient
→
−
à l’hyperplan vectoriel H d’équation a1 x1 + · · · + an xn = 0. Cette équation est donc
→
−
celle de l’hyperplan affine passant par B et de direction H .
Deux hyperplans affines d’équations a0 + a1 x1 + · · · + an xn = 0 et a00 + a01 x1 +
· · · + a0n xn = 0 sont parallèles s’ils ont même direction, i.e. si les hyperplans vectoriels
d’équations a1 x1 + · · · + an xn = 0 et a01 x1 + · · · + a0n xn = 0 sont confondus, ou encore si
et seulement si les n-uplets (a1 , . . . , an ) et (a01 , . . . , a0n ) de réels sont proportionnels. Ils
12
sont confondus si (a0 , a1 , . . . , an ) et (a00 , a01 , . . . , a0n ) sont proportionnels, sinon ils sont
strictement parallèles.
Equations de droites et de plans en dimensions 2 et 3

Une droite a donc, dans un repère cartésien du plan, une équation de la forme
ax + by + c = 0, avec (a, b) 6= (0, 0), et un plan, dans un repère cartésien de l’espace,
une équation de la forme ax + by + cz + d = 0, avec (a, b, c) 6= (0, 0, 0).
Attention : une droite de l’espace est représentée par un système de deux équations
(celles de deux plans distincts la contenant).
2) Coordonnées barycentriques
Une autre façon de repérer les points dans un espace affine consiste à les écrire
comme barycentres de points d’un repère : par exemple, si A et B sont deux points
distincts d’une droite D, tout point de D s’écrit comme barycentre de A et B, et cette
écriture est unique à condition de normaliser les coefficients en imposant à leur somme
de valoir 1.
Proposition 11. Soient A0 , A1 , . . . , An n+1 points d’un espace affine E de dimension

n. Les deux propriétés suivantes sont équivalentes :
−−−→ −−−→ −−−→ →
−
(i) les vecteurs A0 A1 , A0 A2 , . . . , A0 An constituent une base de E ;
(ii) aucun des points A0 , A1 , . . . , An n’appartient au sous-espace affine engendré par
les autres.
Démonstration : Si (i) est vérifiée, et si A0 appartenait au sous-espace affine en-

gendré par A1 , . . . , An , A0 serait barycentre des points A1 , . . . , An affectés de coeffi-
n −−−→
λi A0 Ai = ~0 ; la famille
P
cients λ1 , . . . , λn de somme non nulle (proposition 8), d’où
i=1
−−−→ −−−→
A0 A1 , . . . , A0 An ne serait donc pas libre, ce qui contredirait (i).
De même, si (i) était vérifiée, et si Ai appartenait au sous-espace affine engendré
par A0 , . . . , Ai−1 , Ai+1 , . . . , An , Ai serait barycentre de ces points affectés de coefficients
−−−→
λ0 , . . . , λi−1 , λi+1 , . . . , λn de somme non nulle ; le vecteur A0 Ai serait donc combinaison
−−−→ −−−−→ −−−−→ −−−→
linéaire des vecteurs A0 A1 , . . . , A0 Ai−1 , A0 Ai+1 , . . . , A0 An et on conclut comme précé-
demment.
On a donc montré que (i) impliquait (ii).
−−−→ −−−→
Si (i) n’est pas vérifiée, la famille de n vecteurs A0 A1 , . . . , A0 An n’étant pas une
base de E n’est pas libre, puisque n est la dimension de E. Il existe donc des réels
n −−−→ n
λi A0 Ai = ~0. Si λi 6= 0, cette relation montre
P P
λ1 , . . . , λn non tous nuls tels que
i=1 i=1
que A0 est barycentre des points A1 , . . . , An et appartient donc au sous-espace affine
n
λi = 0, en supposant λ1 6= 0 pour fixer les idées, on
P
engendré par ces points. Si
i=1
13
n
aurait λ1 = −
P
λi , d’où
i=2
n n n
−−−→ X −−−→ −−−→ −−−→
λi A1 Ai = ~0 ,
X X
λi A0 Ai = λi (A0 Ai − A0 A1 ) =
i=1 i=2 i=2
n
λi = −λ1 6= 0) et
P
ce qui montre que A1 est barycentre de A2 , . . . , An (puisque
i=2
appartient donc au sous-espace affine de E engendré par ces points. On a donc montré
par contraposition que (ii) implique (i).
Remarque : La condition (i) fait jouer un rôle particulier au point A0 ; l’équivalence

avec la seconde condition montre qu’en fait tous les points Ai jouent le même rôle :
on aurait donc pu rajouter dans l’énoncé n conditions équivalentes à la première en
permutant A0 avec l’un des points A1 , . . . , An .
Définition 11. On appelle repère affine de E toute famille (A0 , . . . , An ) de points de

E vérifiant les conditions précédentes.
Attention : un repère affine d’un espace affine E de dimension n est donc une famille
de n + 1 points de E (2 points distincts pour une droite, les sommets d’un triangle non
aplati pour un plan, les sommets d’un tétraèdre non aplati pour l’espace de dimension
3).
Proposition 12. Soit (A0 , . . . , An ) un repère affine d’un espace affine E. Pour tout
point M de E, il existe une unique famille (α0 , α1 , . . . , αn ) de réels de somme 1 telle
que M soit le barycentre de la famille pondérée (Ai , αi )i=0,1,...,n .
Démonstration : Soit (α0 , α1 , . . . , αn ) une famille de réels de somme 1. Le point M est

−−−→ n
P −−−→
barycentre du système pondéré (Ai , αi )i=0,1,...,n si et seulement si A0 M = αi A0 Ai .
i=1
−−−→ −−−→ →
−
Or la famille (A0 A1 , . . . , A0 An ) étant une base de E , il existe un n-uplet (α1 , . . . , αn )
−−−→ n
P −−−→
de réels et un seul tel que A0 M = αi A0 Ai . Le point M est donc barycentre du
i=1
n
système pondéré (Ai , αi )i=0,1,...,n où α0 = 1 −
P
αi . Si M est barycentre du système
i=1
n −−−→ n −−−→
pondéré (Ai , αi0 )i=0,1,...,n αi0 = 0, alors A0 M = αi0 A0 Ai , d’où αi0 = αi pour
P P
avec
i=0 i=1
n n
α00 =1− αi0 =1−
P P
i = 1, . . . , n et αi = α0 .
i=1 i=1
Définition 12. Les coefficients (α0 , α1 , . . . , αn ) définis dans la proposition 12 sont

appelés coordonnées barycentriques de M dans le repère affine (A0 , . . . , An ).
n
P n
P
Le point M s’écrit donc M = αi Ai , avec αi = 1. Par homogénéité du bary-
i=0 i=0
centre, M est aussi barycentre du système (Ai , λαi )i=0,...,n pour tout réel non nul λ. On
14
dit parfois que les λαi constituent un système de coordonnées barycentriques homo-
gènes de M dans le repère affine (A0 , . . . , An ) ; les αi sont alors appelés coordonnées
barycentriques réduites ou normalisées de M dans ce repère.
La démonstration de la proposition 12 montre que l’on passe très facilement des

−−−→ −−−→
coordonnées cartésiennes dans un repère (A0 , A0 A1 , . . . , A0 An ) aux coordonnées ba-
rycentriques dans le repère affine (A0 , . . . , An ) : si (x1 , . . . , xn ) sont les coordonnées
−−−→ −−−→ n
cartésiennes de M dans le repère (A0 , A0 A1 , . . . , A0 An ), alors (1 −
P
xi , x1 , . . . , xn )
i=1
sont les coordonnées barycentriques de M dans le repère affine (A0 , . . . , An ).
Réciproquement, si (α0 , α1 , . . . , αn ) sont les coordonnées barycentriques de M dans
le repère affine (A0 , . . . , An ), les coordonnées cartésiennes de M dans le repère cartésien
−−−→ −−−→
(A0 , A0 A1 , . . . , A0 An ) sont (α1 , . . . , αn ).
On en déduit immédiatement l’équation barycentrique d’un hyperplan affine.
Proposition 13. Soit E un espace affine de dimension n rapporté à un repère affine

(A0 , . . . , An ) et (α0 , α1 , . . . , αn ) les coordonnées barycentriques dans ce repère d’un point
générique M de E. Tout hyperplan affine de E admet une équation barycentrique de
n
P
la forme bi αi = 0, où (b0 , b1 , . . . , bn ) est une famille de réels non tous égaux. Cette
i=0
équation est unique à multiplication près par un réel non nul. Réciproquement, toute
équation de ce type est celle d’un hyperplan affine.
Démonstration : On a vu à la proposition 10 que tout hyperplan affine admettait dans

−−−→ −−−→ n
P
le repère cartésien (A0 , A0 A1 , . . . , A0 An ) une équation de la forme a0 + ai xi = 0, où
i=1
a1 , . . . , an sont des réels non tous nuls et (x1 , . . . , xn ) les coordonnées cartésiennes d’un
n
P
point générique M . En remarquant que αi = xi pour i = 1, . . . , n et αi = 1, cette
i=0
équation s’écrit
n
X n
X n
X
a0 αi + ai α i = bi α i = 0
i=0 i=1 i=0
en posant b0 = a0 et bi = a0 + ai pour i = 1, . . . , n. La condition « a1 , . . . , an non tous

nuls » équivaut à « b0 , b1 , . . . , bn non tous égaux ».
On remarque que cette équation est valable tant pour des coordonnées barycen-
n
P
triques normalisées ( αi = 1) que pour des coordonnées barycentriques quelconques
i=0
n
αi 6= 0).
P
(
i=0
15
1.5 Convexité
Définition
Définition 13. Soient A et B deux points d’un espace affine E. Le segment AB, noté
[AB], est l’ensemble des barycentres de A et B affectés de coefficients tous deux positifs,
i.e. [AB] = {αA + (1 − α)B | α ∈ [0, 1]}.
Définition 14. Une partie C d’un espace affine E est dite convexe si pour tout couple
(A, B) de points de C le segment [AB] est inclus dans C.
Exemples :
– Tout sous-espace affine d’un espace affine (en particulier l’espace lui-même) est
convexe.
– Un segment, une demi-droite (ouverte ou fermée) sont convexes (si A est un
→
−
point d’un espace affine E et ~u un vecteur non nul de E , on appelle demi-
droite fermée (resp. ouverte) d’origine A et de vecteur directeur ~u l’ensemble
−−→ −−→
{M ∈ E | AM = λ~u, λ ≥ 0} (resp. {M ∈ E | AM = λ~u, λ > 0})).
– Une fonction réelle f définie sur un intervalle I de R est convexe si et seulement
si son épigraphe est convexe (on appelle épigraphe de f l’ensemble
{(x, y) ∈ I × R | y ≥ f (x)}
des points situés au-dessus du graphe de f ).
Proposition 14. Une partie C d’un espace affine E est convexe si et seulement si tout
barycentre de points de C affectés de coefficients tous positifs appartient à C.
Démonstration : Si tout barycentre de points de C affectés de coefficients tous positifs

appartient à C, pour tout couple (A, B) de points de C le segment [AB] est inclus dans
C puisque ce segment est l’ensemble des barycentres de A et B affectés de coefficients
tous deux positifs. C est donc convexe.
Réciproquement, si C est convexe, on démontre par récurrence sur n que tout bary-
centre de n points de C affectés de coefficients tous positifs appartient à C : la propriété
est vraie pour n = 2 par hypothèse ; si elle est vraie pour n et si A1 , . . . , An+1 sont n + 1
points de C affectés des coefficients tous positifs α1 , . . . , αn+1 , le barycentre G de ce
système de points pondérés est barycentre du système [(G0 , α1 + · · · + αn ), (An+1 , αn+1 )]
où G0 est le barycentre du système (Ai , αi )i=1,...,n ; G0 appartient à C par l’hypothèse
de récurrence et G appartient au segment [G0 An+1 ] qui est inclus dans C car C est
convexe.
Proposition 15. Toute intersection de convexes est convexe.
16
Démonstration : Soit C une famille quelconque de convexes et Γ =

T
C. Pour tout
c∈C
couple (A, B) de points de Γ et tout C ∈ C, A et B appartiennent à C, donc le segment
[A, B] est inclus dans C. Il en résulte que [A, B] est inclus dans Γ.
Remarque : une intersection de convexes peut être vide, mais avec la définition que
nous avons choisie l’ensemble vide est convexe.
Enveloppe convexe
Cette stabilité par intersection permet, comme dans le cas des sous-espaces affines,
de poser la définition suivante :
Définition 15. Soit A une partie non vide d’un espace affine E. On appelle enveloppe
convexe de A l’intersection de tous les convexes de E contenant A.
Proposition 16. L’enveloppe convexe d’une partie non vide A d’un espace affine E est
le plus petit convexe de E contenant A. C’est aussi l’ensemble de tous les barycentres
de points de A affectés de coefficients tous positifs.
Démonstration : Soit A une partie non vide d’un espace affine E et CA la famille de
T
tous les convexes de E contenant A. L’enveloppe convexe Conv(A) = C de A est
C∈CA
convexe comme intersection de convexes et contient A. Tout convexe C contenant A
appartient à CA et contient donc Conv(A), ce qui montre que Conv(A) est le plus petit
convexe de E contenant A.
Soit Â l’ensemble de tous les barycentres de points de A affectés de coefficients
tous positifs. Tout point M de A est barycentre de la famille à un élément (A, 1) et
appartient donc à Â. Par ailleurs, Â est convexe par associativité du barycentre. Il en
résulte que Conv(A) est inclus dans Â.
Soit C un convexe contenant A. Tout point de Â est barycentre à coefficients tous
positifs de points de C, donc appartient à C. Il en résulte que Â est inclus dans C pour
tout C ∈ CA , et est donc inclus dans Conv(A), d’où Â = Conv(A).
Exemples : l’enveloppe convexe de deux points A et B est le segment [AB] ; l’enveloppe

convexe de 3 points A, B, C du plan est le triangle plein ABC.
Demi-espaces, régionnement
L’exemple des demi-droites n’est qu’un cas particulier d’un exemple fondamental de
convexes : les demi-espaces. Si E est un espace affine de dimension n et H un hyperplan
affine, H sépare l’espace en deux, comme le montre la proposition suivante :
Proposition 17. Soit E un espace affine et H un hyperplan affine de E. La relation R

définie par « ARB si et seulement si [AB] ∩ H = ∅ » est une relation d’équivalence sur
le complémentaire E \ H de H dans E qui partage E \ H en exactement deux classes.
17
Ces classes sont appelés demi-espaces ouverts délimités par H. Les demi-espaces
fermés sont obtenus en prenant leurs réunions avec H. Si deux points A et B sont en
relation par R, on dit que A et B sont du même côté de H.
Démonstration : Soit (O, ~e1 , . . . , ~en ) un repère cartésien de E dont l’origine O appar-
→
−
tient à H et les vecteurs ~e1 , . . . , ~en−1 appartiennent à l’hyperplan vectoriel H . L’hy-
perplan H admet xn = 0 comme équation cartésienne dans ce repère. Soient A et
B deux points de E n’appartenant pas à H, de coordonnées respectives (a1 , . . . , an )
et (b1 , . . . , bn ) dans ce repère. On a donc an bn 6= 0. Tout point M du segment [AB]
s’écrit αA + (1 − α)B pour un α ∈ [0, 1]. Ce point appartient à H si et seulement si
αan + (1 − α)bn = 0, soit encore α(bn − an ) = bn . Cette équation en α admet une
solution dans [0, 1] si et seulement si an et bn sont de signes opposés. Le segment [AB]
rencontre donc H si et seulement si an bn < 0. Autrement dit, ARB si et seulement si
an et bn sont de même signe. Il en résulte immédiatement que la relation R est une
relation d’équivalence sur E \ H et que les deux classes d’équivalence pour R sont
{M ∈ E | xn > 0} et {M ∈ E | xn < 0}.
n
P
Si f (x1 , . . . , xn ) = a0 + ai xi = 0 est une équation cartésienne de H, ces demi-
i=1
espaces sont définis par les inéquations f (x1 , . . . , xn ) > 0 et f (x1 , . . . , xn ) < 0.
Polyèdres convexes
Définition 16. On appelle polyèdre convexe toute partie bornée non vide d’un espace
affine qui peut s’écrire comme intersection d’un nombre fini de demi-espaces fermés.
Dans le plan, on retrouve la notion usuelle de polygone convexe plein. Dans l’espace
de dimension 3, un polyèdre est un solide convexe d’intérieur non vide (s’il n’est pas
contenu dans un plan). On remarque que cette définition exclut le cas des dièdres ou
des trièdres, qui sont intersection de deux ou trois demi-espaces fermés mais ne sont
pas bornés.
On aurait pu donner une autre définition d’un polyèdre convexe, comme le montre
la proposition suivante, que nous ne démontrerons pas :
Proposition 18. Une partie d’un espace affine E est un polyèdre convexe si et seule-
ment si elle est l’enveloppe convexe d’un nombre fini de points de E.
Il résulte immédiatement de la définition que toute intersection d’un polyèdre
convexe et d’un sous-espace affine est vide ou est un polyèdre convexe (un sous-espace
affine peut s’écrire comme intersection d’un nombre fini d’hyperplans affines et un hy-
perplan affine est l’intersection des deux demi-espaces fermés qu’il limite). De même
toute intersection d’un nombre fini de polyèdres convexes est vide ou est un polyèdre
convexe.
Un exemple de polyèdre convexe en dimension quelconque est le n-simplexe
n
n+1
X
∆n = {(x0 , x1 , . . . , xn ) ∈ R | xi = 1, xi ≥ 0 pour tout i = 0, . . . , n} .
i=0
18
n
(∆n est une partie de Rn+1 , mais il est inclus dans l’hyperplan d’équation
P
xi = 1,
i=0
si bien que sa dimension intrinsèque est n.)
Polyèdres dans l’espace de dimension 3
Théorème 1. Théorème de structure des polyèdres convexes
Pour tout polyèdre convexe d’intérieur non vide P de l’espace de dimension 3, il existe
m
Pi+ de P comme inter-
\
une écriture minimale (au sens du nombre de termes) P =
i=1
section de demi-espaces fermés. Cette écriture est unique à l’ordre près. L’intersection
de P avec chacun des plans Pi est un polygone convexe plein d’intérieur non vide dans
Pi . Ces polygones sont appelés faces du polyèdre. Les côtés de ces polygones sont appelés
arêtes du polyèdre et leurs sommets sommets du polyèdre.
Théorème 2. Formule d’Euler
Pour tout polyèdre convexe P de l’espace de dimension 3, on a :
s−a+f =2
où s est le nombre de sommets, a le nombre d’arêtes et f le nombre de faces de P .

Nous ne démontrerons pas ces deux théorèmes (voir néanmoins la section 3.6 dans
la partie Compléments), pas plus que la proposition suivante.
Proposition 19. Tout polyèdre convexe est l’enveloppe convexe de ses sommets.
Définition 17. On appelle tétraèdre (plein) l’enveloppe convexe de quatre points non
coplanaires.
Un tétraèdre possède 4 sommets, 4 faces et 6 arêtes. Ses faces sont des triangles. Si
ces triangles sont tous équilatéraux, le tétraèdre est dit régulier. Un tétraèdre est donc
régulier si et seulement si toutes ses arêtes ont même longueur (cette définition, comme
d’autres qui suivront, suppose l’espace affine muni d’une structure euclidienne).
Définition 18. Soit (A,~i, ~j, ~k) un repère cartésien (non nécessairement orthonormé)
de l’espace. On appelle parallélépipède (plein) construit sur ce repère l’ensemble des
points de l’espace dont les trois coordonnées dans ce repère appartiennent toutes à
l’intervalle [0, 1].
Un parallélépipède a 8 sommets, 6 faces et 12 arêtes. Ses faces sont des parallé-

logrammes. Les sommets du parallélépipède construit sur un repère cartésien sont les
points de coordonnées toutes égales à 0 ou 1 dans ce repère, ses faces sont portées par
les plans d’équations x = 0, x = 1, y = 0, y = 1, z = 0, z = 1.
Un parallélépipède dont les faces sont des rectangles est appelé parallélépipède rec-
tangle.
19
Figure 2 – Parallélépipède
Figure 3 – Pyramide et prisme
Un cube est un parallélépipède dont les faces sont des carrés.

Une pyramide est l’enveloppe convexe d’un polygone plan convexe non aplati, appelé
base de la pyramide, et d’un point S (le sommet de la pyramide) n’appartenant pas au
plan de ce polygone.
Une pyramide dont la base a n sommets a n + 1 faces, 2n arêtes et n + 1 sommets.
Un tétraèdre est une pyramide ayant pour base un triangle.
Une pyramide régulière est une pyramide dont la base est un polygone régulier
convexe et dont le sommet appartient à la droite perpendiculaire à la base menée par
le centre de ce polygone.
Un prisme est l’enveloppe convexe de deux polygones plans convexes, appelés bases
du prisme, déduits l’un de l’autre par une translation de vecteur n’appartenant pas à la
direction commune de leurs plans. Le prisme est dit droit si le vecteur de la translation
20
est orthogonal aux plans des bases.

Un prisme dont les bases ont chacune n sommets a n + 2 faces, 3n arêtes et 2n
sommets. Toutes les faces d’un prisme autres que les bases sont des parallélogrammes.
Si le prisme est droit, ces faces sont des rectangles. Un parallélépipède est un prisme
ayant pour base un parallélogramme.
1.6 Applications affines

Les transformations affines sont les transformations géométriques les plus utilisées
en géométrie élémentaire. On verra en particulier au chapitre « Géométrie euclidienne »
que toute similitude (et en particulier toute isométrie) est une transformation affine.
On dira de fait qu’une propriété est affine si elle est conservée par toute transformation
affine. En particulier, l’alignement, le parallélisme, le milieu sont des propriétés affines.
Par contre l’orthogonalité, les angles, les longueurs ne sont pas des propriétés affines,
car elles ne sont pas conservées par toutes les transformations affines (bien qu’elles
soient conservées par les isométries).
Définition et premières propriétés
Définition 19. Soient E et F deux espaces affines. Une application f de E dans F
→
− →
− −−−−−−→
est dite affine s’il existe une application linéaire f~ de E dans F telle que f (A)f (B) =
−→
f~(AB) pour tout couple (A, B) de points de E.
Cette propriété peut encore s’écrire f (M + ~u) = f (M ) + f~(~u) pour tout point M
→
−
de E et tout vecteur ~u ∈ E .
L’application f~ est alors uniquement déterminée, puisque pour tout vecteur ~u de
→
− −→
E , il existe un (en fait une infinité de) couple (A, B) de points de E tel que AB = ~u.
On l’appelle application linéaire associée à f , ou partie linéaire de f .
Une application affine est entièrement déterminée par sa partie linéaire et l’image
−−−−−−→ −→
d’un point, puisque f (B) = f (A) + f (A)f (B) = f (A) + f~(AB) pour tout point B de
E.
Réciproquement, si E et F sont deux espaces affines, A un point de E, A0 un point
→
− →
−
de F et f~ une application linéaire de E dans F , il existe une (et une seule) application
affine f de E dans F de partie linéaire f~ vérifiant f (A) = A0 .
Exemples :
– toute translation est une application affine d’application linéaire associée l’iden-
tité ;
– une application f de R dans R est affine si et seulement si elle est de la forme
f (x) = ax + b, où a et b sont deux réels ; l’application linéaire associée f~ est alors
donnée par f~(x) = ax ;
– plus généralement, si E est un espace vectoriel, E est muni d’une structure natu-
relle d’espace affine sur lui-même ; toute application linéaire de E dans lui-même
21
est alors affine, et égale à sa partie linéaire ; toute application affine de E dans
lui-même est composée d’une application linéaire et d’une translation, puisque,
si f est affine, on a f (~u) = f~(~u) + f (~0) pour tout vecteur ~u de E.
Si f est une application quelconque de E dans F , on ne peut en général pas lui
→
− →
−
associer d’application de E dans F indépendamment du choix d’une origine : en effet,
→
− →
−
on peut bien définir, pour tout point O de E, une application f~O de E dans F par
−−−−−−−→ →
−
f~O (~u) = f (O)f (M ) pour tout vecteur ~u de E , où M est l’unique point de E tel que
−−→
~u = OM , mais cette application f~O dépend en général du choix de O. Cependant, il
suffit que cette application soit linéaire pour un point O de E pour que f soit affine
comme le montre la proposition suivante :
Proposition 20. Soient E et F deux espaces affines et f une application de E dans

F . On suppose qu’il existe un point O de E tel que l’application f~O précédemment
définie soit linéaire. Alors f est affine et f~O est l’application linéaire associée à f . En
particulier, f~O ne dépend alors pas du choix de O.
Démonstration : On a, pour tout couple (A, B) de points de E :

−−−−−−→ −−−−−−→ −−−−−−→
f (A)f (B) = f (O)f (B) − f (O)f (A)
−−→ −→
= f~O (OB) − f~O (OA)
−−→ −→
= f~O (OB − OA) car f~O est linéaire
−→
= f~O (AB)
ce qui montre que f est affine de partie linéaire f~O .
Composition
Proposition 21. Toute composée d’applications affines est une application affine, et
−−−→
la partie linéaire de la composée est la composée des parties linéaires : g ◦ f = ~g ◦ f~.
En particulier, on ne change pas la partie linéaire d’une application affine en la

composant (à droite ou à gauche) avec une translation.
Démonstration : Il suffit de remarquer que, pour tout couple (A, B) de points de
l’espace de départ de f
−−−−−−−−−−−−→ −−−−−−→ −→ −→
g ◦ f (A)g ◦ f (B) = ~g (f (A)f (B)) = ~g (f~(AB)) = ~g ◦ f~(AB)
et que ~g ◦ f~ est linéaire.
22
Caractérisation en termes de barycentres
Proposition 22. Une application f d’un espace affine E dans un espace affine F est
affine si et seulement si elle conserve les barycentres, i.e. si et seulement si, pour tout
système (Ai , λi )i=1,...,n de points pondérés de E de poids total non nul, l’image f (G)
du barycentre G de ce système par f est le barycentre du système de points pondérés
(f (Ai ), λi )i=1,...,n .
Démonstration : Si f est affine et si G est le barycentre du système (Ai , λi )i=1,...,n ,

l’égalité
n −−−−−−−→ X n n
!
−−→ −−→
λi f~(GAi ) = f~ λi GAi = f~(~0−
→) = ~
X X
λi f (G)f (Ai ) = E
0−→
F
i=1 i=1 i=1
montre que f (G) est le barycentre du système (f (Ai ), λi )i=1,...,n .

Réciproquement, montrons que si f conserve les barycentres, l’application f~O consi-
dérée à la proposition 20 est linéaire pour tout point O de E. Soient donc ~u et ~v deux
→
− −−→ −−→
vecteurs de E , λ et µ deux réels, M et N les points de E définis par OM = ~u, ON = ~v ,
−→ −−→ −−→
et P le point de E défini par OP = λ ~u + µ ~v = λ OM + µ ON . Le point P est le ba-
rycentre du système pondéré [(O, 1 − λ − µ), (M, λ), (N, µ)]. Il en résulte que f (P ) est
le barycentre du système pondéré [(f (O), 1 − λ − µ), (f (M ), λ), (f (N ), µ)], d’où
−−−−−−→
f~O (λ ~u + µ ~v ) = f (O)f (P )
−−−−−−−→ −−−−−−−→
= λ f (O)f (M ) + µ f (O)f (N )
= λ f~O (~u) + µ f~O (~v ) ,
ce qui montre, d’après la proposition 20, que f~O est linéaire.
Corollaire 1. L’image (resp. l’image réciproque) d’un convexe par une application
affine est un convexe.
Démonstration : Il suffit de remarquer que, d’après la proposition précédente, l’image

par une application affine f d’un segment [AB] est le segment [f (A)f (B)].
Image et image réciproque d’un sous-espace affine
Proposition 23. Soient E et F deux espaces affines, et f une application affine de E

dans F . L’image f (G) par f d’un sous-espace affine G de E est un sous-espace affine
→
− →
−
de F , de direction l’image f~( G ) de G par f~.
De même, l’image réciproque f −1 (H) par f d’un sous-espace affine H de F est, soit
→
−
vide, soit un sous-espace affine de E de direction f~−1 ( H ).
23
Démonstration : Soit G un sous-espace affine de E et A un point de G. L’égalité

→
−
G = {A + ~u | ~u ∈ G } implique
f (G) = {f (M ) | M ∈ G}
→
−
= {f (A + ~u) | ~u ∈ G }
→
−
= {f (A) + f~(~u) | ~u ∈ G }
→
−
= {f (A) + ~v | ~v ∈ f~( G )} ,
ce qui montre que f (G) est le sous-espace affine de F passant par f (A) de direction
→
−
f~( G ).
Soit H un sous-espace affine de F . Si f −1 (H) n’est pas vide, soit A un point de
f −1 (H). Un point M de E appartient à f −1 (H) si et seulement si f (M ) appartient à H,
−−−−−−−→ −−→ →
−
i.e. si et seulement si f (A)f (M ) = f~(AM ) appartient à H , ou encore si et seulement
−−→ →
− →
−
si AM appartient au sous-espace vectoriel f~−1 ( H ) de E , ce qui montre que f −1 (H)
→
−
est le sous-espace affine de E passant par A et de direction f~−1 ( H ).
En particulier :
Corollaire 2. Toute application affine conserve l’alignement et le parallélisme (les
images par une application affine de deux sous-espaces affines parallèles sont deux
sous-espaces affines parallèles).
Proposition 24. Une application affine est injective (resp. surjective, bijective) si et
seulement si sa partie linéaire l’est. Il en résulte qu’une application affine d’un espace
affine E de dimension finie dans lui-même est bijective si et seulement si elle est
injective (resp. surjective).
Démonstration : Une application affine f d’un espace affine E dans un espace affine
F est injective si et seulement si pour tout couple (A, B) de points de E, f (A) = f (B)
−−−−−−→ −→
équivaut à A = B. Mais f (A) = f (B) équivaut à f (A)f (B) = f~(AB) = ~0, i.e. à
−→ −→
AB ∈ Ker(f~) et A = B équivaut à AB = ~0. Il en résulte que f est injective si et
seulement si Ker(f~) = {~0}, i.e. si et seulement si f~ est injective.
De même f est surjective si et seulement si f (E) = F . Mais f (E) est un sous-espace
→
− →
−
affine de F de direction f~( E ) = Im(f~) ; c’est donc F si et seulement si Im(f~) = F ,
i.e. si et seulement si f~ est surjective.
Expression dans un repère

1) Repère cartésien
Proposition 25. Soient E et E 0 deux espaces affines, de dimensions respectives n et m,
R = (O, B) = (O, ~e1 , . . . , ~en ) un repère cartésien de E, R0 = (O0 , B 0 ) = (O0 , ~e 10 , . . . , ~e m
0
)
0 0
un repère cartésien de E , et f une application affine de E dans E . Les coordonnées
24
dans R0 de l’image f (M ) d’un point M de E par f sont données par X 0 = AX + B,

où A est la matrice de f~ dans les bases B et B 0 , X (resp. X 0 ) le vecteur colonne
des coordonnées de M (resp. f (M )) dans R (resp. R0 ), et B le vecteur colonne des
coordonnées de f (O) dans R0 . Réciproquement, toute application de E dans E 0 donnée
par de telles formules est affine.
Démonstration : Il suffit de remarquer que

−−0−−−→ −− −−→ −−−−−−−→ −−−−→ −−→
O f (M ) = O0 f (O) + f (O)f (M ) = O0 f (O) + f~(OM ) .

Changement de repère
En appliquant cette formule au cas où E 0 = E et f = idE , on obtient les for-
mules de changement de repère : si R = (O, B) = (O, ~e1 , . . . , ~en ) et R0 = (O0 , B 0 ) =
(O0 , ~e 10 , . . . , ~e n0 ) sont deux repères cartésiens de E, et si X (resp. X 0 ) est le vecteur
colonne des coordonnées d’un point M dans le repère R (resp. R0 ), on obtient X =
AX 0 + B, où A est la matrice de passage de la base B à la base B 0 et B le vecteur
colonne des coordonnées de l’origine O0 du nouveau repère R0 dans l’ancien repère R.
Il suffit pour le voir d’appliquer la formule précédente en prenant f = idE , l’espace E
étant au départ muni du repère R0 , et à l’arrivée du repère R. Les vecteurs colonnes
de la matrice de passage sont obtenus en exprimant les vecteurs de la nouvelle base B 0
→
−
de E dans l’ancienne base B.
Formes affines et hyperplans
Définition 20. On appelle forme affine (ou fonction affine) sur un espace affine E
toute application affine de E dans R.
L’application linéaire associée à une forme affine sur E est donc une forme linéaire
→
−
sur E . Une forme affine f sur E s’exprime en coordonnées cartésiennes par : f (M ) =
a0 + a1 x1 + · · · + an xn , où les ai sont des réels et les xi les coordonnées de M . Toute
forme affine non constante est surjective et l’ensemble des points où une forme affine
non constante f s’annule est un hyperplan affine H de direction l’hyperplan vectoriel
→
−
H = ker f~. Plus généralement, toutes les lignes de niveau de f sont des hyperplans
affines parallèles à H et les demi-espaces fermés (resp. ouverts) délimités par H sont les
ensembles {M ∈ E | f (M ) ≥ 0} et {M ∈ E | f (M ) ≤ 0} (resp. {M ∈ E | f (M ) > 0}
et {M ∈ E | f (M ) < 0}).
2) Repère affine
Proposition 26. Soit E et F deux espaces affines, (A0 , . . . , An ) un repère affine de
E, (A00 , . . . , A0n ) une famille de n + 1 points de F , où n = dim(E). Alors il existe
une application affine f et une seule de E dans F qui vérifie f (Ai ) = A0i pour tout
i = 0, 1, . . . , n. De plus f est bijective si et seulement si la famille (A00 , . . . , A0n ) est un
repère affine de F .
25
Démonstration : L’unicité est évidente : si (α0 , . . . , αn ) sont les coordonnées barycen-

n
P
triques normalisées ( αi = 1) du point M de E dans le repère affine (A0 , . . . , An ), son
i=0
n
αi A0i de F puisqu’une application affine conserve
P
image par f est le point f (M ) =
i=0
les barycentres.
Pour démontrer l’existence, il suffit de vérifier que l’application f de E dans F qui
n n n
αi A0i de F est
P P P
à tout point M = αi Ai (où αi = 1) associe le point f (M ) =
i=0 i=0 i=0
affine, et pour cela de vérifier qu’elle conserve les barycentres. Cette propriété résulte
de l’associativité du barycentre.
L’application f est surjective si et seulement si tout point de F peut s’écrire comme
barycentre des points A00 , . . . , A0n et elle est injective si et seulement si cette écriture
est unique. Ces deux conditions signifient que (A00 , . . . , A0n ) est un repère affine de F .

En particulier deux applications affines qui coïncident sur un repère affine sont
égales :
Corollaire 3. Soient E et F deux espaces affines, f et g deux applications affines

de E dans F , et (A0 , . . . , An ) un repère affine de E. Si f (Ai ) = g(Ai ) pour tout
i = 0, 1, . . . , n, alors f = g.
1.7 Le groupe affine

Définition 21. Soit E un espace affine. On appelle transformation affine de E toute
application affine bijective de E dans lui-même. Les transformations affines de E
constituent un sous-groupe (pour la composition) du groupe des permutations de E.
Le groupe des transformations affines de E est appelé groupe affine de E, et noté
GA(E).
Proposition 27. L’application f 7−→ f~ est un homomorphisme surjectif du groupe

→
−
affine GA(E) dans le groupe linéaire GL( E ) (groupe des applications linéaires bijectives
→
−
de E dans lui-même). Son noyau est le sous-groupe des translations de E.
Il en résulte que le groupe des translations de E est un sous-groupe distingué de

GA(E).
−−−→
Démonstration : La première assertion résulte de la relation g ◦ f = ~g ◦ f~ pour tout
→
−
couple d’éléments de GA(E) et du fait que pour tout f~ ∈ GL( E ) et tout couple (O, O0 )
de points de E, il existe une transformation affine f ∈ GA(E) et une seule de partie
linéaire f~ vérifiant f (O) = O0 . La seconde vient de ce qu’un élément f de GA(E) est une
→
−
translation si et seulement si sa partie linéaire f~ est l’identité de E . En effet la relation
−−−−−−→ −→ −−−−→ −−−−→
f (A)f (B) = AB équivaut à la relation Af (A) = Bf (B) (le quadrilatère ABf (B)f (A)
26
est alors un parallélogramme). Elle est donc vraie pour tout couple (A, B) de points
−−−−→
de E si et seulement si le vecteur Af (A) ne dépend pas du point A.
Stabilisateur d’un point

Le groupe affine GA(E) de E opère sur E par l’application (f, M ) 7−→ f (M ).
Rappelons qu’on appelle alors stabilisateur d’un point O de E le sous-groupe Stab(O)
de GA(E) constitué des transformations affines f laissant fixe le point O :
Stab(O) = {f ∈ GA(E) | f (O) = O} .
Proposition 28. Pour tout point O de E, la restriction de l’application f 7−→ f~ à

→
−
Stab(O) est un isomorphisme de Stab(O) sur le groupe linéaire GL( E ).
Démonstration : L’application f 7−→ f~ est un morphisme de groupes de GA(E) sur

→
−
GL( E ) de noyau le groupe des translations de E (proposition 27). Sa restriction à
Stab(O) est injective car une translation ayant un point fixe est l’identité et elle est
−−−−→
surjective (pour tout f~ in GL(E), l’application f de E dans E définie par Of (M ) =
−−→
f~(OM ) est l’unique élément de Stab(O) de partie linéaire f~).
Points fixes d’une transformation affine

Proposition 29. L’ensemble Fix(f ) des points fixes d’une transformation affine f de
E est, soit vide, soit un sous-espace affine de direction ker(f~ − id−
→ ) (c’est-à-dire le
E
~
sous-espace propre de f associé à la valeur propre 1).
Démonstration : Soit O une origine dans E. Un point A est fixe par f si et seulement
−−−−−−→ −−−−→ −→ −−−−→ −→
si f (O)f (A) = f (O)A, i.e. si et seulement si f~(OA) = f (O)O + OA, soit encore
−→ −−−−→ −−−−→
(f~ − id−
→ )(OA) = f (O)O. Si le vecteur f (O)O n’appartient pas à l’image de f
E
~ − id−
→, f
E
−−−−→ ~
n’admet pas de point fixe. Si f (O)O appartient à l’image de f − id E , il existe un point
−
→
−−−−→ −−→
A fixe par f . Un point M de E est alors fixe par f si et seulement si Af (M ) = AM , i.e.
−−−−−−−→ ~ −−→ −−→
f (A)f (M ) = f (AM ) = AM . L’ensemble des points fixes de f est alors le sous-espace
affine de E passant par A de direction ker(f~ − id−→ ).
E

En particulier :
Proposition 30. Soit f une transformation affine d’un espace affine E. Les deux
propriétés suivantes sont équivalentes :
(i) f admet un point fixe et un seul ;
(ii) 1 n’est pas valeur propre de f~.
Démonstration : L’implication (i) ⇒ (ii) résulte immédiatement de la proposition 29.

Montrons que si 1 n’est pas valeur propre de f~, i.e. si f~ − id−
→ est injective, alors f
E
27
admet un point fixe et un seul. L’application linéaire f~ − id− → étant injective et E de

E
dimension finie, elle est bijective et il résulte de la démonstration de la proposition 29
que f admet un point fixe et un seul.
Toute transformation affine est composée d’une transformation affine ayant un point
fixe et d’une translation. Plus précisément, si f est une transformation affine de E et
O un point quelconque de E, g = t− −−−→ ◦ f laisse O fixe et l’on a f = t−−−−→ ◦ g. La
f (O)O Of (O)
proposition suivante étudie le cas où il existe une telle décomposition commutative.
Proposition 31. Soit f une transformation affine d’un espace affine E telle que le
→
−
noyau et l’image de f~ − id−→ soient des sous-espaces vectoriels supplémentaires de E .
E
Alors il existe une transformation affine g de E admettant un point fixe et une trans-
lation t de E telles que f = t ◦ g = g ◦ t.
−−−−→
Démonstration : Soit O une origine dans E. Le vecteur Of (O) se décompose en somme
d’un vecteur ~u ∈ Ker(f~ − id−
→ ) et d’un vecteur ~
E
v ∈ Im(f~ − id− → ). Soit A un point de
E
− → −→ −→
E tel que (f~ − id−→ )(OA) = −~
E
v , i.e. ~(OA) = OA − ~v , t la translation de vecteur ~u et
f
g = t−1 ◦ f . L’égalité :
−→ −−−−→ −→ −→
g(A) = f (A)−~u = f (O)+f~(OA)−~u = O+Of (O)+f~(OA)−~u = O+~u+~v +OA−~v −~u = A
montre que A est fixe par g. Par ailleurs, f = t ◦ g et la relation
f (M + ~u) = f (M ) + f~(~u) = f (M ) + ~u pour tout point M de E
montre que f , et donc g, commute avec t.
1.8 Homothéties et translations

Définition 22. Soit E un espace affine, O un point de E et k un réel non nul.
L’homothétie hO,k de centre O et de rapport k est l’application qui à tout point M
−−→ −−→
de E associe le point M 0 = hO,k (M ) défini par OM 0 = k OM .
On vérifie immédiatement que hO,k est une transformation affine d’application li-
néaire associée l’homothétie vectorielle k id−
→ de rapport k, i.e. l’application linéaire qui
E
→
−
à tout vecteur ~u de E associe le vecteur k~u, et que si k est différent de 1, O est le seul
point fixe de hO,k (si k = 1, hO,k est l’identité).
La proposition 30 montre que, réciproquement, toute transformation affine f de
partie linéaire f~ = k id−
→ , avec k 6= 1, admet un point fixe O et un seul ; il en résulte
E
aussitôt que f est l’homothétie de centre O et de rapport k.
Proposition 32. Soit E un espace affine, et k un réel différent de 0 et de 1. Une
application affine de E dans E est une homothétie de rapport k si et seulement si sa
partie linéaire est une homothétie vectorielle de rapport k.
28
On a obtenu à la proposition 27 une caractérisation analogue des translations :

Proposition 33. Une application affine d’un espace affine E dans lui-même est une
→
−
translation si et seulement si sa partie linéaire est l’identité de E .
La proposition suivante se déduit immédiatement de ces deux caractérisations.
Proposition 34. L’ensemble des homothéties et des translations d’un espace affine
E constitue un sous-groupe du groupe affine de E, appelé groupe des homothéties-
translations.
Plus précisément, la composée de deux homothéties de rapports k1 et k2 est une
homothétie de rapport k1 k2 si k1 k2 6= 1, une translation si k1 k2 = 1. La composée
d’une homothétie de rapport k 6= 1 et d’une translation est une homothétie de rapport
k. L’application réciproque d’une homothétie de rapport k est l’homothétie de même
centre et de rapport 1/k.
Le groupe des homothéties-translations est parfois aussi appelé groupe des dilata-
tions (mais il faut se méfier : ce terme a, pour certains auteurs, un autre sens).
La proposition suivante caractérise géométriquement les éléments de ce sous-groupe :
Proposition 35. Une transformation affine est une homothétie ou une translation si
et seulement si elle transforme toute droite en une droite parallèle.
Démonstration : Soit f une transformation affine de E. Pour tout vecteur non nul ~u de
→
−
E et tout point A de E, la droite de vecteur directeur ~u passant par A est transformée
par f en la droite de vecteur directeur f~(~u) passant par f (A). La condition de l’énoncé
→
−
équivaut donc à « f~ transforme tout vecteur non nul de E en un vecteur colinéaire ».
Cette condition est évidemment vérifiée si f est une homothétie ou une translation.
Réciproquement, si cette condition est vérifiée, il existe pour tout vecteur non nul
→
−
~u de E un réel λ(~u) tel que f~(~u) = λ(~u)~u. Il faut montrer que λ(~u) ne dépend pas
de ~u, autrement dit que λ(~u) = λ(~v ) pour tout couple (~u, ~v ) de vecteurs non nuls de
→
−
E . Si ~v est colinéaire à ~u, il existe un réel α tel que ~v = α~u et par linéarité de f~
f~(~v ) = αf~(~u) = αλ(~u)~u = λ(~u)~v , d’où λ(~v ) = λ(~u). Si ~u et ~v ne sont pas colinéaires,
le système (~u, ~v ) est libre et l’égalité
λ(~u + ~v )~u + λ(~u + ~v )~v = λ(~u + ~v )[~u + ~v ] = f~(~u + ~v ) = f~(~u) + f~(~v ) = λ(~u)~u + λ(~v )~v
montre que λ(~u + ~v ) = λ(~u) = λ(~v ). Le réel λ = λ(~u) ne dépend donc pas de ~u et f~
est l’homothétie vectorielle de rapport λ. Il résulte alors de la proposition 32 que f est
une homothétie si λ 6= 1 et de la proposition 33 que f est une translation si λ = 1.
Il faut bien distinguer cette propriété de la conservation du parallélisme : toute
transformation affine transforme des droites parallèles en des droites parallèles ; mais
seules les homothéties et les translations transforment toute droite en une droite pa-
rallèle à elle-même.
29
1.9 Projections, symétries, affinités

→
−
Soit E un espace affine, F un sous-espace affine de E et G un sous-espace vectoriel
→
− →
−
de E supplémentaire de F . Il résulte de la proposition 9 que, pour tout point M de
T →
− →
−
E, l’intersection F Aff(M, G ) de F et du sous-espace affine Aff(M, G ) de direction
→
−
G passant par M est constituée d’un point M 0 et d’un seul (ce point M 0 est l’unique
−−−→ → −
point de F vérifiant M M 0 ∈ G ). On peut donc définir une application p de E dans
lui-même par p(M ) = M 0 . Cette application est appelée projection sur F parallèlement
→
− →
−
à G ou dans la direction G .
Figure 4 – Projection et symétrie dans le plan et dans l’espace.

−−−→ −−−→
Soit alors M 00 le symétrique de M par rapport à M 0 : on a donc M M 00 = 2M M 0 .
L’application s de E dans lui-même qui à M associe M 00 est appelée symétrie par
→
− →
−
rapport à F parallèlement à G ou dans la direction G .
→
−
Plus généralement, pour tout réel α, on définit l’affinité de base F , de direction G
et de rapport α comme l’application qui au point M associe le point M 000 défini par
−−− −→ −−−→
M 0 M 000 = αM 0 M . La projection et la symétrie sont donc des cas particuliers d’affinités
correspondant respectivement à α = 0 et α = −1.
Remarques :
→
−
1. Si F = E, G = {~0} ; la projection, la symétrie, et les affinités précédemment
définies sont alors toutes égales à l’identité. Si au contraire F est réduit à un
→
− →
− →
−
point, F = {~0} et G = E . Il en résulte que la projection p est l’application
constante envoyant tout point de E sur F , la symétrie s est l’homothétie de
centre ce point et de rapport −1 (on parle alors de symétrie centrale) et, plus
généralement, l’affinité de rapport α est l’homothétie de rapport α et de centre
ce point.
2. Le sous-espace F ne suffit pas à déterminer la projection : il faut en préciser la
→
− →
−
direction. Si on remplace G par un autre supplémentaire de F , la projection p
30
est radicalement changée (quoique son image p(E) soit toujours égale à F ). Dans
le cas des espaces affines euclidiens, on verra qu’il existe une direction privilégiée :
→
− →
− →
−
celle de l’orthogonal de F dans E ; on omettra alors de mentionner G , et on
parlera simplement de projection orthogonale. La même remarque est valable pour
les symétries et les affinités.
Rappels d’algèbre linéaire : projections et symétries vectorielles.

→
− →
− →
−
Soit E un espace vectoriel de dimension finie et E 1 et E 2 deux sous-espaces vec-
→
− →
−
toriels supplémentaires de E . Tout vecteur ~u de E s’écrit de manière unique sous la
→
− →
−
forme ~u = ~u1 + ~u2 , avec ~ui ∈ E i (i = 1, 2). Les deux applications p~1 et p~2 de E dans
lui-même définies par p~i (~u) = ~ui (i = 1, 2) sont linéaires et vérifient les relations :
• p~i ◦ p~i = p~i (i = 1, 2) ;
• p~1 ◦ p~2 = p~2 ◦ p~1 = 0, p~1 + p~2 = id− →;
E
→
− →
−
• Ker p~1 = Im p~2 = E 2 , Ker p~2 = Im p~1 = E 1 .
→
− →
−
Elles sont appelées projection sur E 1 (resp. E 2 ) dans la direction (ou parallèlement
→
− →
−
à) E 2 (resp. E 1 ).
→
−
Les deux applications ~s1 et ~s2 de E dans lui-même définies par ~s1 (~u) = ~u1 − ~u2 ,
→
− →
−
~s2 (~u) = ~u2 − ~u1 sont appelées symétrie par rapport à E 1 (resp. E 2 ) de direction (ou
→
− →
−
parallèlement à) E 2 (resp. E 1 ).
Elles sont linéaires, bijectives et vérifient les relations :
• ~si ◦ ~si = id−→ (i = 1, 2) ;
E
• ~s1 = p~1 − p~2 = 2~p1 − id− E
s2 = p~2 − p~1 = 2~p2 − id−
→, ~ →;
E
• ~s1 ◦ ~s2 = ~s2 ◦ ~s1 = −id− →, ~
E
s 1 + ~
s 2 = 0.
→
−
Réciproquement, si p~ est une application linéaire de E dans lui-même vérifiant
→
−
p~ ◦ p~ = p~, les deux sous-espaces vectoriels Im p~ et Ker p~ de E sont supplémentaires et
p~ est la projection sur Im p~ parallèlement à Ker~p.
→
−
De même, si ~s est une application linéaire de E dans lui-même vérifiant ~s ◦ ~s = id− →
E
(on dit que ~s est involutive), ~s admet exactement les deux valeurs propres +1 et -1
(sauf si ~s = ±id− → , auquel cas elle n’admet qu’une valeur propre), et les noyaux des
E
applications linéaires ~s −id− → et ~
E
s +id−→ (i.e. les sous-espaces propres de ~
E
s correspondant
→
−
à ces deux valeurs propres) sont des sous-espaces vectoriels supplémentaires de E ; ~s
est alors la symétrie par rapport au premier parallèlement au second.
→
−
Proposition 36. Soit F un sous-espace affine d’un espace affine E et G un sous-
→
− →
−
espace vectoriel supplémentaire de F dans E . La projection p sur F parallèlement
→
− →
−
à G (resp. la symétrie s par rapport à F parallèlement à G ) est une application
→
−
affine, d’application linéaire associée la projection vectorielle p~ sur F parallèlement à
→
− →
− →
−
G (resp. la symétrie vectorielle ~s = 2~p −id− → par rapport à F parallèlement à G ). Plus
E
→
−
généralement, l’affinité f de base F , de direction G et de rapport α est une application
affine, d’application linéaire associée f~ = p~ + α(id− →−p
E
~).
31
Démonstration : Soient M et N deux points quelconques de E, M 0 et N 0 leurs projetés

→
−
sur F dans la direction G , M 00 et N 00 leurs symétriques par rapport à F dans la direction
→
− −−→ −−−→ −−−→ −−→ −−−→
G . Par la relation de Chasles, on a M N = M M 0 + M 0 N 0 + N 0 N . Mais le vecteur M 0 N 0
→
− −−−→ −−→ →
−
appartient à F et le vecteur M M 0 + N 0 N appartient à G comme somme de deux
→
− −− − → −−→
vecteurs de G . On a donc M 0 N 0 = p~(M N ) par définition de la projection vectorielle
p~, ce qui montre que p est affine de partie linéaire p~.
De même l’égalité
−−− −→ −−−→ −−→ −−−→
M 00 N 00 = M 00 M + M N + N N 00
−−→ −−−→ −−→
= M N − 2(M M 0 + N 0 N )
−−→ −−→ −−→
= M N − 2(M N − p~(M N ))
−−→
= (2~p − id−
→ )(M N )
E
−−→
= ~s(M N )
montre que la symétrie s est affine de partie linéaire la symétrie vectorielle ~s.
La démonstration pour l’affinité est analogue.
Une projection, étant affine, conserve les rapports de mesures algébriques sur une
même droite. La partie directe du théorème de Thalès ne fait que traduire cette pro-
priété :
Théorème 3. (Théorème de Thalès)

Soient ∆A , ∆B , ∆C trois droites parallèles distinctes d’un plan affine P coupant
deux droites D et D0 respectivement en A, B, C et A0 , B 0 , C 0 . Alors
AB A0 B 0
= 0 0 . (∗)
AC AC
Réciproquement, soient ∆A , ∆B , ∆C trois droites distinctes d’un plan affine P
coupant deux droites D et D0 respectivement en A, B, C et A0 , B 0 , C 0 . On suppose ∆A
et ∆B parallèles, C et C 0 distincts et
AB A0 B 0
= 0 0 .
AC AC
Alors ∆C est parallèle à ∆A et ∆B .
Démonstration : La partie directe du théorème résulte immédiatement du caractère

affine de la projection p sur D0 dans la direction commune des droites ∆A , ∆B , ∆C : si
~u est un vecteur directeur de D et si les mesures algébriques sur D sont définies à partir
−→ −→ −−→ −−−−−−→
de ce vecteur, les relations AB = AB ~u, AC = AC ~u impliquent A0 B 0 = p(A)p(B) =
−→ −−→ −−−−−−→ −→
p~(AB) = AB p~(~u), A0 C 0 = p(A)p(C) = p~(AC) = AC p~(~u). En définissant les mesures
32
Figure 5 – Le théorème de Thalès dans le plan et dans l’espace.
algébriques sur D0 en prenant p~(~u) comme vecteur directeur (ce vecteur n’est pas nul,
et on rappelle que les rapports de mesures algébriques sur une droite ne dépendent pas
du choix du vecteur directeur), la relation (∗) en résulte immédiatement.
Réciproquement, supposons la relation (∗) vérifiée. La parallèle à ∆A menée par
AB A0 B 0
C coupe la droite D0 en un point C 00 qui vérifie = 0 00 par la partie directe du
AC AC
A0 B 0 A0 B 0
théorème. Il en résulte 0 00 = 0 0 , d’où A0 C 00 = A0 C 0 et C 0 = C 00 , ce qui montre
AC AC
que ∆C est parallèle à ∆A .
La partie directe du théorème de Thalès ne faisant que traduire le caractère af-
fine des projections, on peut énoncer un théorème analogue en toute dimension, en
particulier dans l’espace de dimension 3 :
Théorème 4. (Théorème de Thalès dans l’espace) Soient ΠA , ΠB , ΠC trois plans
parallèles distincts de l’espace coupant deux droites D et D0 respectivement en A, B,
C et A0 , B 0 , C 0 . Alors
AB A0 B 0
= 0 0 . (∗)
AC AC
.
Mais le théorème de Thalès dans l’espace n’admet pas de réciproque analogue à
celle du théorème de Thalès dans le plan : si on suppose les plans ΠA et ΠB parallèles
et la relation (∗) vérifiée, on ne peut en déduire que ΠC est parallèle à ΠA et ΠB . On
a cependant :
Proposition 37. Soient D et D0 deux droites de l’espace, A, B, C trois points de D,
A0 , B 0 , C 0 trois points de D0 , ces six points étant supposés tous distincts. Si
AB A0 B 0
= 0 0 ,
AC AC
0 0 0
alors les trois droites (AA ), (BB ), (CC ) sont parallèles à un même plan.
33
Démonstration : Si les droites (AA0 ) et (BB 0 ) sont parallèles, les droites D et D0 sont
coplanaires et (CC 0 ) est parallèle à (AA0 ) et (BB 0 ) par le théorème de Thalès dans le
plan.
Sinon, soient ΠA , ΠB , ΠC les plans passant respectivement par A, B, C de direction
−−→ −−→
le plan vectoriel engendré par les vecteurs AA0 et BB 0 . Ces trois plans sont parallèles et
la droite (AA0 ) (resp. (BB 0 )) est incluse dans ΠA (resp. ΠB ) de sorte que ΠA (resp. ΠB )
AB A0 B 0
coupe D0 en A0 (resp. B 0 ). Le plan ΠC coupe D0 en un point C 00 qui vérifie = 0 00
AC AC
d’après le théorème direct. Il en résulte A0 C 00 = A0 C 0 , d’où C 00 = C 0 . La droite (CC 0 )
est donc incluse dans ΠC .
34
2 Entraînement
2.1 Vrai ou faux
→
−
Vrai-Faux 1. Soit E un espace affine et E l’espace vectoriel associé. Parmi les affir-
mations suivantes, lesquelles sont vraies, lesquelles sont fausses, et pourquoi ?
→
−
1. Pour tout vecteur ~v de E , il existe un couple (A, B) de points de E et un seul
−→
tel que AB = ~v .
2. Pour tout vecteur ~v de E, il existe un couple (A, B) de points de E tel que
−→
AB = ~v .
→
−
3. Pour tout point A de E et tout vecteur ~v de E , il existe un point B de E et
−→
un seul tel que AB = ~v .
→
−
4. Pour tout couple (A, B) de points de E, il existe un unique vecteur ~v de E tel
−→
que ~v = AB.
−−→ −→ −→
5. Pour tout triplet (A, B, C) de points de E, on a BC = AB − AC.
→
−
6. Pour tout point B de E et tout vecteur ~v de E , il existe un unique point A
−→
de E tel que AB = ~v .
7. Pour tout couple (A, B) de points de E, il existe un unique point C de E tel
−→ −−→
que CA = CB.
Vrai-Faux 2. Soit E un espace affine et A, B, C trois points de E. Parmi les affirmations

−→ −−→ −→
1. Le vecteur OA − 2 OB + OC ne dépend pas du point O de E.
−−→ −→ −−→ −→
2. Le point M défini par OM = OA − 2 OB + OC ne dépend pas du point O de
E.
−−→ −→ −−→ −→
3. Le point M défini par OM = OA − OB + OC ne dépend pas du point O de
E.
−−→ −→ −−→ −→
4. Le point M défini par 4 OM = OA + 2 OB + OC ne dépend pas du point O
de E.
−→ −−→ −→
5. Le vecteur ~v défini par 3 ~v = OA + OB + OC ne dépend pas du point O de E.
Vrai-Faux 3. Soit E un espace affine, n et m deux entiers strictement positifs, A1 , . . . , An

et B1 , . . . , Bm des points de E, G l’isobarycentre des points A1 , . . . , An , H l’isobary-
centre des points B1 , . . . , Bm , K l’isobarycentre des n+m points A1 , . . . , An , B1 , . . . , Bm .
Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et pour-
quoi ?
1. K est toujours le milieu du segment [GH].
2. K appartient toujours au segment [GH].
35
−−→ −−→
3. n KG = m KH.
−−→ −−→
4. n KG + m KH = ~0.
5. H appartient à la droite (KG) (en supposant G 6= K).
6. H appartient au segment [KG].
−−→ P n −−→
7. n KG = KAi .
i=1
8. K = H si et seulement si H = G.
1. Tout segment est convexe.
2. Une droite privée d’un point est convexe.
3. Un plan privé d’un point est convexe.
4. Le graphe d’une fonction convexe de R dans R est convexe.
5. Le graphe d’une fonction affine de R dans R est convexe.
6. L’enveloppe convexe de la réunion de deux droites sécantes est le plan conte-
nant ces droites.
7. L’enveloppe convexe d’une partie bornée du plan est bornée.
8. L’enveloppe convexe de la réunion de deux droites non coplanaires de l’espace
E de dimension 3 est E.
Vrai-Faux 5. Soit, dans un espace affine E, h une homothétie de centre A et de rapport
λ 6= 1 et f une transformation affine de E telle que f (A) 6= A. Parmi les affirmations
1. f ◦ h = h ◦ f .
2. f ◦ h ◦ f −1 est une homothétie de rapport λ.
3. f ◦ h ◦ f −1 est une homothétie de centre A.
4. h−1 est une homothétie de centre A.
5. h ◦ f ◦ h−1 est une homothétie de centre A.
Vrai-Faux 6. Le cadre est un espace affine de dimension trois. Dire pour chacune des
affirmations suivantes si elle est vraie ou fausse (en justifiant votre réponse).
1. Si deux droites sont parallèles à un même plan, elles sont parallèles entre elles.
2. Si deux plans sont parallèles, toute droite qui coupe l’un coupe l’autre.
3. Si une droite D est parallèle à un plan P , tout plan non parallèle à P rencontre
D.
4. Étant donnés deux plans sécants, toute droite parallèle à ces deux plans est
parallèle à leur intersection.
36
5. Étant données deux droites non coplanaires, il existe toujours au moins un

plan tel que ces deux droites soient parallèles à ce plan.
6. Étant donnés deux plans sécants, deux droites parallèles à chacun de ces deux
plans sont nécessairement parallèles entre elles.
7. Soient D et D0 deux droites non parallèles de l’espace ; il existe un plan P et
un seul contenant D tel que D0 soit parallèle à P .
1. Toute transformation affine qui transforme toute droite en une droite parallèle
est une homothétie ou une translation.
2. Toute transformation affine dont la partie linéaire est −id est une symétrie
centrale.
3. Toute transformation affine admettant un point fixe et un seul est une homo-
thétie.
4. Toute transformation affine dont la partie linéaire est l’identité est une trans-
lation.
5. Toute transformation affine qui transforme deux droites parallèles quelconques
en deux droites parallèles est une homothétie ou une translation.
6. Toute transformation affine transforme un parallélogramme non aplati en un
parallélogramme non aplati.
1. Une figure bornée du plan ne peut pas admettre deux centres de symétrie
distincts.
2. Une figure bornée du plan ne peut pas admettre deux axes de symétrie dis-
tincts.
3. Toute transformation affine du plan conservant globalement une droite possède
au moins un point fixe.
4. Toute transformation affine du plan conservant globalement un ensemble fini
de points possède au moins un point fixe.
5. Toute application affine p du plan dans lui-même vérifiant p ◦ p = p est une
projection.
6. Toute application affine p du plan dans lui-même vérifiant p~ ◦ p~ = p~ est une
projection.
7. Si s est une symétrie de l’espace par rapport à une droite D dans la direction
d’un plan P , pour tout couple (M, N ) de points n’appartenant pas à D les droites
(M s(M )) et (N s(N )) sont parallèles.
8. Toute application affine s de l’espace affine E dans lui-même vérifiant s◦s = idE
est une symétrie affine .
37
2.2 Exercices
Exercice 1. On appelle médianes d’un triangle non aplati ABC les trois droites (AA0 ),
(BB 0 ), (CC 0 ) joignant un sommet de ce triangle au milieu du côté opposé.
1. Écrire l’isobarycentre G d’un triangle ABC comme barycentre des points A et A0
(resp. B et B 0 , C et C 0 ), où A0 , B 0 , C 0 sont les milieux respectifs de [BC], [CA],
−−→ −−→ −−→ −−→ −−→ −−→
[AB]. Montrer que A0 A = 3 A0 G, B 0 B = 3 B 0 G, C 0 C = 3 C 0 G.
2. En déduire que l’isobarycentre d’un triangle non aplati appartient aux trois mé-
dianes de ce triangle, qui sont donc concourantes.
Exercice 2. Soient A et B deux points d’un espace affine E et I le milieu du segment
[AB]. Pour tout point M de E, on note M 0 l’isobarycentre des trois points A, B, M .
−−→ −−→
1. Comparer les vecteurs IM et IM 0 .
2. En déduire la nature géométrique de l’application de E dans E qui à tout point
M associe le point M 0 .
Exercice 3. Triangle des milieux
Soit ABC un triangle, A0 , B 0 , C 0 les milieux des segments [BC], [CA], [AB], G
l’isobarycentre des points A, B, C.
1. Montrer que G est l’isobarycentre des trois points A0 , B 0 , C 0 .
2. En déduire que le triangle A0 B 0 C 0 (qu’on appellera triangle des milieux du triangle
ABC) est l’image du triangle ABC par une homothétie dont on précisera le centre
et le rapport.
−−→ −−→ −→ −−→ −→ −−→
3. Montrer que BC = −2 B 0 C 0 , CA = −2 C 0 A0 , AB = −2 A0 B 0 .
4. Étant donné un triangle A0 B 0 C 0 , montrer qu’il existe un triangle ABC et un seul
dont il est le triangle des milieux. Donner, dans le cas où le triangle A0 B 0 C 0 n’est
pas aplati, une construction du triangle ABC ne faisant intervenir que des tracés
de parallèles.
Exercice 4. Quadrilatère des milieux
Soit, dans un plan affine E, ABCD un quadrilatère, I, J, K, L, M , N les milieux
respectifs des segments [AB], [BC], [CD], [DA], [AC], [BD].
1. Montrer que les segments [IK], [JL] et [M N ] ont tous pour milieu l’isobarycentre
des quatre points A, B, C, D.
2. En déduire que IJKL, IM KN et JM LN sont des parallélogrammes.
−
→ −−→ −−→ −−→ −−→ −→
3. Retrouver ces résultats en exprimant les vecteurs IJ, LK, IM , N K, JM , N L
−→ −−→ −→
en fonction des vecteurs AC, BC, BA.
Exercice 5. Soit dans l’espace ABCD un tétraèdre non aplati. On appelle bimédianes
de ce tétraèdre les trois segments joignant les milieux de deux arêtes opposées et mé-
dianes les quatre segments [AA0 ], [BB 0 ], [CC 0 ], [DD0 ] joignant un sommet à l’isobary-
centre des trois autres sommets. Montrer que l’isobarycentre G des points A, B, C, D
38
est le milieu des trois bimédianes et qu’il appartient aux quatre médianes. Comparer
−−→ −−→ −−→ −−→ −−→ −−→ −−→ −−→
les vecteurs A0 G et A0 A (resp. B 0 G et B 0 B, C 0 G et C 0 C, D0 G et D0 D).
Exercice 6. Soit, dans l’espace affine de dimension 3, D1 une droite définie par un
point A et un vecteur directeur ~u et D2 une droite définie par un point B et un vecteur
directeur ~v . Montrer que D1 et D2 sont coplanaires si et seulement si les trois vecteurs
−→
~u, ~v et AB sont liés.
Exercice 7. Soit, dans l’espace affine de dimension 3 rapporté à un repère cartésien, P
un plan d’équation ax + by + cz + d = 0 et D une droite de vecteur directeur ~u(α, β, γ).
Donner une condition pour que D soit parallèle à P .
Exercice 8. L’espace de dimension 3 est rapporté à un repère cartésien. Écrire l’équa-
tion du plan passant par le point (0, 1, 0) et parallèle au plan d’équation x+y−z+3 = 0.
Exercice 9. Soit, dans l’espace affine de dimension 3 rapporté à un repère cartésien, D
la droite d’équations x + y − z + 3 = 0, 2x + z − 2 = 0. Donner l’équation du plan P
contenant D et passant par le point (1, 1, 1).
Exercice 10. Soient P1 , P2 , P3 trois plans de l’espace de dimension trois, deux à deux
non parallèles. Montrer que les trois droites D1 = P2 ∩ P3 , D2 = P3 ∩ P1 , D3 = P1 ∩ P2
sont parallèles ou concourantes.
Exercice 11. Dans l’espace affine de dimension 3 rapporté à un repère cartésien, soit
D la droite de vecteur directeur (3, −1, 1) passant par le point de coordonnées (2, 0, 1),
P le plan passant par le point (1, −1, 1) et de vecteurs directeurs (2, −3, 1) et (1, 2, 0),
P 0 le plan passant par le point (−5, 3, 0) et de vecteurs directeurs (−1, 1, 1) et (0, 3, 1).
Déterminer P ∩ D et D ∩ P 0 .
Exercice 12. 1. Montrer que trois droites D, D0 , D00 du plan affine, d’équations
respectives ax + by + c = 0, a0 x + b0 y + c0 = 0, a00 x + b00 y + c00 = 0 dans un repère
cartésien, sont concourantes ou parallèles si et seulement si

a b c

0
a b0 c0 = 0 .
00
b00 c00

a
2. En déduire le théorème de Céva : soit ABC un triangle, P , Q, R trois points

situés respectivement sur les droites (BC), (AC), (AB), distincts des sommets
de ce triangle ; alors les droites (AP ), (BQ), (CR) sont concourantes ou parallèles
si et seulement si
P B QC RA
× × = −1 .
PC QA RB
Exercice 13. Soit ABC un triangle non aplati du plan affine E et (~i, ~j) une base de
→
− →
−
E . On note, pour tout couple (~u, ~v ) de vecteurs de E , det(~u, ~v ) le déterminant de ce
couple de vecteurs dans la base (~i, ~j).
39
−→ −→ −−→ −→ −→ −−→
1. Montrer que det(AB, AC) = det(BC, BA) = det(CA, CB).
On appellera aire orientée du triangle ABC, l’unité d’aire étant l’aire du paral-
1 −→ −→
lélogramme construit sur les vecteurs ~i et ~j, le nombre det(AB, AC).
2
2. Soit M un point de E de coordonnées barycentriques réduites (α, β, γ) dans le
−−→ −−→
repère (A, B, C). Exprimer les vecteurs M B et M C en fonction des vecteurs
−→ −→ −−→ −−→
AB et AC. En déduire une expression de det(M B, M C) en fonction α, β, γ et
−→ −→
det(AB, AC).
3. Montrer que les médianes d’un triangle partagent ce triangle en six petits triangles
de même aire.
Exercice 14. Soient A, B, C trois points distincts d’une droite affine. Montrer que l’un,
et l’un seulement, de ces points appartient au segment défini par les deux autres.
Exercice 15. Soit (A, B, C) un repère affine du plan affine E. Montrer que trois
points M1 , M2 , M3 de E de coordonnées barycentriques réduites respectives (α1 , β1 , γ1 ),
(α2 , β2 , γ2 ), (α3 , β3 , γ3 ) dans le repère affine (A, B, C) sont alignés si et seulement si

α1 β1 γ1

α2 β2 γ2 = 0 .

α3 β3 γ3
Exercice 16. 1. Soit E un espace affine, F1 et F2 deux sous-espaces affines de E

et k un réel. Montrer que l’ensemble F des points kM1 + (1 − k)M2 , pour M1
parcourant F1 et M2 parcourant F2 , est un sous-espace affine de E.
2. Préciser la nature de F quand F1 et F2 sont deux droites de l’espace affine de
dimension 3 (on discutera selon la position de ces droites).
Exercice 17. Montrer que l’enveloppe convexe de trois points A, B, C non alignés
du plan est la réunion des segments [A, M ] pour M parcourant le segment [B, C].
Représenter cette enveloppe convexe sur un dessin.
Exercice 18. Soient A et B deux parties non vides d’un espace affine E. On appelle
jonction de A et B, et on note Jonc(A, B) la réunion de tous les segments joignant un
point quelconque de A à un point quelconque de B, i. e. l’ensemble des M ∈ E tels
qu’il existe P ∈ A et Q ∈ B tels que M ∈ [P Q].
1. Soit P une partie non vide de E. Comparer Conv(P) et Jonc(P, P). Dessiner
Conv(P) et Jonc(P, P) lorsque P est un ensemble de trois points non alignés.
2. Soit A et B deux convexes d’un espace affine E. Comparer Jonc(A, B) et Conv(A∪
B).
3. Dans R2 , déterminer Conv(P) lorsque P est la réunion de la droite d’équation
y = 0 et du point (0, 1).
40
Exercice 19. Cônes convexes

Soit C un convexe d’un espace affine E et O un point de E. Montrer que la réunion
des demi-droites fermées d’origine O passant par M , pour M décrivant C, est un
convexe.
Exercice 20. Régionnement du plan par les droites portant les côtés d’un triangle
On considère dans le plan affine un triangle non aplati ABC et on note (α, β, γ) les
coordonnées barycentriques réduites d’un point M dans le repère affine (A, B, C).
1. Montrer que les droites (BC), (CA), (AB) portant les côtés du triangle ABC
ont respectivement comme équations barycentriques α = 0, β = 0, γ = 0.
2. Montrer que ces trois droites divisent le plan en 7 régions, qu’on caractérisera
par les signes des coordonnées barycentriques réduites d’un point.
Exercice 21. Régionnement de l’espace par les plans portant les faces d’un tétraèdre
On considère dans l’espace un tétraèdre non aplati ABCD et on note (α, β, γ, δ) les
coordonnées barycentriques réduites d’un point M dans le repère affine (A, B, C, D).
1. Montrer que les plans (BCD), (CDA), (DAB), (ABC) portant les faces du
tétraèdre ont respectivement comme équations barycentriques α = 0, β = 0,
γ = 0, δ = 0.
2. Montrer que ces quatre plans divisent l’espace en 15 régions, qu’on caractérisera
par les signes des coordonnées barycentriques réduites d’un point.
Exercice 22. Montrer que l’image d’un parallélogramme par une transformation affine
est un parallélogramme. L’image par une transformation affine d’un quadrilatère qui
n’est pas un parallélogramme peut-elle être un parallélogramme ?
Exercice 23. Soient A et A0 deux points d’un espace affine E.

1. Montrer qu’il existe une unique symétrie centrale qui envoie A sur A0 . Déterminer
son centre.
2. Montrer que, pour tout λ 6= 1, il existe une unique homothétie de rapport λ qui
envoie A sur A0 . Déterminer son centre.
Exercice 24. Soit, dans le plan affine, ABC un triangle, A0 , B 0 , C 0 les milieux respectifs
de [BC], [CA] et [AB], sA0 , sB 0 , sC 0 les symétries centrales de centres ces points.
Déterminer la nature géométrique des transformations sB 0 ◦ sA0 et sC 0 ◦ sB 0 ◦ sA0 (on
pourra déterminer l’image de B par ces deux transformations).
Exercice 25. Déterminer le sous-groupe du groupe affine GA(E) d’un espace affine E
engendré par les symétries centrales.
Exercice 26. Soit, dans le plan affine, D et D0 deux droites sécantes en un point A, et
I un point n’appartenant à aucune de ces droites. Construire un triangle ABC tel que
B appartienne à D, C appartienne à D0 et I soit le milieu de [BC] :
41
a) en considérant les parallèles à D et D0 menées par I ;

b) en considérant la droite symétrique de D0 par rapport à I.
Exercice 27. Conjuguée d’une translation

→
−
1. Soit E un espace affine, f une transformation affine de E et ~u un vecteur de E .
Montrer que f ◦ t~u ◦ f −1 est la translation de vecteur f~(~u).
2. En déduire que le centre du groupe affine est réduit à l’identité.
Exercice 28. Soit E un espace affine, O un point de E et f un élément de GA(E).

Montrer que l’application g 7−→ f ◦ g ◦ f −1 est un isomorphisme de Stab(O) sur
Stab(f (O)).
Il en résulte que les stabilisateurs de tous les points de E sont des sous-groupes
conjugués de GA(E).
Exercice 29. Soit f une transformation affine d’un espace affine E dont la partie
linéaire f~ est une homothétie vectorielle de rapport λ 6= 1.
1. Soit A un point quelconque de E. Montrer que le barycentre O du système de
points pondérés [(A, λ), (f (A), −1)] est fixe par f .
2. En déduire (sans utiliser la proposition 35) que f est l’homothétie affine de centre
O et de rapport λ.
Exercice 30. 1. Déterminer les droites globalement invariantes par une translation
de vecteur non nul (resp. par une homothétie de rapport différent de 1).
2. En déduire que la composée de deux homothéties de centres distincts A et B est
−→
– soit une translation de vecteur proportionnel à AB ;
– soit une homothétie dont le centre appartient à la droite (AB).
Exercice 31. Soient A et B deux points d’un espace affine E et f l’application de E

dans E qui à tout point M de E associe le point f (M ) défini par
−−−−−→ −−→ −−→
M f (M ) = 4 AM − 2 BM .
−−−−−−−→ −−→
1. Comparer les vecteurs f (M )f (N ) et M N pour tout couple (M, N ) de points de
E.
2. En déduire que f est affine. Expliciter sa partie linéaire.
3. En déduire la nature géométrique de f . Préciser ses points fixes.
Exercice 32. Soit, dans le plan affine, (D1 , D2 , D3 ) et (D10 , D20 , D30 ) deux triplets consti-
tués chacun de trois droites distinctes concourantes en un point O (resp. O0 ). Le but
de l’exercice est de montrer qu’il existe une transformation affine du plan transformant
le premier triplet en le second.
42
1. Soit A (resp. A0 ) un point de D1 (resp. D10 ) distinct de O (resp. O0 ), B (resp. B 0 )

son projeté sur D2 (resp. D20 ) dans la direction de D3 (resp. D30 ), C (resp. C 0 )
son projeté sur D3 (resp. D30 ) dans la direction de D2 (resp. D20 ). Montrer que
−−→ −→ −−→ −−→
(O, OB, OC) (resp. (O0 , O0 B 0 , O0 C 0 )) est un repère cartésien du plan. Donner les
coordonnées du point A (resp. A0 ) dans ce repère.
2. En déduire qu’il existe une transformation affine f et une seule du plan vérifiant
f (O) = O0 , f (B) = B 0 , f (C) = C 0 , f (A) = A0 .
3. Montrer que f (Di ) = Di0 pour i = 1, 2, 3.
4. Si f et g sont deux transformations affines du plan vérifiant f (Di ) = Di0 et
g(Di ) = Di0 pour i = 1, 2, 3, montrer que h = f −1 ◦ g est une homothétie de
centre O (on pourra considérer les images des points O, A, B, C par h).
Exercice 33. Soit F une partie d’un espace affine possédant deux centres de symétrie
distincts A et B.
1. Montrer qu’il existe une translation de vecteur non nul laissant F globalement
invariante, puis qu’il existe une infinité de telles translations.
2. En déduire que F ne peut être bornée.
3. Montrer que F possède une infinité de centres de symétrie.
Exercice 34. Soit f une application affine d’un espace affine E dans lui-même et F =
{M1 , · · · , Mn } un ensemble fini de points de E. On suppose que f (F) = F. Montrer
que f admet au moins un point fixe.
Exercice 35. Soit G un sous-groupe fini de GA(E). Montrer qu’il existe au moins un
point de E qui est fixe par tout élément de G. (On pourra considérer l’isobarycentre
de la famille f (M ) où M est un point de E et f parcourt G.)
Exercice 36. Le trapèze
43
Soit ABCD un trapèze de bases AB et CD. On note K et L les milieux des segments
[AB] et [CD] et on suppose que les droites (AD) et (BC) se coupent en un point I et
les droites (AC) et (BD) en un point J.
IA
1. Montrer que l’homothétie hI de centre I et de rapport transforme D en A,
ID
C en B et L en K. En déduire que les points I, K, L sont alignés.
JC
2. Montrer de même, en considérant l’homothétie hJ de centre J et de rapport ,
JA
que les points J, K, L sont alignés.
3. Montrer que la composée hJ ◦ hI de ces deux homothéties est la symétrie centrale
de centre L.
IK JL
= −1 .
IL JK
Exercice 37. Un cas particulier du théorème de Desargues
Montrer que deux triangles non aplatis du plan affine se déduisent l’un de l’autre
par une homothétie ou une translation si et seulement si leurs côtés sont deux à deux
parallèles.
On verra en compléments (section 3.4) le théorème de Desargues dans toute sa
généralité.
Exercice 38. Un problème de construction

Soient D1 et D2 deux droites sécantes du plan affine E et M un point de E n’ap-
partenant à aucune de ces droites. On suppose que le point d’intersection O de D1 et
D2 est situé hors du cadre de la figure. Donner une construction de la droite (OM ) (on
pourra s’inspirer de la figure).
44
Exercice 39. Deux cas particuliers du théorème de Pappus
1. Soient D et D0 deux droites parallèles du plan affine, A, B, C trois points de

D, A0 , B 0 , C 0 trois points de D0 . On suppose (AB 0 ) et (BA0 ) parallèles, ainsi
que (AC 0 ) et (CA0 ). Montrer que (BC 0 ) et (CB 0 ) sont parallèles. (On pourra
−−→ −−→
comparer les vecteurs BC et C 0 B 0 .)
2. Même question en supposant les droites D et D0 sécantes en un point O (distinct
des points A, B, C, A0 , B 0 , C 0 ). (On pourra utiliser le théorème de Thalès.)
Exercice 40. Le tourniquet dans le triangle

Par un point D du côté AB d’un triangle ABC on trace la parallèle à (BC) qui
coupe (AC) en E ; par E on trace la parallèle à (AB) qui coupe (CB) en F ; par F on
trace la parallèle à (CA) qui coupe (BA) en G ; par G on trace la parallèle à (BC) qui
coupe (AC) en H ; par H on trace la parallèle à (AB) qui coupe (CB) en I ; par I on
trace la parallèle à (CA) qui coupe (BA) en J.
45
1. Montrer que l’application f de la droite (AB) dans elle-même qui au point D

associe le point J est affine.
2. Déterminer les images des points A et B par f .
3. En déduire que J = D.
4. Redémontrer ce résultat en utilisant le théorème de Thalès.
Exercice 41. Théorème de Ménélaüs

Soit ABC un triangle non aplati, P , Q, R trois points situés respectivement sur les
droites (BC), (CA) et (AB) et distincts des sommets A, B, C. Alors les points P , Q,
R sont alignés si et seulement si :
P B QC RA
= 1.
P C QA RB
Indication : pour la partie directe, on pourra projeter sur une droite (par exemple BC)
dans la direction de la droite P QR.
46
Exercice 42. Le théorème de Ménélaüs en dimension quelconque

Soit (A0 , A1 , . . . , An ) un repère affine d’un espace affine E de dimension n. On pose
An+1 = A0 . Soit, pour i = 0, . . . , n, Mi un point de la droite (Ai Ai+1 ) distinct de Ai et
Ai+1 . Montrer que les points Mi (i = 0, . . . , n) appartiennent à un même hyperplan si
et seulement si :
n
Y Mi Ai
=1
i=0 Mi Ai+1
(on pourra considérer la composée des homothéties de centre Mi transformant Ai en
Ai+1 ).
Exercice 43. Théorème de Ceva
Soit ABC un triangle non aplati, P , Q, R trois points situés respectivement sur les
droites (BC), (CA) et (AB) et distincts des sommets A, B, C. Alors les droites (AP ),
(BQ) et (CR) sont concourantes ou parallèles si et seulement si :
P B QC RA
= −1 .
P C QA RB
47
Indication : dans le cas des droites concourantes, on pourra par exemple appliquer le
théorème de Ménélaüs à des triangles et des sécantes bien choisis.
Exercice 44. Soit ABC un triangle non aplati, A0 le symétrique de A par rapport à
B, B 0 le symétrique de B par rapport à C, C 0 le symétrique de C par rapport à A. Le
but de l’exercice est de reconstruire le triangle ABC à partir du seul triangle A0 B 0 C 0 .
1. Soit A1 l’intersection des droites (AB) et (B 0 C 0 ), B1 l’intersection des droites

(BC) et (C 0 A0 ), C1 l’intersection des droites (CA) et (A0 B 0 ), A2 l’intersection de
la droite (B 0 C 0 ) et de la parallèle à (AB) menée par C, B2 l’intersection de la
droite (C 0 A0 ) et de la parallèle à (BC) menée par A, C2 l’intersection de la droite
(A0 B 0 ) et de la parallèle à (CA) menée par B. Montrer en utilisant le théorème de
Thalès que A1 est le milieu de [C 0 A2 ] et que A2 est le milieu de [B 0 A1 ]. Démontrer
des relations analogues pour les autres côtés du triangle A0 B 0 C 0 .
2. En déduire une construction du triangle ABC à partir du triangle A0 B 0 C 0 .
Exercice 45. Soit, dans le plan affine E, ABC un triangle non aplati, ∆A , ∆B , ∆C les
médianes de ce triangle issues de A, B et C. On note
– s1 la symétrie par rapport à ∆A dans la direction de (BC)
– s2 la symétrie par rapport à ∆B dans la direction de (CA)
– s3 la symétrie par rapport à ∆C dans la direction de (AB)
– f = s3 ◦ s2 ◦ s1 la composée de ces trois symétries.
1. Déterminer les images par s1 , s2 , s3 et f des points A, B, C.
2. En déduire la nature géométrique de f .
Exercice 46. Soit, dans un plan affine E rapporté à un repère cartésien (O,~i, ~j), D la
droite d’équation x − y + 2 = 0 et ~v le vecteur de composantes (2, 1). Exprimer les
coordonnées (x0 , y 0 ) du projeté M 0 d’un point M de E sur la droite D dans la direction
du vecteur ~v en fonction des coordonnées (x, y) de M .
Exercice 47. Le plan affine est rapporté à un repère cartésien. Déterminer la nature
géométrique des applications affines données en coordonnées par les formules :
48

 x0 =y
1.
y 0 =x

 x0
= −x − 2y − 2
2.  0
y = x + 2y + 1

 x0
= 3x − 4
3.  0
y = 3y + 3
Exercice 48. Le plan affine est rapporté à un repère cartésien (O,~i, ~j). Donner l’ex-
pression en coordonnées des applications affines suivantes :
– la symétrie centrale de centre A(a, b) ;
– la symétrie par rapport à la droite d’équation x + y = 1, dans la direction du
vecteur ~i ;
– l’affinité de base la droite d’équation x − y − 1 = 0, de direction ~v (2, 1) et de
rapport 2.
Exercice 49. Soit, dans l’espace affine E de dimension 3 rapporté à un repère cartésien
→
−
(0,~i, ~j, ~k), P le plan d’équation 2x−3y +8z −4 = 0 et D la droite vectorielle de vecteur
directeur ~u = 3~i − 2~j − ~k. Donner l’expression en coordonnées de la projection sur P
→
− →
−
dans la direction D , puis, pour tout réel λ, de l’affinité de base P , de direction D et
de rapport λ.
Exercice 50. Soit s une application affine d’un espace affine E dans lui-même vérifiant
s ◦ s = idE .
1. Montrer que s est bijective.
2. Montrer que pour tout point M de E, le milieu du segment [M s(M )] est fixe par
s.
→
−
3. Montrer que la partie linéaire ~s de s est une symétrie vectorielle de E .
4. Conclure que s est une symétrie affine de E.
5. Montrer par un contre-exemple qu’une transformation affine de E dont la partie
→
−
linéaire est une symétrie vectorielle de E n’est pas nécessairement une symétrie
affine.
2.3 QCM
rapporte 2 points.
49
Question 1. Soit ABC un triangle non aplati, A0 , B 0 , C 0 les milieux des segments [BC],
[CA], [AB].
−−→ −−→
A BC = 2 B 0 C 0 .
B Les droites (AC) et (A0 C 0 ) sont parallèles.
C Il existe une homothétie de rapport 1/2 transformant le triangle ABC en le
triangle A0 B 0 C 0 .
D Les segments [A0 B 0 ] et [CC 0 ] ont même milieu.
E Les segments [AA0 ] et [BB 0 ] ont même milieu.
Question 2. Soit ABC un triangle non aplati, A0 , B 0 , C 0 les milieux des segments
[BC], [CA], [AB], M un point de coordonnées barycentriques réduites (α, β, γ) dans
le repère affine (A, B, C).
A M appartient à la droite (BC) si et seulement si α = 1.
B M appartient à la droite (B 0 C 0 ) si et seulement si β = γ.
C M appartient à la droite (AA0 ) si et seulement si β = γ.
D M appartient à la parallèle à (BC) menée par A si et seulement si β = −γ.
E ABCM est un parallélogramme si et seulement si β = −γ.
Question 3. Soit, dans un espace affine de dimension 3 rapporté à un repère cartésien
(O,~i, ~j, ~k), P1 , P2 , P3 les trois plans d’équations respectives :
P1 : 2x − y − z = 2
P2 : y − z = 1
P3 : 3x − y − 2z = 0 .
A Les plans P1 et P3 sont parallèles.

B Il existe une droite contenue dans les trois plans P1 , P2 , P3 .
C Le vecteur (1, 1, 1) est un vecteur directeur de l’intersection de P1 et P2 .
D L’intersection P1 ∩ P2 ∩ P3 des trois plans P1 , P2 , P3 est réduite à un point.
E Les intersections deux à deux des trois plans P1 , P2 , P3 sont des droites paral-
lèles.
Question 4. Soient A, B, C, D quatre points non coplanaires de l’espace affine de
dimension 3, I, J, K, L les milieux respectifs des segments [AB], [BC], [CD] et [DA].
A Les centres de gravité des quatre triangles ABC, BCD, CDA et DAB sont
coplanaires.
B Le plan défini par les centres de gravité des triangles ABC, ACD, ABD est
parallèle au plan (BCD).
C Le quadrilatère IJKL est un parallélogramme.
D Le plan défini par les centres de gravité des triangles ABC, ACD, ABD se
déduit du plan (BCD) par une homothétie de centre A et de rapport 1/2.
E La droite (IK) est parallèle à la droite (AD).
50
Question 5. Les parties suivantes du plan affine R2 sont convexes :

A {(x, y) ∈ R2 | x ≥ 1, y ≤ 2 } ;
B {(x, y) ∈ R2 | x2 + y 2 = 1 } ;
C {(x, y) ∈ R2 | x2 + y 2 ≤ 1 } ;
D {(x, y) ∈ R2 | x2 + y 2 ≥ 1 } ;
E {(x, y) ∈ R2 | y − x2 ≤ 0 }.
Question 6. On considère, dans le plan affine euclidien, les figures suivantes :
Q A B C D E
Il existe une transformation affine du plan transformant le carré Q en :
A A.
B B.
C C.
D D.
E E.
Question 7. Soient A et B deux points distincts d’un espace affine, sA et sB les symé-
−→
tries centrales de centres A et B, et ~u = AB.
A sA ◦ sB = t2~u .
B sA ◦ t~u = t~u ◦ sA .
C sA ◦ t~u est une symétrie centrale.
D sA ◦ sB = sB ◦ sA .
E sA ◦ t~u ◦ sA = t−~u .
Question 8. Soient f , g, h les applications du plan affine P rapporté à un repère

cartésien (O,~i, ~j) dans lui-même définies par les formules :
f : x0 = y, y 0 = x ;
g : x0 = −x − 2y − 2, y 0 = x + 2y + 1 ;
h : x0 = 3x − 4, y 0 = 3y + 3.
A h est une homothétie de rapport 3.

B f est une symétrie centrale.
C g ◦ g = idP .
51
D f est la symétrie par rapport à la droite d’équation x + y = 0 dans la direction

du vecteur (1, 1).
E g est une projection affine.
Question 9. Soit, dans le plan affine E, ABCD un parallélogramme et I le milieu de

[AC].
A Il existe une translation t et une seule vérifiant t(A) = B et t(D) = C.
B Il existe une transformation affine f et une seule vérifiant f (A) = B et f (D) =
C.
C L’identité est la seule transformation affine de E conservant globalement l’en-
semble {A, B, C, D}.
D Toute transformation affine de E conservant globalement l’ensemble {A, B, C, D}
laisse fixe I.
E Pour toute permutation σ des quatre points A, B, C, D, il existe une transforma-
tion affine f de E et une seule vérifiant f (A) = σ(A), f (B) = σ(B), f (C) = σ(C),
f (D) = σ(D).
Question 10. Soit, dans l’espace affine E de dimension 3, ABCD un tétraèdre non
aplati et G l’isobarycentre de ses sommets.
A Il n’existe pas de symétrie affine par rapport à un plan conservant globalement
le tétraèdre.
B Pour toute permutation σ des quatre points A, B, C, D, il existe une transforma-
tion affine f de E et une seule vérifiant f (A) = σ(A), f (B) = σ(B), f (C) = σ(C),
f (D) = σ(D).
C Il existe une symétrie centrale et une seule conservant globalement le tétraèdre.
D Il y a exactement 6 symétries affines conservant globalement le tétraèdre.
E Toute transformation affine de E conservant globalement le tétraèdre laisse fixe
le point G.
Réponses : 1–BD 2–CD 3–CE 4–BC 5–AC 6–CD 7–CE 8–AE 9–AD 10–BE
2.4 Devoir
répondu.
1. Soit ABC un triangle non aplati d’un plan affine E et M le point de coordonnées
barycentriques (1, −1, 1) dans le repère affine (A, B, C) de E. Montrer que le
quadrilatère ABCM est un parallélogramme.
52
2. Soit E un espace affine de dimension n rapporté à un repère cartésien (O, e~1 , . . . , e~n ).
Donner l’équation de la direction d’un hyperplan affine d’équation a0 +a1 x1 +· · ·+
an xn = 0. Donner une condition nécessaire et suffisante pour que deux hyperplans
affines d’équations respectives a0 +a1 x1 +· · ·+an xn = 0 et a00 +a01 x1 +· · ·+a0n xn = 0
soient parallèles.
3. Donner deux caractérisations de l’enveloppe convexe d’une partie non vide d’un
espace affine.
4. Donner la nature géométrique de la composée de deux homothéties.
5. Montrer qu’une application affine f d’un espace affine E dans lui-même dont la
partie linéaire est −id−
→ est une symétrie centrale.
E
Exercice 1 : Dans l’espace affine E de dimension 3 rapporté à un repère cartésien

(O,~i, ~j, ~k), soit Π le plan d’équation 2x − 3y + z + 1 = 0 et ~v le vecteur de composantes
(2, 1, −2). On note p la projection sur Π dans la direction du vecteur ~v et s la symétrie
par rapport au plan Π dans la direction de ~v .
1. Écrire les coordonnées (x0 , y 0 , z 0 ) du point M 0 = p(M ) en fonction des coordonnées
(x, y, z) du point M .
2. En déduire la matrice P dans la base (~i, ~j, ~k) de la partie linéaire p~ de p.
3. Calculer la matrice P 2 . Quel est le rang de P ?
4. Écrire les coordonnées (x00 , y 00 , z 00 ) du point M 00 = s(M ) en fonction des coordon-
nées (x, y, z) du point M .
5. En déduire la matrice S dans la base (~i, ~j, ~k) de la partie linéaire ~s de s. Calculer
S 2.
6. Soit α un réel. On rappelle que l’affinité a de base Π, de direction la droite
vectorielle R~v engendrée par ~v et de rapport α est l’application de E dans E
−−−−−−−→ −−−−−→
définie par p(M )a(M ) = αp(M )M pour tout point M de E. Écrire, pour tout
−−−−−−−→ −−→
couple (M, N ) de points de E, le vecteur a(M )a(N ) en fonction des vecteurs M N
−−−−−−−→
et p(M )p(N ).
7. En déduire que a est affine et exprimer sa partie linéaire ~a en fonction de p~ et
de id−
→ . Exprimer la matrice A de ~
E
a en fonction de la matrice P et de la matrice
identité.
8. Déterminer un polynôme du second degré annulant A.
Exercice 2 :
Le but de l’exercice est d’étudier l’application m qui à un n-uplet (A1 , . . . , An ) de
points d’un espace affine E associe le n-uplet (B1 , . . . , Bn ), où n ≥ 2 est un entier fixé
et, pour i = 1, . . . , n − 1, Bi est le milieu du segment [Ai Ai+1 ] et Bn est le milieu du
segment [An A1 ]. On note, pour tout point A de E, sA la symétrie centrale de centre A.
53
1. Montrer que la composée sB ◦ sA de deux symétries centrales est une translation

dont on exprimera le vecteur en fonction de A et B. En déduire que la composée
d’un nombre pair de symétries centrales est une translation.
2. Montrer que la composée d’un nombre impair de symétries centrales est une
symétrie centrale.
3. Soit (A1 , . . . , An ) un n-uplet de points de E et (B1 , . . . , Bn ) les points définis
précédemment. On définit, pour k = 1, . . . , n, des applications fk de E dans E
par f1 = sB1 et fk = sBk ◦ fk−1 pour k ≥ 2. Déterminer fk (A1 ) pour 1 ≤ k ≤ n.
4. On suppose n impair.
a) Montrer que fn est une symétrie centrale dont on précisera le centre. En
déduire que l’application m est une bijection de l’ensemble des n-uplets de
points de E sur lui-même.
b) Donner une construction des points Ai connaissant les points Bi .
5. On suppose n pair.
a) Montrer que fn est une translation dont on écrira le vecteur en fonction des
points B1 , . . . , Bn . En déduire une relation vérifiée par ces points.
b) Déterminer l’image de l’application m. Cette application est-elle injective ?

1. Le point M ayant (1, −1, 1) comme coordonnées barycentriques normalisées dans
le repère affine (A, B, C), on a, pour tout point O de E :
−−→ −→ −−→ −→ −→ −−→
OM = OA − OB + OC = OA + BC .
−−→ −−→
En particulier, pour O = A, on a AM = BC, ce qui montre que ABCM est un
parallélogramme.
2. La direction de l’hyperplan affine d’équation a0 + a1 x1 + · · · + an xn = 0 est
l’hyperplan vectoriel d’équation a1 x1 + · · · + an xn = 0 dans la base (e~1 , . . . , e~n ).
Deux hyperplans affines d’équations respectives a0 + a1 x1 + · · · + an xn = 0 et
a00 + a01 x1 + · · · + a0n xn = 0 sont parallèles si et seulement si leurs directions sont
confondues, i.e. si et seulement si il existe un réel λ non nul tel que a0i = λai pour
tout i = 1, . . . , n.
3. L’enveloppe convexe d’une partie A d’un espace affine E est le plus petit convexe
de E contenant A. C’est l’intersection de tous les convexes de E contenant A.
C’est aussi l’ensemble de tous les barycentres de systèmes de points pondérés de
A affectés de coefficients tous positifs.
4. La composée de deux homothéties de rapports respectifs λ et µ est une homothétie
de rapport λµ si λµ 6= 1 et une translation si λµ = 1.
54
5. Soit A un point quelconque de E et O le milieu du segment [Af (A)]. La relation

−−−−−−→ ~ −→ −→ −−−−→
f (O)f (A) = f (OA) = −OA = Of (A)
montre que f (O) = O. On a alors

−−−−→ −−−−−−−→ ~ −−→ −−→
Of (M ) = f (O)f (M ) = f (OM ) = −OM
pour tout point M de E, ce qui montre que f est la symétrie centrale de centre
O.
On pouvait naturellement aussi se contenter d’appliquer la proposition 32 au cas
particulier k = −1.
Exercice 1 :
1. Le point p(M ) est l’intersection de la droite passant par M de vecteur directeur
−−−−−→
~v et du plan Π. Il existe donc un réel t tel que M p(M ) = t~v . Les coordonnées de
p(M ) sont (x + 2t, y + t, z − 2t) et le point p(M ) appartient au plan Π, d’où la
relation 2(x + 2t) − 3(y + t) + (z − 2t) + 1 = 0. On en déduit t = 2x − 3y + z + 1
et 
0
x = 5x − 6y + 2z + 2



y 0 = 2x − 2y + z + 1
 0

z = −4x + 6y − z − 2 .
2. La matrice de p~ dans la base (~i, ~j, ~k) est donc

 
5 −6 2
P =  2 −2 1 
 
−4 6 −1
3. La relation p ◦ p = p implique p~ ◦ p~ = p~, d’où P 2 = P , ce qui peut naturellement

→
−
se vérifier par le calcul. L’image de p~ est le plan vectoriel Π direction du plan Π.
La matrice P est donc de rang 2.
−−−−−→ −−−−−→
4. Le symétrique s(M ) du point M vérifie M s(M ) = 2M p(M ) = 2t~v , où t =
2x − 3y + z + 1 est le réel défini à la question 1, d’où

00
x

 = 9x − 12y + 4z + 4
00

y = 4x − 5y + 2z + 2
 00

z = −8x + 12y − 3z − 4 .
On pouvait aussi remarquer que s(M ) est le symétrique de M par rapport à

p(M ), d’où les relations x00 = 2x0 − x, y 00 = 2y 0 − y, z 00 = 2z 0 − z.
55
5. La matrice de ~s dans la base (~i, ~j, ~k) est donc

 
9 −12 4
S = 2P − I =  4 −5 2 
 
−8 12 −3
→ et S 2 = I.
Comme s est une symétrie, s ◦ s = idE , d’où ~s ◦ ~s = id−
E
6. Par la relation de Chasles
−−−−−−−→ −−−−−−−→ −−−−−−−→ −−−−−−→
a(M )a(N ) = a(M )p(M ) + p(M )p(N ) + p(N )a(N )
−−−−−→ −−−−−−−→ −−−−→
= αM p(M ) + p(M )p(N ) + αp(N )N
−−→ −−−−−−−→ −−−−−−−→
= α(M N − p(M )p(N )) + p(M )p(N )
−−→ −−−−−−−→
= αM N + (1 − α)p(M )p(N )
−−→
→ + (1 − α)~
= [α id− p ](MN) .
E
→ + (1 − α)~
7. Il en résulte que a est affine de partie linéaire ~a = α id− p. D’où A =
E
αI + (1 − α)P .
8. De la relation P 2 = P découle
A2 = α2 I + 2α(1 − α)P + (1 − α)2 P 2

= α2 I + (1 − α2 )P
d’où A2 − (1 + α)A + αI = 0. En particulier, pour α = −1 on retrouve la relation

S 2 = I et pour α = 0 la relation P 2 = P .
Exercice 2 :
1. La composée t = sB ◦ sA de deux symétries centrales est une translation, puisque
c’est une transformation affine de partie linéaire l’identité. L’image par t de A
−−→ −→
est A0 = sB (A). Il en résulte que t est la translation de vecteur AA0 = 2AB.
Il en résulte immédiatement par récurrence que la composée d’un nombre pair de
symétries centrales est une translation.
2. La composée d’un nombre impair k de symétries centrales est une symétrie cen-
trale puisque sa partie linéaire est l’homothétie vectorielle de rapport (−1)k = −1.
3. Les points A1 et A2 sont symétriques par rapport à B1 , puisque B1 est le milieu
de [A1 A2 ]. On a donc f1 (A1 ) = sB1 (A1 ) = A2 .
Montrons par récurrence sur k que fk (A1 ) = Ak+1 pour k = 1, . . . , n − 1. On
vient de voir que la propriété est vraie pour k = 1. Si elle est vraie pour k ≤
n − 2, comme Bk+1 est le milieu de [Ak+1 Ak+2 ], on a sBk+1 (Ak+1 ) = Ak+2 , d’où
fk+1 (A1 ) = sBk+1 (Ak+1 ) = Ak+2 . De même fn (A1 ) = sBn (An ) = A1 .
56
4. a) Comme n est impair, fn est une symétrie centrale. On vient de voir que
fn (A1 ) = A1 . Il en résulte que A1 est le centre de fn , puisque le centre d’une
symétrie centrale est son seul point fixe.
L’application fn étant entièrement déterminée par les points B1 , . . . , Bn , il en
résulte que la donnée de ces points détermine A1 et, par récurrence, tous les
points Ak , puisque Ak+1 = fk (A1 ). L’application m est donc injective.
Elle est également surjective, puisque, si Ak sont les points précédemment
définis, Bk est le milieu de [Ak Ak+1 ] pour tout k = 1, . . . , n − 1, et Bn le milieu
de [An A1 ]. L’application m est donc bijective.
b) Pour construire les points Ai connaissant les points Bi , il suffit de construire
A1 , les autres points Ai s’en déduisant par les symétries successives de centres
B1 , B2 , . . . , Bn−1 . Mais A1 est le centre de la symétrie centrale fn , donc le
milieu du segment [M fn (M )] pour tout point M de E. On l’obtient donc en
choisissant n’importe quel point M de E (par exemple B1 ), en construisant
son image fn (M ) et en prenant le milieu du segment [M fn (M )].
5. a) Comme n est pair, fn est une translation de vecteur la somme des vecteurs des
P −−−−−−→
n/2
translations sB2k ◦ sB2k−1 pour k = 1, . . . , n/2, i.e. 2 B2k−1 B2k . Par ailleurs,
k=1
la relation fn (A1 ) = A1 montre que fn a un point fixe, c’est donc l’identité. Le
vecteur de la translation fn est donc nul :
n/2
−−−−−−→
B2k−1 B2k = ~0
X
2 (∗) .
k=1
b) Il en résulte que l’application m n’est pas surjective, puisque son image est
contenue dans l’ensemble des n-uplets de points (B1 , . . . , Bn ) vérifiant la rela-
tion (∗).
Soit (B1 , . . . , Bn ) un n-uplet de points vérifiant la relation (∗) et A1 un point
quelconque de E. Définissons par récurrence des points A2 , . . . , An par Ak+1 =
sBk (Ak ) pour k = 1, . . . , n − 1. Pour tout k = 1, . . . , n − 1, Bk est donc le milieu
de [Ak Ak+1 ] et il résulte de la relation (∗) que fn est l’identité, d’où fn (A1 ) =
sBn (An ) = A1 . Bn est donc le milieu de [An A1 ] et le n-uplet (B1 , . . . , Bn ) est
l’image par m du n-uplet (A1 , . . . , An ).
Il en résulte que l’image de m est exactement l’ensemble des n-uplets de points
(B1 , . . . , Bn ) vérifiant la relation (∗).
L’application m n’est pas injective puisque le choix de A1 dans la construction
précédente est arbitraire.
57
3 Compléments
3.1 Notations de Grassmann
n
P n
P
Les notations M + ~u et λi Mi (pour λi = 1) sont parfois appelées notations
i=1 i=1
de Grassmann.
Hermann Günther Grassmann (1809-1877) était un mathématicien et linguiste alle-

mand. Enseignant de lycée pendant la majeure partie de sa vie professionnelle, l’impor-
tance de ses travaux mathématiques n’a été reconnue que tardivement et c’est pour ses
études de sanskrit et notamment sa traduction en allemand du Rig-Véda qu’il devint
célèbre à la fin de sa vie.
On le considère aujourd’hui comme un des inventeurs du calcul vectoriel et de
l’algèbre linéaire (bien que des notions analogues à celle de vecteur soient apparues
de manière récurrente, à l’état d’ébauche dès le XVIième siècle, puis de manière plus
formelle au début du XIXième siècle, chez d’autres auteurs, l’idée étant à chaque fois
de définir des grandeurs qui aient, outre une mesure, une direction et un sens).
Le calcul barycentrique lui-même avait en fait été introduit, à peu près à la même
époque, par August Ferdinand Möbius (1790-1868) dans son livre Der barycentrische
Calcül (1827). Dans cet ouvrage, Möbius (sans doute plus connu aujourd’hui pour sa
58
découverte de la bande qui porte son nom, un exemple de surface non orientable plongée
dans l’espace euclidien de dimension 3), introduisait non seulement les coordonnées
barycentriques, mais aussi, en considérant le cas d’un système pondéré où la somme
des poids est nulle, la notion de point à l’infini et les coordonnées projectives, ouvrant
ainsi la voie à l’étude des relations entre espace affine et espace projectif.
3.2 Courbes de Bézier

Une application très concrète, en dehors de la mécanique d’où elle est issue, de la
notion de barycentre est fournie par l’étude des courbes de Bézier.
Pierre Bézier (1910-1999) était ingénieur chez Renault quand il introduisit en 1962
ces courbes et les surfaces qui portent également son nom pour modéliser des pièces
d’automobile. À peu près à la même époque, Paul de Casteljau menait des études
analogues chez Citroën, principal concurrent en France de Renault, et découvrait un
algorithme récursif pour construire ces courbes, algorithme qui porte aujourd’hui son
nom. Ces travaux, couverts par le secret industriel, ne furent publiés qu’une dizaine
d’années plus tard.
Figure 6 – Courbes de Bézier avec 3 et 4 points de contrôle
Pour simplifier, nous ne considérerons ici que le cas des courbes. Le problème d’in-
terpolation le plus simple consiste à déterminer une courbe lisse passant par des points
donnés et ayant une équation la plus simple possible. Bien sûr, s’il ne s’agit que de
relier deux points donnés, la courbe la plus simple est le segment [AB]. Ce segment est
l’ensemble des barycentres (1 − t)A + tB quand t parcourt l’intervalle [0, 1]. Quand on
veut raccorder une suite de points, il faut pouvoir contrôler les tangentes aux points
de raccordement. On ajoute pour cela un point de contrôle supplémentaire C, on note
pour tout t ∈ [0, 1], M = (1 − t)A + tC, N = (1 − t)C + tB, P = (1 − t)M + tN , de sorte
que P = (1 − t)2 A + 2t(1 − t)C + t2 B. On vérifie alors facilement que la courbe décrite
par le point P quand t parcourt [0, 1] est un arc de parabole joignant A à B, admet-
tant comme tangente en A la droite (AC) et comme tangente en B la droite (BC). Le
59
point de contrôle supplémentaire C permet donc de contrôler les tangentes aux deux
extrémités de l’arc AB. Si on veut davantage de contrôle sur la forme de la courbe,
on peut rajouter d’autres points de contrôle et itérer la construction précédente. La
représentation paramétrique ! de la courbe obtenue fait alors intervenir les polynômes
n
de Bernstein Bn,k (t) = (1 − t)k tn−k , qui apparaissent dans le développement de
k
[(1 − t) + t]n par la formule du binôme.
Comme toute application affine conserve les barycentres, pour construire l’image
d’une courbe de Bézier par une application affine il suffit de prendre l’image des points
de contrôle de la courbe initiale par l’application affine, l’image de la courbe de Bézier
est alors la courbe de Bézier correspondant à ces points de contrôle, ce qui simplifie
beaucoup la construction de cette image.
Les courbes de Bézier sont beaucoup utilisées dans les logiciels de dessin vectoriel
et de création de polices de caractères. En particulier, le langage PostScript, dont la
format pdf est largement issu, leur a accordé une grande place.
3.3 Perspective centrale et géométrie projective

Que ce soit sur le papier ou sur un écran d’ordinateur, une figure de l’espace est
toujours représentée par une figure plane, c’est-à-dire par une projection de cette figure
sur un plan.
Si on considère que l’œil de l’observateur est situé infiniment loin, les rayons pro-
jetant les différents points sont tous parallèles. La projection ainsi obtenue est donc
une projection affine sur un plan, qu’on appelle aussi projection parallèle, en raison
du parallélisme des projetantes, ou projection cylindrique, car les droites projetant le
contour apparent d’un solide constituent un cylindre.
Cette projection affine apparaît aussi naturellement quand on étudie les ombres
projetées par les rayons du soleil, car on peut considérer les rayons lumineux comme
tous parallèles.
Par contre, si l’œil de l’observateur est situé à distance finie, les rayons projetants
ne sont plus parallèles, mais convergent tous en un même point (l’œil de l’observateur).
Il faut alors considérer un nouveau type de projection, appelé perspective, ou projection
centrale, ou encore projection conique, car les rayons projetants constituent cette fois
un cône de sommet l’œil de l’observateur. C’est aussi ce type de projection que l’on est
amené à considérer si on étudie les ombres projetées par une source lumineuse située à
distance finie.
L’étude systématique de la perspective a été entreprise à la Renaissance par les
peintres et architectes italiens, en particulier Alberti (1404-1472), Masaccio (1401-
1428), Piero della Francesca (vers 1415-1492). Elle s’est alors répandue à toute l’Eu-
rope, comme en témoigne la gravure de Dürer (1525) ci-dessous, où le peintre utilise
un perspectographe, instrument lui permettant de réaliser une perspective de manière
purement mécanique.
60
L’étude mathématique en a été systématisée au XVIIième siècle par Desargues (voir

section 3.4) et a fini par donner naissance à une nouvelle forme de géométrie : la
géométrie projective.
Ses idées sont tombées dans un relatif sommeil durant tout le XVIIIième siècle, les
mathématiciens de cette époque étant surtout occupés à développer les perspectives
ouvertes par l’introduction du calcul différentiel et intégral, et ce n’est qu’au début du
XIXième siècle que l’étude de la géométrie projective reprendra vraiment, sous l’impul-
sion de mathématiciens français (Poncelet, Traité des propriétés projectives des figures,
1822) et allemands (Steiner 1 , Möbius, Plücker), avant de s’établir définitivement sur
des bases solides à la fin de ce siècle.
Les projections centrales ne sont pas des applications affines : si elles conservent
l’alignement, elles ne conservent ni le parallélisme (des droites parallèles dans l’espace
se rejoignent sur le tableau au point de fuite, commun à toutes les droites ayant même
direction), ni les barycentres (le milieu d’un segment non parallèle au plan du tableau
n’est pas projeté en le milieu de son image). En conséquence, dans un plan projectif, il
n’y a pas de droites parallèles : deux droites distinctes se coupent toujours en un point
et un seul.
3.4 Desargues dans le plan et dans l’espace

Le théorème de Desargues peut s’énoncer dans le plan affine sous la forme suivante :
Théorème 5. Soient ABC et A0 B 0 C 0 deux triangles non aplatis d’un même plan affine.
On suppose A et A0 (resp. B et B 0 , resp. C et C 0 ) distincts. Alors les droites (AA0 ),
(BB 0 ) et (CC 0 ) sont concourantes ou parallèles si et seulement si l’une des conditions
suivantes est satisfaite :
– les trois couples de droites ((BC), (B 0 C 0 )), ((CA), (C 0 A0 )) et ((AB), (A0 B 0 )) sont
constitués de droites sécantes en des points α, β, γ et les trois points α, β, γ sont
alignés (figure 7) ;
1. Jacob Steiner (1796-1863) était suisse, mais a essentiellement travaillé en Allemagne.
61
– les trois couples de droites ((BC), (B 0 C 0 )), ((CA), (C 0 A0 )) et ((AB), (A0 B 0 )) sont
constitués de droites parallèles ;
– l’un des trois couples de droites ((BC), (B 0 C 0 )), ((CA), (C 0 A0 )) et ((AB), (A0 B 0 ))
est constitué de droites parallèles, les deux autres de droites sécantes et la droite
joignant les deux points d’intersection définis par ces couples est parallèle à la
direction commune des droites du premier couple.
Les triangles ABC et A0 B 0 C 0 sont alors dits homologiques.
Figure 7 – Le théorème de Desargues
On a étudié le cas particulier où les trois couples considérés sont constitués de

droites parallèles à l’exercice 37 .
Le cas général peut également s’étudier avec les théorèmes classiques de la géométrie
plane, mais une façon plus agréable de procéder est de considérer la figure 7 comme
une projection plane d’une figure de l’espace.
Considérons pour cela, dans l’espace affine de dimension 3, un tétraèdre OABC,
et un plan Π ne passant pas par O coupant les trois droites (OA), (OB) et (OC) en
A0 , B 0 et C 0 distincts de A, B, C. Les droites (BC) et (B 0 C 0 ) (resp. (CA) et (C 0 A0 ),
(AB) et (A0 B 0 )) sont coplanaires. Supposons-les sécantes en des points α, β et γ (le
cas de droites parallèles se traiterait de manière analogue). Les trois points α, β et γ
sont alors alignés. En effet, les plans (ABC) et Π se coupent suivant une droite ∆ et
les points α, β et γ appartiennent tous trois à ∆.
Pour obtenir la partie directe du théorème de Desargues dans le plan, il suffit alors
de considérer la figure plane 7 comme la projection sur le plan d’une figure de l’espace.
En fait, cette démonstration traduit le fait que le théorème de Desargues est fonda-
mentalement un théorème de géométrie projective. Dans un plan projectif, deux droites
62
distinctes se coupent toujours en un point et un seul (des droites parallèles dans le plan
affine se coupent en un point à l’infini) et l’énoncé du théorème prend alors la forme
beaucoup plus simple suivante :
Théorème 6. Soient ABC et A0 B 0 C 0 deux triangles non aplatis d’un même plan pro-
jectif. On suppose A et A0 (resp. B et B 0 , resp. C et C 0 ) distincts et les droites (AA0 ),
(BB 0 ) et (CC 0 ) distinctes. Alors les droites (AA0 ), (BB 0 ) et (CC 0 ) sont concourantes
ou parallèles si et seulement si les points d’intersection des trois couples de droites
((BC), (B 0 C 0 )), ((CA), (C 0 A0 )) et ((AB), (A0 B 0 )) sont alignés.
Girard Desargues (1591-1661) était un mathématicien et architecte lyonnais. C’est

à lui que revient le mérite d’avoir développé pour la première fois d’une manière cohé-
rente la géométrie projective en étudiant la perspective centrale (Exemple de l’une des
manières universelles du S.G.D.L. touchant la pratique de la perspective sans employer
aucun tiers point, de distance ny d’autre nature, qui soit hors du champ de l’ouvrage,
1636) et les sections planes des cônes de révolution (Brouillon Project d’une Atteinte
aux Evènemens des Rencontres du Cone avec un Plan, par L.S.G.D.L., paru à Paris
en 1639, avec Privilège).
Si la définition des coniques comme sections planes d’un cône ou d’un cylindre
de révolution était en effet connue depuis l’antiquité (les Coniques, d’Apollonius de
Perge (v.262-v.190 av. J.-C.), qui leur a donné leurs noms), il lui revient l’idée que
cette définition permet de mettre en correspondance point par point une ellipse et une
hyperbole : si on considère les sections d’un même cône par deux plans (figure 8),
toute génératrice de ce cône coupe chacune de ces sections en un point et un seul (à
l’exception peut-être d’une ou deux d’entre elles) et il suffit d’associer à tout point de
la première section le point correspondant de la seconde.
Ainsi, d’un point de vue projectif, toutes les coniques sont les mêmes.
Les conséquences en sont importantes, puisque certains théorèmes démontrés par
exemple pour le cercle (ceux qui ne font intervenir que des propriétés de concours ou
d’incidence) restent vrais pour toutes les coniques. C’est ainsi qu’il suffit de démontrer
le théorème de Pascal (voir l’hexagramme mystique, dans le chapitre sur les coniques)
pour un cercle, le résultat s’en déduisant pour toutes les autres coniques.
Pour définir le plan projectif, il ajoutait au plan ordinaire des points à l’infini, si bien
que deux droites distinctes se coupaient toujours en un point et un seul (deux droites
parallèles se coupant en un point à l’infini, comme leurs images dans une perspective
centrale se coupent en le point de fuite de leur direction).
Il était connu et apprécié des plus grands mathématiciens de son époque (Descartes,
Pascal, Fermat), mais son œuvre, rédigée le plus souvent sous forme de brouillons,
qu’il signait S.G.D.L. (le Sieur Girard Desargues, Lyonnais), dans un style jugé parfois
obscur par ses contemporains, n’a pas connu la postérité qu’elle méritait.
Il est l’auteur de deux autres « Brouillons Projects » : l’un concernant la coupe des
pierres, l’autre la gnomonique (l’art de construire les cadrans solaires). Il faut remarquer
que, d’un point de vue mathématique, un cadran solaire fournit un autre exemple de
63
Figure 8 – Sections planes d’un cône de révolution.
projection centrale : c’est dans ce cas la pointe du style (la tige dont l’ombre indique
l’heure en se déplaçant) qui joue le rôle de l’œil de l’observateur, le plan de projection
étant celui du cadran et l’objet le soleil.
3.5 Birapport
On a vu à l’exercice 32 qu’étant donné deux triplets (D1 , D2 , D3 ) et (D10 , D20 , D30 )
de droites distinctes et concourantes d’un même plan affine, il existait toujours une
transformation affine de ce plan transformant D1 en D10 , D2 en D20 et D3 en D30 . Du
point de vue de la géométrie affine, tous les triplets de droites distinctes et concourantes
sont donc équivalents (de même que tous les triangles non aplatis le sont, puisque, étant
donné deux triangles non aplatis ABC et A0 B 0 C 0 , il existe toujours une transformation
affine du plan et une seule transformant A en A0 , B en B 0 et C en C 0 ).
Il n’en va plus de même si on considère des quadruplets de droites concourantes.
On peut en effet associer à tout tel quadruplet un nombre, appelé birapport ou rapport
anharmonique des quatre droites, qui est invariant par toute transformation affine.
On commence par définir le birapport [A, B, C, D] de quatre points distincts alignés
A, B, C, D comme le réel
AC BD
[A, B, C, D] = .
AD BC
Ce réel ne dépend pas du choix du vecteur directeur de la droite portant ces points,
mais il dépend de l’ordre des points.
Soit maintenant, dans un plan affine E, quatre droites distinctes concourantes en
un même point O et coupant deux droites ∆ et ∆0 en des points A, B, C, D et A0 ,
64
B 0 , C 0 , D0 . Orientons E et munissons-le d’un produit scalaire. Soit alors H le projeté

−−→
orthogonal de O sur ∆ et ~v un vecteur directeur unitaire de ∆ tel que le système (OH, ~v )
soit direct. On a alors, en prenant les déterminants dans une base orthonormée directe :
−→ −→ −→ −→
det(OA, OC) = OA × OC × sin(OA, OC)
−−→ −−→ −−→ −−→
= det(OH + HA, OH + HC)
−−→ −−→ −−→ −−→
= det(OH, HC) + det(HA, OH)
−−→ −−→ −−→
= det(OH, AH + HC)
−−→ −→
= det(OH, AC)
= OH × AC ,
ce nombre étant le double de l’aire algébrique du triangle OAC.
Il en résulte que
−→ −→ −−→ −−→
sin(OA, OC) sin(OB, OD)
[A, B, C, D] = −→ −−→ −−→ −→ .
sin(OA, OD) sin(OB, OC)
−−→ −−→ −→ −→
Mais sin(OA0 , OC 0 ) = εA εC sin(OA, OC), où εA (resp. εC ) vaut 1 si les points A
et A0 (resp. C et C 0 ) sont du même côté de O, −1 sinon. En écrivant des formules
analogues pour les autres termes, on en déduit que [A, B, C, D] = [A0 , B 0 , C 0 , D0 ]. Ce
nombre ne dépend donc pas de la sécante ∆. On l’appelle birapport des quatre droites
(OA), (OB), (OC), (OD). Comme toute transformation affine conserve les rapports
de mesures algébriques pour des points alignés, elle conserve a fortiori le birapport.
65
3.6 La formule d’Euler pour les polyèdres

On doit à Leonhard Euler (1707-1783) la formule suivante : si un polyèdre convexe
de l’espace a s sommets, a arêtes et f faces, alors s − a + f = 2.
Il existe de nombreuses démonstrations de cette formule, issues de domaines très
divers des mathématiques, plus ou moins complètes et plus ou moins rigoureuses. Une
des plus simples consiste à choisir un point O à l’intérieur du polyèdre, et à projeter le
polyèdre sur une sphère de centre O par une projection centrale de centre O. Les faces
du polyèdre se projettent selon des polygones sphériques convexes et on utilise alors la
formule de Girard donnant l’aire d’un tel polygone en fonction de ses angles (voir la
partie Géométrie sphérique dans le chapitre Géométrie euclidienne).
L’inconvénient de cete méthode est qu’elle fait appel à des notions euclidiennes (la
sphère, les aires) alors que le problème de départ est purement affine.
Mais les démonstrations purement affines qu’ont données de cette formule beaucoup
d’auteurs, en prétendant parfois l’étendre à des polyèdres non convexes, se sont souvent
révélées sinon fausses, du moins incomplètes, en considérant comme « évidentes » des
propriétés intuitives sans en donner réellement de justification.
C’est justement en tentant d’étendre cette formule à des polyèdres plus généraux
(non convexes) que l’on s’est progressivement aperçu des failles de certains raisonne-
ments admis jusque-là par la communauté mathématique. Un point fondamental est
qu’il n’est pas si facile de définir avec précision ce qu’on entend par polyèdre (non
nécessairement convexe) dans l’espace.
De fait, la formule d’Euler est aussi une formule sur les graphes planaires, i.e. les
graphes dessinés dans le plan. À un tel graphe, on peut aussi associer le nombre s de
ses sommets, le nombre a de ses arêtes et le nombre f de ses faces (i.e. de domaines
connexes du plan délimités par ses arêtes, y compris la face extérieure non bornée).
Ces nombres vérifient la relation d’Euler.
D’une manière intuitive, on peut facilement passer d’un polyèdre convexe de l’espace
à un graphe planaire, par exemple en le projetant sur un plan par une projection
centrale bien choisie, ou en considérant ses arêtes comme élastiques et en l’étirant sur
un plan, et se ramener à établir la formule pour les graphes planaires (par exemple par
récurrence sur le nombre d’arêtes ou de sommets), mais il n’est pas facile de justifier
complètement toutes les étapes de cette démarche.
Toutes ces considérations ont conduit à généraliser la caractéristique d’Euler (le
nombre s − a + f ) à des objets géométriques plus généraux. C’est ainsi que H. Poincaré
(1854-1912) a introduit en 1893 ce qui s’appelle aujourd’hui la caractéristique d’Euler-
Poincaré qui étend la caractéristique d’Euler à des polyèdres tracés sur des surfaces.
En fait, R. Descartes (1596-1650), dans un manuscrit non publié, De Solidorum
Elementis, dont l’original a disparu, mais dont on a retrouvé une copie en 1860 dans
les papiers laissés à sa mort par Leibniz (1646-1716), avait énoncé une formule très
proche, mais il n’est pas clair qu’il ait eu connaissance de la formule d’Euler telle
qu’elle est formulée aujourd’hui.
La version de Descartes est la suivante :
66
Figure 9 – Deux exemples de polyèdres pour lesquels la formule d’Euler est fausse.
« L’angle droit étant pris pour unité, la somme des angles de toutes les faces d’un
polyèdre convexe est égale à quatre fois le nombre de sommets diminué de 2. »
Cette relation équivaut à la formule d’Euler si on se souvient que la somme des
angles d’un polygone convexe à n sommets est (n−2)π. En effet la formule de Descartes
dit que la somme des angles de toutes les faces du polyèdre est 2π(s − 2) ; mais si on
numérote les faces de 1 à f et si on note ni le nombre de sommets (ou de côtés) de la
f f
(ni −2)π ou encore (2a−2f )π en remarquant que
P P
face i, cette somme vaut ni = 2a
i=1 i=1
(chaque arête du polyèdre est comptée deux fois dans la somme, puisqu’elle apparaît
dans deux faces), d’où 2π(s − 2) = 2π(a − f ), qui est exactement la formule d’Euler.
3.7 Le théorème fondamental de la géométrie affine

Toute transformation affine conserve l’alignement et transforme une droite en une
droite. On peut se demander si cette propriété caractérise les transformations affines.
C’est le cas dans le plan affine réel :
Théorème 7. Toute bijection du plan affine réel sur lui-même qui transforme toute
droite en une droite est une transformation affine .
Ce théorème reste vrai dans un espace affine E quelconque, à condition de prendre
quelques précautions :
1. il faut avoir dim E ≥ 2 (si dim E = 1, toute bijection de E sur E vérifie triviale-
ment la condition et il est facile de construire des bijections de E sur E qui ne
sont pas affines) ;
2. il faut que le corps de base n’admette pas d’autre automorphisme de corps que
l’identité (si E = Cn , l’application qui à (z1 , . . . , zn ) associe (z̄1 , . . . , z̄n ) trans-
forme toute droite en une droite, mais n’est pas affine).
67
Géométrie euclidienne
Jean-Marc Decauwert
Ce chapitre se divise en deux parties : dans la première, nous étudierons les proprié-
tés des espaces vectoriels euclidiens, c’est-à-dire des espaces vectoriels réels de dimen-
sion finie munis d’un produit scalaire ; dans la seconde, nous appliquerons les résultats
obtenus à l’étude des configurations usuelles des espaces affines euclidiens, en particu-
lier du plan et de l’espace, et des isométries de ces espaces. La première partie ne fait
appel qu’aux notions d’algèbre linéaire étudiées en L1 et L2 ; la seconde suppose connu
le chapitre « Géométrie affine ». Nous utiliserons des notations un peu différentes dans
ces deux parties.
Table des matières

1 Cours 1
1.1 Espaces vectoriels euclidiens . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Définitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Orthogonalité, bases orthonormées . . . . . . . . . . . . . . . . 3
1.1.3 Matrices orthogonales . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.4 Groupe orthogonal, angles . . . . . . . . . . . . . . . . . . . . . 10
1.1.5 Dualité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.2 Espaces affines euclidiens . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.1 Distance et orthogonalité . . . . . . . . . . . . . . . . . . . . . . 29
1.2.2 Isométries, similitudes . . . . . . . . . . . . . . . . . . . . . . . 38
1.2.3 Géométrie du triangle et du cercle . . . . . . . . . . . . . . . . . 48
2 Entraînement 57
2.1 Vrai ou faux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.2 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.3 QCM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.4 Devoir . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
3 Compléments 88
3.1 Constructions à la règle et au compas . . . . . . . . . . . . . . . . . . . 88
3.2 Frises et pavages . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
3.3 Polyèdres réguliers . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.4 Géométrie sphérique . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
3.5 Cartographie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
3.6 Projection stéréographique et homographies . . . . . . . . . . . . . . . 99
12 juin 2012
Maths en Ligne Géométrie euclidienne UJF Grenoble
1 Cours
1.1 Espaces vectoriels euclidiens
1.1.1 Définitions
Définition 1. Un produit scalaire sur un espace vectoriel réel E est une forme bili-
néaire symétrique définie positive sur E.
On notera dans cette section hu, vi le produit scalaire de deux vecteurs u et v.
Dans la section « Géométrie affine euclidienne », dont le cadre sera un espace affine
euclidien (souvent de dimension 2 ou 3), les vecteurs seront écrits avec des flèches pour
les distinguer des points et on notera (sauf exception) ~u · ~v le produit scalaire de deux
vecteurs ~u et ~v .
Le produit scalaire de deux vecteurs est donc un nombre réel, et on a, pour tous
vecteurs u, u1 , u2 , v, v1 , v2 et tous réels a et b :
– hau1 + bu2 , vi = ahu1 , vi + bhu2 , vi (linéarité à gauche)
– hu, av1 + bv2 i = ahu, v1 i + bhu, v2 i (linéarité à droite)
– hu, vi = hv, ui (symétrie)
– hu, ui > 0 pour tout vecteur u non nul (positivité).
Attention : le produit scalaire de deux vecteurs n’est pas toujours positif (pour tout
couple (u, v) de vecteurs, les réels h−u, vi et hu, vi sont opposés).
On appellera carré scalaire d’un vecteur u le produit scalaire hu, ui du vecteur u
par lui-même. Ce nombre est toujours positif et il est nul si et seulement si u est nul.
Définition 2. On appelle espace vectoriel euclidien tout espace vectoriel réel de di-
mension finie muni d’un produit scalaire.
Exemples
– On appelle produit scalaire canonique sur Rn le produit scalaire défini par :
n
X
hx, yi = x1 y1 + · · · + xn yn = x i yi
i=1
si x = (x1 , . . . , xn ) et y = (y1 , . . . , yn ).
En identifiant tout vecteur x = (x1 , . . . , xn ) de Rn avec la matrice colonne X de
ses composantes, ce produit scalaire s’écrit encore :
hx, yi = tXY = tY X .
– Pour tout entier n ≥ 0 et tout intervalle [a, b] de R (a < b), on peut définir un
produit scalaire sur l’espace vectoriel Rn [X] des polynômes à coefficients réels de
degré inférieur ou égal à n par :
Z b
hP, Qi = P (x)Q(x) dx .
a
1
Plus généralement, si f est une fonction continue positive non identiquement

nulle sur un intervalle [a, b] de R (a < b),
Z b
hP, Qi = f (x)P (x)Q(x) dx
a
définit un produit scalaire sur Rn [X].
Norme euclidienne
La positivité du produit scalaire permet de définir pour tout vecteur u :
q
kuk = hu, ui .
Proposition 1. L’application u 7→ kuk est une norme sur E appelée norme euclidienne
sur E.
Démonstration : Il faut vérifier que pour tous vecteurs u et v et tout réel λ :

1. kλuk = |λ| kuk ;
2. kuk = 0 ⇐⇒ u = 0 ;
3. ku + vk ≤ kuk + kvk (inégalité triangulaire).
Les deux premières propriétés découlent immédiatement de la définition du produit
scalaire. La troisième découle de l’égalité
ku + vk2 = kuk2 + 2hu, vi + kvk2
et de l’inégalité de Cauchy-Schwarz |hu, vi| ≤ kuk kvk démontrée ci-dessous.
Lemme 1. (Inégalité de Cauchy-Schwarz)
Pour tout couple (u, v) de vecteurs d’un espace vectoriel euclidien, on a :
|hu, vi| ≤ kuk kvk
avec égalité si et seulement si u et v sont colinéaires.
Démonstration : Pour tout réel λ, on a

kλu + vk2 = λ2 kuk2 + 2λhu, vi + kvk2 ≥ 0 .
Il en résulte que, si u 6= 0, le discriminant de ce trinôme du second degré en λ est négatif
ou nul : hu, vi2 − kuk2 kvk2 ≤ 0. Ce discriminant est nul si et seulement si ce trinôme
admet une racine réelle, i.e. si et seulement si il existe un réel λ tel que λu + v = 0.
Remarque : il résulte des démonstrations précédentes qu’on a égalité dans l’inégalité
triangulaire ku + vk ≤ kuk + kvk si et seulement si hu, vi = kuk kvk, i.e. si et seulement
si les deux vecteurs u et v sont directement colinéaires (si u 6= 0, il existe λ ≥ 0 tel que
v = λu).
Définition 3. Un vecteur est dit unitaire si sa norme est égale à 1.
À tout vecteur v non nul d’un espace vectoriel euclidien, on peut associer de manière
v
unique un vecteur unitaire u qui lui est directement proportionnel en posant u = .
kvk
2
Caractérisation des normes euclidiennes

Définition 4. Une norme sur un espace vectoriel réel de dimension finie est dite eu-
clidienne si elle provient d’un produit scalaire euclidien.
Le produit scalaire associé à une norme euclidienne est uniquement déterminé par
cette norme par les relations :
1 1
hu, vi = (ku + vk2 − kuk2 − kvk2 ) = (ku + vk2 − ku − vk2 ) .
2 4
Toute norme n’est pas euclidienne. Par exemple, les normes k · k1 et k · k∞ définies
n
sur Rn par kxk1 = |xi | et kxk∞ = max |xi | pour x = (x1 , . . . , xn ) ne sont pas
P
i=1 i=1,...,n
euclidiennes. Elles ne vérifient en effet pas la relation du parallélogramme :
Proposition 2. Toute norme euclidienne vérifie la relation du parallélogramme :
ku + vk2 + ku − vk2 = 2 kuk2 + 2 kvk2 .
Cette relation tire son nom de ce que, si on considère le parallélogramme construit
sur les deux vecteurs u et v, les réels ku − vk et ku + vk sont les longueurs des diago-
nales de ce parallélogramme. Elle exprime donc que la somme des carrés des longueurs
des côtés d’un parallélogramme est égale à la somme des carrés des longueurs de ses
diagonales.
Démonstration : Il suffit d’ajouter membre à membre les relations
ku + vk2 = hu + v, u + vi = kuk2 + 2hu, vi + kvk2
et
ku − vk2 = hu − v, u − vi = kuk2 − 2hu, vi + kvk2 .

On peut en fait montrer que cette relation caractérise les normes euclidiennes : une
norme est euclidienne si et seulement si elle vérifie l’identité du parallélogramme.
1.1.2 Orthogonalité, bases orthonormées

Définition 5. Deux vecteurs x et y d’un espace vectoriel euclidien sont dits orthogo-
naux si leur produit scalaire est nul : hx, yi = 0.
Deux parties A et B d’un espace vectoriel euclidien sont dites orthogonales si tout
vecteur de A est orthogonal à tout vecteur de B :
hx, yi = 0 pour tout (x, y) ∈ A × B .
On appelle orthogonal d’une partie A de E, et on note A⊥ , l’ensemble des vecteurs
orthogonaux à tout vecteur de A :
A⊥ = {x ∈ E | hx, yi = 0 pour tout y ∈ A} .
3
Proposition 3. 1. L’orthogonal d’une partie de E est un sous-espace vectoriel de

E.
2. Si A ⊂ B sont deux parties de E, alors B ⊥ ⊂ A⊥ .
3. L’orthogonal d’une partie A de E est égal à l’orthogonal du sous-espace vectoriel
Vect(A) de E engendré par cette partie :
A⊥ = Vect(A)⊥ .
Démonstration : La propriété 1 provient de la linéarité du produit scalaire en chacune

de ses variables, la propriété 2 de la définition de l’orthogonal d’une partie. L’inclusion
Vect(A)⊥ ⊂ A⊥ provient, grâce à 2, de l’inclusion A ⊂ Vect(A), l’inclusion A⊥ ⊂
Vect(A)⊥ de la linéarité du produit scalaire.
Proposition 4. Toute famille orthogonale constituée de vecteurs non nuls est libre.
Démonstration : Soit (v1 , . . . , vn ) une famille de vecteurs non nuls deux à deux ortho-
n
gonaux : hvi , vj i = 0 pour i 6= j, et soit
P
λi vi = 0 une combinaison linéaire nulle de
i=1
ces vecteurs. Alors, pour tout j = 1, . . . , n :
n n
λi hvj , vi i = λj kvj k2
X X
0 = hvj , λi vi i =
i=1 i=1
d’où λj = 0 puisque kvj k2 > 0. Il en résulte que la famille (v1 , . . . , vn ) est libre.
Bases orthonormées
Définition 6. On appelle base orthonormée (ou orthonormale) d’un espace vectoriel

euclidien E toute base (e1 , . . . , en ) de E vérifiant

1 si i = j
hei , ej i = δi,j = 
0 sinon.
L’intérêt des bases orthonormales vient de ce que le produit scalaire et la norme

ont même expression dans toute base orthonormale : si (e1 , . . . , en ) est une base ortho-
n
P n
P
normale de E et x = xi ei et y = yi ei sont deux vecteurs de E, alors
i=1 i=1
n
X
hx, yi = xi y i
i=1
v
u n
uX
kxk = t x2 . i
i=1
4
De plus les coordonnées d’un vecteur x dans une base orthonormée (e1 , . . . , en ) sont
données par :
xi = hei , xi
pour tout i = 1, . . . , n.
Si on note, pour tout vecteur x de E, X la matrice colonne t(x1 , . . . , xn ) des
composantes de x dans la base orthonormée (e1 , . . . , en ), le produit scalaire et la norme
s’écrivent matriciellement :
hx, yi = tXY = tY X, kxk = ( tXX)1/2 .
Tout espace vectoriel euclidien possède des bases orthonormées. Plus précisément
le procédé d’orthonormalisation de Gram-Schmidt permet de construire à partir de
n’importe quelle base d’un tel espace une base orthonormée.
Proposition 5. Soit E un espace vectoriel euclidien et (v1 , . . . , vn ) une base de E.
Alors il existe une base orthonormée (e1 , . . . , en ) de E telle que, pour tout k = 1, . . . , n,
l’espace vectoriel Vect(e1 , . . . , ek ) engendré par les k premiers vecteurs de cette base
coïncide avec l’espace vectoriel Vect(v1 , . . . , vk ) engendré par les k premiers vecteurs de
la base de départ.
Démonstration : On commence par construire une base orthogonale (u1 , . . . , un ) vé-

rifiant Vect(u1 , . . . , uk ) = Vect(v1 , . . . , vk ) pour tout k = 1, . . . , n. Il suffit ensuite de
uk
normer cette base en posant ek = pour tout k.
kuk k
On construit donc, par récurrence sur k, une famille (u1 , . . . , un ) de vecteurs deux à
deux orthogonaux vérifiant Vect(u1 , . . . , uk ) = Vect(v1 , . . . , vk ) pour tout k = 1, . . . , n.
Pour k = 1, il suffit de poser u1 = v1 . Si la famille (u1 , . . . , uk ) est construite pour
k
un entier k < n, on cherche uk+1 de la forme uk+1 = vk+1 −
P
λk+1,i ui . En écrivant
i=1
huj , vk+1 i
huj , uk+1 i = 0, on obtient λk+1,j = pour j = 1, . . . , k et on vérifie immédia-
kuj k2
tement que la famille ainsi construite convient.
La matrice de passage de la base (v1 , . . . , vn ) à la base (e1 , . . . , en ) est donc trian-
gulaire supérieure. On peut montrer que la base orthonormée (e1 , . . . , en ) vérifiant ces
propriétés est unique si on impose de plus à tous les coefficients diagonaux de cette
matrice de passage d’être positifs.
Corollaire 1. Toute famille orthonormée d’un espace vectoriel euclidien peut être com-
plétée en une base orthonormée.
Démonstration : Soit (e1 , . . . , ek ) une famille orthonormée. D’après la proposition 4,

cette famille est libre. D’après le théorème de la base incomplète, on peut donc la
compléter en une base (e1 , . . . , ek , vk+1 , . . . , vn ) de E. En orthonormalisant cette base
5
par le procédé de Gram-Schmidt, on obtient une base orthonormée (e1 , . . . , en ) dont

les k premiers vecteurs coïncident avec ceux de la famille donnée.
Proposition 6. Soit E un espace vectoriel euclidien et F un sous-espace vectoriel de
E. Alors F et F ⊥ sont des sous-espaces vectoriels supplémentaires. En particulier :
dim(F ⊥ ) = dim(E) − dim(F ) .
On dit que F ⊥ est le supplémentaire orthogonal de F dans E, ou que les sous-espaces
vectoriels F et F ⊥ sont des sous-espaces vectoriels supplémentaires orthogonaux.
Démonstration : Soit (e1 , . . . , ek ) une base orthonormée de F . On peut la compléter

n
P
en une base orthonormée (e1 , . . . , en ) de E. Un vecteur x = xi ei est orthogonal à
i=1
F si et seulement si il est orthogonal à e1 , . . . , ek puisque ces vecteurs engendrent F ,
donc si et seulement si xi = 0 pour tout i = 1, . . . , k. Le sous-espace vectoriel F ⊥ est
donc le sous-espace vectoriel de E engendré par ek+1 , . . . , en .
Proposition 7. Pour tout sous-espace vectoriel F de E, le sous-espace vectoriel (F ⊥ )⊥ ,
appelé biorthogonal de F , est égal à F .
Plus généralement, pour toute partie A de E, le biorthogonal (A⊥ )⊥ de A est le
sous-espace vectoriel Vect(A) de E engendré par A.
Démonstration : L’inclusion F ⊂ (F ⊥ )⊥ est claire, puisque, pour tout x ∈ F et tout

y ∈ F ⊥ , on a hx, yi = 0. Mais
dim((F ⊥ )⊥ ) = dim(E) − dim(F ⊥ ) = dim(E) − [dim(E) − dim(F )] = dim(F )
d’où F = (F ⊥ )⊥ .
Si A est une partie quelconque de E, l’orthogonal de A est aussi l’orthogonal de
Vect(A), d’où
(A⊥ )⊥ = (Vect(A)⊥ )⊥ = Vect(A) .

Exemple : orthogonal d’un vecteur, vecteur normal à un hyperplan
Le sous-espace vectoriel de E orthogonal à un vecteur v non nul est un sous-espace
vectoriel de E de dimension dim(E) − 1, i.e. un hyperplan de E. C’est aussi le sous-
espace vectoriel de E orthogonal à la droite vectorielle engendrée par ce vecteur.
De même, le sous-espace vectoriel orthogonal à un hyperplan H de E est une droite
vectorielle de E. Tout vecteur non nul de cette droite est dit normal à H.
Équation d’un hyperplan : Soit E un espace vectoriel euclidien, (e1 , . . . , en ) une
n
P
base orthonormée de E, H un hyperplan de E et v = vi ei un vecteur normal à H.
i=1
Alors l’équation de H dans la base (e1 , . . . , en ) s’écrit :
n
X
vi xi = 0 .
i=1
6
Projection et symétrie orthogonales

Rappel : si F et G sont deux sous-espaces vectoriels supplémentaires d’un espace
vectoriel E, tout vecteur x de E s’écrit de manière unique sous la forme x = xF + xG ,
avec xF ∈ F et xG ∈ G. L’application p qui à x associe xF est une application linéaire
de E dans E, appelée projection sur F dans la direction G. Elle vérifie p ◦ p = p, son
image est F et son noyau G. L’application s qui à x associe xF − xG est une application
linéaire involutive (s◦s = idE ), donc bijective, de E sur E, appelée symétrie par rapport
à F dans la direction G. Ces deux applications linéaires sont reliées par la relation
s = 2 p − idE .
Définition 7. Soit E un espace vectoriel et F un sous-espace vectoriel de E. On appelle

projection orthogonale sur F la projection sur F dans la direction F ⊥ et symétrie
orthogonale par rapport à F la symétrie par rapport à F dans la direction F ⊥ .
Le projeté orthogonal xF sur F d’un vecteur x de E est donc caractérisé par les
deux relations xF ∈ F et hx − xF , yi = 0 pour tout y ∈ F .
Proposition 8. Toute projection vectorielle orthogonale p est 1-Lipschitzienne : kp(x)k ≤

kxk pour tout vecteur x.
Démonstration : Soit p la projection orthogonale sur un sous-espace vectoriel F d’un

espace vectoriel euclidien E. L’orthogonalité des vecteurs p(x) et x − p(x) implique
kxk2 = kp(x)k2 + kx − p(x)k2 , d’où kp(x)k ≤ kxk.
Définition 8. On appelle réflexion toute symétrie orthogonale par rapport à un hyper-

plan.
Une réflexion est donc, dans le plan, une symétrie orthogonale par rapport à une
droite et, dans l’espace, une symétrie orthogonale par rapport à un plan.
Exemple : cas d’une droite, d’un hyperplan
Soit v un vecteur non nul de E, D = Rv la droite vectorielle engendrée par v et
H l’hyperplan de E orthogonal à v, i.e. le supplémentaire orthogonal de D. Le projeté
orthogonal xD d’un vecteur x de E sur D est de la forme λv pour un réel λ. En écrivant
hx, vi
que hx − λv, vi = 0, on obtient λ = , d’où :
kvk2
hx, vi
xD = v.
kvk2
Le projeté orthogonal de x sur H est donc :
hx, vi
xH = x − xD = x − v.
kvk2
7
L’image de x par la réflexion sH d’hyperplan H est donc
hx, vi
sH (x) = 2 xH − x = x − 2 v.
kvk2
Si X (resp. X 0 , V ) est la matrice colonne des composantes de x (resp. sH (x), v)

dans une base orthonormée (e1 , . . . , en ), cette relation s’écrit
2 tV X
X0 = X − t V.
VV
2
La matrice dans la base (e1 , . . . , en ) de la réflexion sH est donc In − t V tV , où
VV
In est la matrice identité d’ordre n = dim(E).
Ces matrices jouent un rôle important en analyse numérique, où elles sont appelées
matrices de Householder.
1.1.3 Matrices orthogonales

Définition 9. Une matrice réelle A carrée d’ordre n est dite orthogonale si elle vérifie
l’une des propriétés équivalentes suivantes :
1. tAA = In ;
2. A tA = In ;
3. A est inversible et A−1 = tA.
Interprétation : La propriété 1 (resp. 2) signifie que les vecteurs colonnes (resp. lignes)
de la matrice A constituent un système orthonormé pour le produit scalaire canonique
de Rn . Ainsi une matrice est orthogonale si et seulement si ses vecteurs colonnes (resp.
ses vecteurs lignes) constituent une base orthonormale de Rn pour le produit scalaire
canonique.
Autrement dit, une matrice est orthogonale si et seulement si c’est la matrice de
passage de la base canonique de Rn à une base orthonormale de Rn . Plus généralement :
Proposition 9. Soit E un espace vectoriel euclidien et (e1 , . . . , en ) une base orthonor-

mée de E. Une base (v1 , . . . , vn ) de E est orthonormée si et seulement si la matrice de
passage de la base (e1 , . . . , en ) à la base (v1 , . . . , vn ) est orthogonale.
Proposition 10. La transposée et l’inverse d’une matrice orthogonale sont des ma-
trices orthogonales.
Démonstration : La proposition découle immédiatement de la définition et de la relation

t
( tA)−1 = (A−1 ).
Proposition 11. Toute matrice orthogonale a un déterminant égal à ±1.
8
Démonstration : En utilisant la relation tAA = In , on obtient
det( tAA) = det( tA)det(A) = det(A)2 = det(In ) = 1
d’où det(A) = ±1.

Attention : la réciproque est fausse : une matrice de déterminant ±1 n’est pas nécesai-
rement orthogonale.
Groupe orthogonal
Proposition 12. L’ensemble des matrices orthogonales d’ordre n constitue un sous-

groupe du groupe multiplicatif GL(n, R) des matrices réelles carrées inversibles d’ordre
n. Ce sous-groupe est appelé groupe orthogonal d’ordre n et noté O(n).
Démonstration : Cet ensemble n’est pas vide, puisqu’il contient la matrice identité, il
est stable par passage à l’inverse (proposition 10) et par produit, puisque si A et B
sont orthogonales d’ordre n, alors t(AB)AB = tB tAAB = tBIn B = In .
Proposition 13. L’ensemble des matrices orthogonales d’ordre n de déterminant +1

constitue un sous-groupe distingué du groupe orthogonal d’ordre n. Ce groupe est appelé
groupe spécial orthogonal d’ordre n et noté SO(n) ou O+ (n).
Démonstration : Cet ensemble est le noyau de l’homomorphisme de groupes de O(n)

dans {+1, −1} qui à toute matrice orthogonale associe son déterminant.
L’ensemble des matrices orthogonales d’ordre n de déterminant -1 est noté O− (n).
Ce n’est pas un sous-groupe de O(n) puisque le produit de deux matrices de O− (n)
appartient à O+ (n).
Orientation d’un espace vectoriel euclidien, produit mixte
Rappels : orientation d’un espace vectoriel réel
Pour tout espace vectoriel réel E de dimension finie, on définit une relation binaire
R sur l’ensemble des bases de E de la façon suivante : deux bases B et B 0 de E sont
en relation par R si et seulement si le déterminant de la matrice de passage de B à
B 0 est strictement positif. On montre que cette relation est une relation d’équivalence
qui divise l’ensemble des bases de E en exactement deux classes. Orienter E consiste
à choisir l’une de ces classes : toutes les bases qui lui appartiennent sont dites directes,
les autres indirectes. Deux bases en relation par R sont dites de même sens.
Dans le cas d’un espace vectoriel euclidien, deux bases orthonormées sont de même
sens si et seulement si la matrice de passage de l’une à l’autre est de déterminant +1.
Rappels : déterminant d’une famille de vecteurs
Le déterminant detB (v1 , . . . , vn ) d’une famille (v1 , . . . , vn ) de n vecteurs relativement
à une base B d’un espace vectoriel E de dimension n est par définition le déterminant
9
de la matrice carrée d’ordre n dont les colonnes sont les coordonnées de ces vecteurs
dans la base B. Ce déterminant dépend de la base B. Plus précisément, si B et B 0 sont
deux bases de E, les déterminants d’une famille de n vecteurs de E relativement à ces
deux bases sont reliés par la relation :
detB (v1 , . . . , vn ) = det(P ) detB0 (v1 , . . . , vn )
où P est la matrice de passage de la base B à la base B 0 .

Si E est un espace vectoriel euclidien de dimension n, le déterminant dans deux
bases orthonormées de même sens d’une famille de n vecteurs est le même, puisque la
matrice de passage de l’une de ces bases à l’autre est orthogonale de déterminant +1.
C’est ce qui permet de donner la définition suivante :
Définition 10. Soit E un espace vectoriel euclidien orienté de dimension n. On ap-

pelle produit mixte d’une famille (v1 , . . . , vn ) de n vecteurs de E le déterminant de
(v1 , . . . , vn ) dans une base orthonormée directe. Ce réel ne dépend pas du choix d’une
telle base et on le notera simplement det(v1 , . . . , vn ).
Remarque : Sans avoir à supposer l’espace vectoriel euclidien E orienté, on remarque

que la valeur absolue du déterminant de n vecteurs est la même dans toute base or-
thonormée de E. Cette valeur absolue ne dépend pas de l’ordre dans lequel sont écrits
ces vecteurs et représente, en dimension 2, l’aire du parallélogramme construit sur les
2 vecteurs, en dimension 3, le volume du parallélépipède construit sur les 3 vecteurs.
1.1.4 Groupe orthogonal, angles

Proposition 14. Soit f une application linéaire d’un espace vectoriel euclidien E dans
lui-même. Les propriétés suivantes sont équivalentes :
1. f conserve le produit scalaire : hf (u), f (v)i = hu, vi pour tout couple (u, v) ∈
E×E;
2. f conserve la norme : kf (u)k = kuk pour tout u ∈ E ;
3. l’image par f de toute base orthonormée de E est une base orthonormée ;
4. il existe une base orthonormée de E dont l’image par f est une base orthonormée ;
5. il existe une base orthonormée de E dans laquelle la matrice de f est orthogonale ;
6. la matrice de f dans toute base orthonormée de E est orthogonale.
Définition 11. Une application linéaire de E dans E vérifiant ces propriétés équiva-
lentes est appelée transformation orthogonale ou automorphisme orthogonal de E.
Démonstration : L’équivalence de 4 et 5, de même que celle de 6 et 3, provient de la

proposition 9, l’implication 1 ⇒ 3 de la définition d’une transformation orthogonale,
l’implication 4 ⇒ 1 de l’expression du produit scalaire dans une base orthonormale, les
10
implications 1 ⇒ 2 et 3 ⇒ 4 sont triviales. Il reste à montrer l’implication 2 ⇒ 1. Si f

est linéaire et conserve les normes, alors
1h i
hf (u), f (v)i = kf (u) + f (v)k2 − kf (u)k2 − kf (v)k2
2
1h i
= kf (u + v)k2 − kf (u)k2 − kf (v)k2
2
1h i
= ku + vk2 − kuk2 − kvk2
2
= hu, vi
pour tout couple (u, v).

Il résulte de la proposition suivante que toute application d’un espace vectoriel
euclidien dans lui-même qui conserve le produit scalaire est une transformation ortho-
gonale (mais une application qui conserve seulement la norme n’est pas nécessairement
linéaire) :
Proposition 15. Soit E un espace vectoriel euclidien et f une application de E dans

E qui conserve le produit scalaire : hf (u), f (v)i = hu, vi pour tout couple (u, v) de
vecteurs de E. Alors f est linéaire.
Démonstration : La conservation du produit scalaire entraîne :
kf (λu + µv) − λf (u) − µf (v)k2 = kf (λu + µv)k2 + λ2 kf (u)k2 + µ2 kf (v)k2

− 2λhf (λu + µv), f (u)i − 2µhf (λu + µv), f (v)i + 2λµhf (u), f (v)i
= kλu + µvk2 + λ2 kuk2 + µ2 kvk2
− 2λhλu + µv, ui − 2µhλu + µv, vi + 2λµhu, vi
= k(λu + µv) − λu − µvk2
= 0,
d’où f (λu + µv) = λf (u) + µf (v) pour tout couple (λ, µ) de réels et tout couple (u, v)
de vecteurs de E.
Exemple : les symétries orthogonales
Proposition 16. Une symétrie vectorielle est une transformation orthogonale si et

seulement si c’est une symétrie orthogonale.
Démonstration : Soit s la symétrie par rapport à un sous-espace vectoriel F dans

la direction du sous-espace vectoriel G. Si s est une transformation orthogonale, elle
conserve le produit scalaire, d’où, pour tout vecteur u de F et tout vecteur v de G
hu, vi = hs(u), s(v)i = hu, −vi = −hu, vi
11
d’où hu, vi = 0, ce qui montre que F et G sont orthogonaux.

Réciproquement, si G = F ⊥ , tout vecteur x s’écrit x = u + v, avec u ∈ F et v ∈ G,
et s(x) = u − v, d’où ks(x)k2 = kuk2 + kvk2 = kxk2 , puisque hu, vi = 0, ce qui montre
que s est une transformation orthogonale.
Groupe orthogonal
Proposition 17. L’ensemble des automorphismes orthogonaux d’un espace vectoriel

euclidien E est un sous-groupe (pour la composition) du groupe linéaire de E (groupe
des applications linéaires bijectives de E sur E, noté GL(E)). Ce sous-groupe est appelé
groupe orthogonal de E et noté O(E).
L’ensemble des automorphismes orthogonaux de déterminant +1 de E est un sous-
groupe de O(E), appelé groupe spécial orthogonal de E, et noté SO(E) ou O+ (E).
Rappel : Soit B une base orthonormée d’un espace vectoriel euclidien E de dimension
n. L’application qui à toute application linéaire bijective de E dans E associe sa matrice
dans la base B est un isomorphisme du groupe GL(E) sur le groupe GLn (R) des
matrices réelles carrées d’ordre n. La restriction de cet isomorphisme à O(E) est un
isomorphisme de O(E) sur le groupe O(n) des matrices orthogonales d’ordre n.
Le groupe orthogonal en dimension 2
Dans cette partie, E est un plan vectoriel euclidien orienté.
Proposition 18. Toute matrice orthogonale A d’ordre 2 est de l’une des deux formes
suivantes : !
a −b
– où a et b sont deux réels vérifiant a2 + b2 = 1 si det(A) = +1 ;
b a
!
a b
– où a et b sont deux réels vérifiant a2 + b2 = 1 si det(A) = −1.
b −a
!
cos θ − sin θ
Proposition 19. L’application qui à un réel θ associe la matrice Rθ =
sin θ cos θ
est un homomorphisme surjectif du groupe additif (R, +) sur le groupe multiplicatif
SO(2). Son noyau est le sous-groupe 2πZ des multiples entiers de 2π. Il en résulte que
SO(2) est isomorphe au groupe additif (R/2πZ, +) des réels modulo 2π.
Démonstration : La proposition découle immédiatement des formules d’addition des

fonctions trigonométriques :
! ! !
cos θ − sin θ cos θ0 − sin θ0 cos(θ + θ0 ) − sin(θ + θ0 )
Rθ Rθ0 = = = Rθ+θ0 .
sin θ cos θ sin θ0 cos θ0 sin(θ + θ0 ) cos(θ + θ0 )

Un élément de O+ (E) est appelé rotation vectorielle.
12
Corollaire 2. Le groupe O+ (E) des rotations vectorielles planes est commutatif, iso-
morphe au groupe additif (R/2πZ, +) des réels modulo 2π.
Corollaire 3. La matrice d’une rotation vectorielle est la même dans toute base or-
thonormée directe.
Démonstration : Cela découle immédiatement de la commutativité de SO(2) ; en effet

si une rotation vectorielle a pour matrice A ∈ SO(2) dans une base orthonormée
directe, sa matrice dans une autre base orthonormée directe sera de la forme P −1 AP ,
où la matrice de passage P appartient aussi à SO(2) ; comme SO(2) est abélien, on a
P −1 AP = A.
Il en résulte que l’isomorphisme du corollaire 2 ne dépend pas du choix d’une base
orthonormée directe.
Remarque : La rotation de matrice Rθ dans une base orthonormée directe a pour
matrice R−θ dans une base orthonormée indirecte. Changer l’orientation du plan revient
donc à changer le signe de θ.
Proposition 20. Tout élément de O− (E) est une réflexion vectorielle (symétrie or-
thogonale par rapport à une droite vectorielle).
!
a b
Démonstration : Le polynôme caractéristique d’une matrice avec a2 + b2 = 1
b −a
!
2 1 0
est X − 1, cette matrice est donc semblable à la matrice , ce qui montre que
0 −1
toute transformation orthogonale négative du plan est une symétrie par rapport à une
droite. Cette symétrie est une symétrie orthogonale d’après la proposition 16 .
Proposition 21. Pour tout couple (u, v) de vecteurs unitaires de E, il existe une
rotation vectorielle r et une seule transformant le premier en le second, i.e. telle que
r(u) = v.
Démonstration : On complète u en une base orthonormée directe (u, u1 ) de E. Dans

cette base, v s’écrit v = au + bu1 , où a et b sont deux réels vérifiant a2 + b2 = 1.
Une rotation vectorielle r vérifie r(u) = v si et seulement si la première colonne de sa
matrice dans cette base a pour coefficients a et b ; or il existe une et une seule matrice
de SO(2) ayant cette propriété.
Angles
On se propose dans cette partie de définir les principales notions d’angles utilisées
en géométrie plane. La notion première sera celle d’angle orienté de vecteurs ou, ce qui
revient au même, d’angle orienté de demi-droites vectorielles. En effet l’angle de deux
u
vecteurs non nuls u et v sera, par définition, l’angle des deux vecteurs unitaires et
kuk
13
v
qui leur sont directement proportionnels ; or toute demi-droite vectorielle possède
kvk
un vecteur directeur unitaire et un seul, et tout vecteur non nul définit une demi-droite
vectorielle de manière unique. L’angle de deux vecteurs non nuls u et v, ou l’angle
des deux demi-droites vectorielles R+ u et R+ v qu’ils engendrent, sera donc simplement
u v
l’angle des vecteurs unitaires et . Dans toute la suite, nous ne considérerons
kuk kvk
donc essentiellement que des vecteurs unitaires.
Deux approches sont proposées : la première, rapide et concrète, consiste à identifier
un angle et sa mesure, c’est-à-dire à considérer un angle orienté de vecteurs comme une
classe d’équivalence de réels modulo 2π ; la seconde, plus abstraite, définit un angle
comme une classe d’équivalence de couples de vecteurs et permet de distinguer l’angle
de sa mesure (qui dépend de l’orientation du plan, alors que l’angle lui-même n’en
dépend pas). Les deux approches reposent sur la même idée : l’angle de deux vecteurs
est l’angle de l’unique rotation qui transforme le premier en le second (l’existence et
l’unicité de cette rotation sont assurées par la proposition 21).
Une remarque sur la terminologie : dans l’expression « angle orienté de vecteurs »,
« orienté » ne se réfère pas à l’orientation du plan, mais à l’ordre dans lequel sont écrits
[
les vecteurs (l’angle (v, [
u) est l’opposé de l’angle (u, v)). On verra par contre que cet
ordre est indifférent quand on parle d’angles géométriques.
Angles : première approche
Angles orientés de vecteurs

Soient u et v deux vecteurs unitaires du plan vectoriel euclidien orienté E. Il existe
une et une seule rotation vectorielle rθ transformant u en v. La matrice de cette rotation
!
cos θ − sin θ
est la même dans toute base orthonormée directe et s’écrit Rθ = , où
sin θ cos θ
le réel θ est uniquement déterminé modulo 2π. On définit alors l’angle orienté (u, [ v)
des deux vecteurs comme la classe θ̄ de θ dans R/2πZ. On dira, pour abréger, qu’un
angle orienté de deux vecteurs est un réel défini modulo 2π, et on appellera mesure
principale de cet angle l’unique représentant de cette classe dans ] − π, +π]. Au niveau
des notations, on ne distinguera plus un réel θ de sa classe θ̄ modulo 2π.
Remarque : la matrice de!cette même rotation dans toute base orthonormée indirecte
cos θ sin θ
est R−θ = . Changer l’orientation du plan change donc les angles en
− sin θ cos θ
leurs opposés.
Angles particuliers : Pour tout vecteur u, l’angle (u, [ u) est l’angle nul et l’angle
\
(u, −u) est l’angle plat, de mesure principale π. Si u et v sont deux vecteurs orthogo-
[
naux, l’angle (u, v) est un angle droit, de mesure principale π/2 ou −π/2.
Proposition 22. Relation de Chasles pour les angles
14
Pour tout triplet (u, v, w) de vecteurs non nuls, on a :
[
(u, \
v) + (v, \
w) = (u, w) .
[
En particulier, les angles (u, [
v) et (v, u) sont opposés.
Démonstration : Si rθ (u) = v et rθ0 (v) = w, alors w = rθ0 ◦rθ (u). La relation de Chasles
découle alors immédiatement de l’égalité Rθ0 Rθ = Rθ+θ0 ,
Proposition 23. Action des transformations orthogonales sur les angles

\
1) Toute rotation vectorielle r conserve les angles orientés de vecteurs : (r(u), r(v)) =
[
(u, v) pour tout couple (u, v) de vecteurs non nuls.
2) Toute réflexion vectorielle s transforme les angles orientés de vecteurs en leurs
\
opposés : (s(u), [
s(v)) = −(u, v) pour tout couple (u, v) de vecteurs non nuls.
Démonstration :
La première propriété résulte immédiatement de la commutativité du groupe O+ (E) :
en effet, l’unique rotation r1 qui transforme u en v transforme aussi r(u) en r(v), puisque
r1 (r(u)) = r(r1 (u)) = r(v).
Pour démontrer la seconde, il suffit de remarquer que si r est une rotation et s une
réflexion, alors s ◦ r est une réflexion, d’où r−1 ◦ s = (s ◦ r)−1 = s ◦ r. Il en résulte que
si v = r(u), alors s(v) = r−1 (s(u)).
Angles orientés de droites

Une droite vectorielle a deux vecteurs directeurs unitaires et ces vecteurs sont oppo-
sés. Pour définir l’angle orienté de deux droites vectorielles, on a donc a priori le choix
entre quatre angles de vecteurs : (u, [ \
v), (−u, \
v), (u, \
−v) et (−u, −v) (en fait deux,
[ \ \ \
puisque (u, v) = (−u, −v) et (u, −v) = (−u, v)). Il faut identifier ces deux angles, qui
diffèrent d’un angle plat : l’angle orienté de deux droites est donc un réel défini modulo
π, i.e. un élément de R/πZ. La relation de Chasles est encore vraie pour les angles
orientés de droites, qui sont également conservés par toute rotation et transformés en
leurs opposés par les réflexions.
Angles géométriques
L’angle géométrique de deux vecteurs u et v est simplement la valeur absolue de la
[
mesure principale de (u, v). C’est donc un réel compris entre 0 et π, et ce réel ne dépend
pas de l’ordre des deux vecteurs. De plus toute tranformation orthogonale (directe ou
indirecte) conserve les angles géométriques. Par contre, la relation de Chasles n’est plus
toujours vraie pour les angles géométriques.
En particulier, l’angle géométrique de deux vecteurs unitaires u et v est égal à
arccos(hu, vi).
15
Bissectrices
Pour tout couple de vecteurs unitaires u et v, il existe une et une seule réflexion
vectorielle s qui échange u et v. Son axe est une droite vectorielle appelée bissectrice du
couple (u, v) (ou du couple de demi-droites vectorielles engendrées respectivement par
u et v), dirigée par le vecteur u + v si u et v ne sont pas opposés. Un vecteur directeur
\
unitaire w de cet axe vérifie (u, \
w) = (w, [
v), ou encore (u, \
v) = 2(u, w) et cette relation
détermine w uniquement modulo π.
Pour tout couple (D1 , D2 ) de droites vectorielles, il existe exactement deux réflexions
vectorielles les échangeant. Les axes de ces réflexions sont des droites vectorielles or-
thogonales, qui sont appelées bissectrices du couple de droites.
Composée de deux réflexions vectorielles
Proposition 24. Soient s1 et s2 deux réflexions vectorielles, d’axes respectifs D1 et
\
D2 . Le composé s2 ◦s1 de ces deux réflexions est la rotation vectorielle d’angle 2(D1 , D2 )
\
(l’angle de droites (D \
1 , D2 ) est seulement déterminé modulo π, mais 2(D1 , D2 ) est bien
défini modulo 2π : c’est un angle orienté de vecteurs).
Démonstration : Soient u1 et u2 des vecteurs directeurs unitaires de D1 et D2 . Le

composé s2 ◦ s1 des deux réflexions s1 et s2 est une rotation vectorielle d’angle
(u1 , s\ \ \ \
2 ◦ s1 (u1 )) = (u1 , s2 (u1 )) = (u1 , u2 ) + (u2 , s2 (u1 )) .
Mais d’après la proposition 23, on a :
(u2\
, s2 (u1 )) = (s2 (u\ \ \
2 ), s2 (u1 )) = −(u2 , u1 ) = (u1 , u2 ) .
\
L’angle de s2 ◦ s1 est donc 2(u 1 , u2 ).
Angles : seconde approche
Angles orientés de vecteurs

Soit U l’ensemble des vecteurs unitaires de E. L’idée est la même que précédem-
ment : on voudrait que l’angle (u\ \
1 , v1 ) soit égal à l’angle (u2 , v2 ) si c’est la même
rotation qui transforme, pour chacun de ces couples, le premier vecteur en le second.
La procédure standard pour cela est de définir une relation d’équivalence sur l’ensemble
U × U des couples de vecteurs unitaires de E :
Proposition 25. La relation R définie sur l’ensemble U × U des couples de vecteurs
unitaires de E par :
(u1 , v1 )R(u2 , v2 ) si et seulement si

il existe r ∈ O+ (E) vérifiant r(u1 ) = v1 et r(u2 ) = v2 (∗)
est une relation d’équivalence.
16
On a vu (proposition 21) qu’il existe toujours une rotation r1 et une seule vérifiant
r1 (u1 ) = v1 et une rotation r2 et une seule vérifiant r2 (u2 ) = v2 ; la relation (∗) signifie
que les couples (u1 , v1 ) et (u2 , v2 ) sont en relation si et seulement si r1 = r2 .
Remarques :
1) Cette relation est tout à fait analogue à celle qui définit l’équipollence de bipoints :
si on veut définir les vecteurs à partir des points, on dit que deux couples (A, B) et
(A0 , B 0 ) de points sont équipollents si c’est la même translation qui transforme A en B
et A0 en B 0 .
2) On montre facilement, en utilisant la commutativité de O+ (E), que la relation
(∗) équivaut encore à :
il existe r1 ∈ O+ (E) vérifiant r1 (u1 ) = u2 et r1 (v1 ) = v2 (∗∗).
[
Définition 12. On appelle angle de deux vecteurs unitaires u et v, et on note (u, v)
la classe d’équivalence du couple (u, v) pour la relation R.
\
On a donc bien (u \
1 , v1 ) = (u2 , v2 ) si et seulement si (∗) (ou (∗∗)) est vérifiée.
On a défini les angles. On voudrait maintenant définir une addition sur l’ensemble
A des angles. Il suffit pour cela de transporter sur A la loi de composition naturelle
sur O+ (E). L’ensemble A est en effet en bijection naturelle avec O+ (E) :
Proposition 26. L’application qui à une rotation r ∈ O+ (E) associe l’angle (u, \r(u))
+
ne dépend pas du choix du vecteur unitaire u ∈ U. C’est une bijection de O (E) sur A,
[
et la bijection réciproque associe à un angle (u, v) l’unique rotation r vérifiant v = r(u)
(cette rotation ne dépend pas du représentant choisi pour l’angle).
Définition 13. La somme (u \ \ \

1 , v1 ) + (u2 , v2 ) de deux angles est l’angle (u, r2 ◦ r1 (u)),
où ri (i = 1, 2) est l’unique rotation de E vérifiant ri (ui ) = vi .
On vérifie immédiatement que A muni de cette addition est un groupe abélien
isomorphe à O+ (E) (on a tout fait pour cela). On récupère de plus immédiatement la
relation de Chasles :
Proposition 27. Pour tout triplet (u, v, w) de vecteurs unitaires de E, on a :
[
(u, \
v) + (v, \
w) = (u, w) .
Démonstration : Il suffit de remarquer que si r1 (u) = v et r2 (v) = w, alors r2 ◦r1 (u) = w.

Angles particuliers
L’angle nul est bien sûr l’élément neutre du groupe (A, +) des angles de vecteurs ;
[
c’est l’angle (u, u) pour tout vecteur unitaire u ; il correspond, dans l’isomorphisme
17
précédent, à la rotation identité idE . Un autre angle remarquable est l’angle plat $ qui
\
est l’angle (u, \
−u) = (−u, u) pour tout vecteur unitaire u ; il correspond à la rotation
vectorielle −idE ; c’est l’unique élément d’ordre 2 du groupe (A, +) : $ + $ = 0. Le
groupe A possède en outre deux éléments d’ordre 4, qui sont les angles droits : ce sont
[
les angles (u, \
v) et (u, −v) où (u, v) est une base orthonormée quelconque de E.
Angles géométriques
Un angle géométrique doit être invariant par toute transformation orthogonale (et
non plus simplement par les seules rotations). On identifie donc cette fois deux couples
de vecteurs unitaires s’il existe une transformation orthogonale f qui transforme le
premier en le second : (u1 , v1 ) et (u2 , v2 ) sont équivalents si et seulement si il existe
f ∈ O(E) vérifiant f (u1 ) = u2 et f (v1 ) = v2 . Cela revient à quotienter A par la relation
d’équivalence pour laquelle deux angles sont équivalents s’ils sont égaux ou opposés.
Angles orientés de droites
La manière naturelle de définir l’angle de deux droites vectorielles D1 et D2 est de
prendre un vecteur directeur unitaire ui sur chacune de ces droites et de définir (D \ 1 , D2 )
comme étant (u \ 1 , u2 ). Comme une droite vectorielle possède deux vecteurs directeurs
unitaires opposés, on obtient ainsi a priori quatre valeurs, qui se réduisent en fait à
deux, puisque (−u \ \ \ \
1 , −u2 ) = (u1 , u2 ) et (−u1 , u2 ) = (u1 , −u2 ). Il faut donc identifier ces
deux valeurs, ce qui se fait, ici encore, au moyen d’une relation d’équivalence. Cette
relation consiste à identifier les angles (u \ \
1 , u2 ) et (u1 , −u2 ), ou encore un angle α et
l’angle α + $ : deux angles sont donc en relation si et seulement si leur différence
est 0 ou $. L’addition des angles est compatible avec cette relation, ce qui permet de
définir sur l’ensemble quotient A0 de A par cette relation d’équivalence une addition
qui fait de (A0 , +) un groupe abélien, appelé groupe des angles de droites. Ce groupe
n’est bien entendu rien d’autre que le groupe quotient du groupe abélien (A, +) par
son seul sous-groupe à deux éléments, constitué de l’angle nul et de l’angle plat. Il
comporte lui-même un seul élément d’ordre 2, l’angle droit, qui est la classe des deux
angles droits de vecteurs.
Mesure des angles
Rien de ce que nous avons fait jusqu’ici ne fait appel à l’orientation de E : on
peut parfaitement définir les angles et écrire, par exemple, la relation de Chasles, sans
avoir orienté le plan, et sans rien connaître non plus des fonctions trigonométriques.
Par contre, dès qu’on veut mesurer les angles, l’orientation du plan joue un rôle essen-
tiel. L’introduction de cette mesure des angles nécessite des outils d’analyse : il faut
connaître les fonctions cos et sin et leurs propriétés, ou, ce qui revient essentiellement
au même, la fonction t 7→ eit d’une variable réelle t, en particulier le fait que cette fonc-
tion définit un homomorphisme du groupe additif (R, +) sur le groupe multiplicatif
(U, ×) des nombres complexes de module 1, dont le noyau est le sous-groupe 2πZ. On
en déduit un isomorphisme naturel du groupe quotient (R/2πZ, +) sur (U, ×), et donc
18
sur le groupe SO(2) des matrices orthogonales positives d’ordre! 2 : cet isomorphisme
cos θ − sin θ
associe à la classe du réel θ la matrice Rθ = .
sin θ cos θ
Or le choix d’une orientation du plan permet d’identifier une rotation vectorielle
r et une matrice de SO(2) : on associe simplement à r sa matrice dans n’importe
quelle base orthonormée directe (il faut se souvenir que cette matrice ne dépend pas du
choix d’une telle base). On obtient ainsi, par composition, un isomorphisme du groupe
(R/2πZ, +) sur le groupe (A, +) des angles de vecteurs, ce qui permet d’identifier un
angle et sa mesure, qui est, par définition, l’élément de R/2πZ qui lui correspond par
cet isomorphisme. On retombe ainsi sur la définition adoptée dans la première approche
de la notion d’angle orienté de vecteurs.
Cette mesure dépend de l’orientation : en effet, si une rotation vectorielle r a comme
matrice Rθ dans une base orthonormée directe, la matrice de r dans une base ortho-
normée indirecte est R−θ . Autrement dit, si un angle a pour mesure θ dans le plan
orienté, et si on change l’orientation du plan, la mesure de l’angle devient −θ.
Si on veut mesurer les angles de droites, il faut factoriser l’homomorphisme de
(R, +) dans le groupe (A0 , +) des angles de droites, de noyau πZ, ce qui revient à
identifier des réels différant d’un multiple entier de π. La mesure d’un angle de droites
est donc la classe d’équivalence d’un réel modulo π (cette mesure dépend, là encore,
du choix d’une orientation).
Angles dans l’espace
On ne peut, dans l’espace vectoriel euclidien de dimension 3, même orienté, définir
la mesure d’un angle orienté de deux vecteurs, ou de deux droites. En effet l’orientation
de l’espace n’induit pas d’orientation naturelle sur un plan de cet espace : on ne peut
donc distinguer entre un angle et son opposé (par contre, la mesure de l’angle d’une
rotation est bien définie, à condition d’avoir orienté l’axe de cette rotation : en effet
une orientation de l’axe par le choix d’un vecteur directeur unitaire u induit automati-
quement une orientation du plan vectoriel orthogonal à cet axe (une base orthonormée
(v, w) de ce plan est directe si la base (u, v, w) de l’espace est directe)). La notion la
plus utile est donc ici celle d’angle géométrique de deux vecteurs unitaires, la mesure de
l’angle de deux tels vecteurs u et v étant ici encore arccos(hu, vi). Il n’y a bien entendu
plus non plus de relation de Chasles pour ces angles.
Groupe orthogonal en dimension 3
Dans cette partie, E est un espace vectoriel euclidien orienté de dimension 3.
Proposition 28. Toute transformation orthogonale f de E de déterminant +1 admet

la valeur propre +1. L’espace propre associé est, si f n’est pas l’identité, une droite
vectorielle D. Le plan vectoriel P orthogonal à D est stable par f et la restriction de f à
ce plan est une rotation vectorielle de P . La matrice de f dans toute base orthonormée
19
 
1 0 0
de E dont le premier vecteur u appartient à D s’écrit 0 cos θ − sin θ pour un réel
 
0 sin θ cos θ
θ, unique modulo 2π.
On dit alors que f est la rotation vectorielle d’axe D (orienté par le choix du vecteur
unitaire u) et d’angle θ.
Démonstration : Soit A la matrice de f dans une base orthonormée directe de E. De
la relation
t
A(A − I) = tAA − tA = I − tA = t(I − A)
on déduit
det(A − I) = det( tA)det(A − I) = det( tA(A − I)) = det(I − A) = −det(A − I)
d’où det(A−I) = 0, ce qui montre que 1 est valeur propre de A. Soit u un vecteur propre
unitaire de f associé à la valeur propre 1, i.e. un vecteur unitaire fixe par f . On vérifie
que la matrice de f dans toute base orthonormée directe de E dont le premier vecteur
est u s’écrit alors sous la forme indiquée dans l’énoncé. La proposition en résulte.
Si on change l’orientation de l’axe D en prenant comme vecteur directeur −u, l’angle

θ est changé en son opposé. La mesure de l’angle d’une rotation de l’espace dépend
donc de l’orientation de son axe.
On remarque que l’angle géométrique d’une rotation s’obtient immédiatement à
partir de la matrice de cette rotation : en effet, en reprenant les notations de la dé-
monstration précédente, la trace de la matrice A est 1 + 2 cos θ ; or la trace d’un en-
domorphisme ne dépend pas de la base (deux matrices semblables ont même trace) ; il
en résulte que 1 + 2 cos θ est la trace de la matrice de f dans n’importe quelle base de
E (éventuellement non orthonormée).
Pour déterminer le signe de l’angle d’une rotation vectorielle, on peut utiliser la
proposition suivante :
Proposition 29. Si f est une rotation vectorielle qui n’est pas un demi-tour, d’axe
orienté par le choix d’un vecteur directeur u, le signe de sin θ est celui de det(u, v, f (v))
pour tout vecteur v non colinéaire à u.
u
Démonstration : Soit (i, j, k) une base orthonormée directe telle que i = . La
 
kuk
1 0 0
matrice de f dans cette base est 0 cos θ − sin θ. Si v a pour composantes (x, y, z)
 
0 sin θ cos θ
dans cette base, on a

kuk x x

det(u, v, f (v)) = 0

y y cos θ − z sin θ = kuk(y 2 + z 2 ) sin θ

0 z y sin θ + z cos θ
20
qui est du signe de sin θ puisque y 2 + z 2 > 0.

Proposition 30. Toute transformation orthogonale f de E de déterminant -1 admet
la valeur propre -1. L’espace propre associé est, si f est différente de −idE , une droite
vectorielle D. Le plan vectoriel P orthogonal à D est stable par f et la restriction de f
à ce plan est une rotation vectorielle de P . Si cette rotation est l’identité de P , f est
la réflexion de plan P . Sinon, f est le produit commutatif d’une rotation d’axe D et
de la réflexion de plan P . La matrice de f dans toute base orthonormée de E  dont le
−1 0 0
premier vecteur u appartient à D s’écrit dans tous les cas  0 cos θ − sin θ pour
 
0 sin θ cos θ
un réel θ, unique modulo 2π (f est une réflexion si θ ≡ 0 modulo 2π, −idE si θ ≡ π
modulo 2π ).
Démonstration : Soit A la matrice de f dans une base orthonormée directe de E. De

la relation
t
A(A + I) = tAA + tA = I + tA = t(I + A)
on déduit
−det(A + I) = det( tA)det(A + I) = det( tA(A + I)) = det(I + A)
d’où det(A + I) = 0, ce qui montre que -1 est valeur propre de A. Soit u un vecteur
propre unitaire de f associé à la valeur propre -1. On vérifie que la matrice de f dans
toute base orthonormée directe de E dont le premier vecteur est u s’écrit alors sous la
forme indiquée dans l’énoncé. La proposition en résulte.
On dit, si f n’est pas une réflexion, que f est une antirotation, ou encore une
isométrie vectorielle gauche.
1.1.5 Dualité
Rappels : espace vectoriel dual

1. On appelle forme linéaire sur un espace vectoriel réel E toute application linéaire
de E dans R.
2. L’ensemble des formes linéaires sur un espace vectoriel réel E constitue un espace
vectoriel, appelé espace vectoriel dual de E et noté E ∗ .
3. Si E est de dimension finie n et si (e1 , . . . , en ) est une base de E, on!définit, pour
n
tout i = 1, . . . , n, une application e∗i de E dans R par e∗i
P
xj ej = xi . Cette
j=1
application, appelée i-ième application coordonnée dans la base (e1 , . . . , en ), est
une forme linéaire sur E vérifiant

1 si i = j
e∗i (ej ) = δi,j =
0 sinon,
21
et la famille (e∗1 , . . . , e∗n ) est une base de E ∗ , appelée base duale de la base
(e1 , . . . , en ). En particulier, E ∗ et E ont même dimension : dim E ∗ = dim E.
Proposition 31. Soit E un espace vectoriel euclidien.

1. Pour tout vecteur v de E, l’application lv : x 7→ hv, xi de E dans R est une
forme linéaire sur E.
2. L’application v 7→ lv est un isomorphisme d’espaces vectoriels de E sur son dual
E ∗ . En particulier, pour toute forme linéaire l sur E, il existe un vecteur v de E,
et un seul, tel que l(x) = lv (x) = hv, xi pour tout vecteur x de E.
Démonstration : La première propriété découle immédiatement de la linéarité du pro-

duit scalaire.
Si a et b sont deux réels et v et w deux vecteurs de E, on a, pour tout x ∈ E :
lav+bw (x) = hav + bw, xi = ahv, xi + bhw, xi = alv (x) + blw (x)
d’où lav+bw = alv + blw L’application v 7→ lv de E dans E ∗ est donc linéaire.

Comme E et E ∗ ont même dimension, il suffit, pour démontrer que c’est un isomor-
phisme, de vérifier qu’elle est injective, ou encore que son noyau est réduit au vecteur
nul. Mais si lv est la forme linéaire nulle, on a lv (x) = hv, xi = 0 pour tout x ∈ E ; en
particulier, pour x = v, on a hv, vi = kvk2 = 0, d’où v = 0.
En particulier, pour toute base orthonormale (e1 , . . . , en ) de E, la base duale (e∗1 , . . . , e∗n )
est donnée par e∗i = lei pour tout i = 1, . . . , n, puisque e∗i (x) = hei , xi pour tout vecteur
n
P
x de E. Plus généralement, toute forme linéaire l sur E est de la forme l(x) = v i xi
i=1
pour un n-uplet (v1 , . . . , vn ) de réels, où (x1 , . . . , xn ) sont les coordonnées du vecteur x
n
P
dans la base (e1 , . . . , en ), de sorte que l = lv , où v = vi ei .
i=1
Produit vectoriel
Soit E un espace vectoriel euclidien orienté de dimension n, (v1 , . . . , vn−1 ) une fa-
mille de n − 1 vecteurs de E. L’application de E dans R qui à tout vecteur x associe le
produit mixte de la famille (v1 , . . . , vn−1 , x) est une forme linéaire sur E. Il existe donc
(proposition 31) un vecteur w de E et un seul tel que det(v1 , . . . , vn−1 , x) = hw, xi pour
tout vecteur x de E. Ce vecteur est appelé produit vectoriel de la famille (v1 , . . . , vn−1 ).
Définition 14. Soit E un espace vectoriel euclidien orienté de dimension n. On appelle

produit vectoriel d’une famille (v1 , . . . , vn−1 ) de n − 1 vecteurs de E l’unique vecteur
v1 ∧ v2 ∧ · · · ∧ vn−1 de E vérifiant
det(v1 , . . . , vn−1 , x) = hv1 ∧ v2 ∧ · · · ∧ vn−1 , xi
pour tout vecteur x de E.
22
En particulier, pour n = 3, le produit vectoriel de deux vecteurs u et v d’un espace

vectoriel euclidien orienté de dimension 3 est l’unique vecteur u ∧ v vérifiant
det(u, v, x) = hu ∧ v, xi
pour tout vecteur x de E.
Propriétés
Nous nous intéresserons surtout au cas n = 3. C’est pourquoi nous donnerons les
propriétés du produit vectoriel dans ce cadre.
Proposition 32. Soit E un espace vectoriel euclidien orienté de dimension 3.

1. Le produit vectoriel est une application bilinéaire alternée, donc antisymétrique,
de E × E dans E : pour tous vecteurs u, u1 , u2 , v, v1 , v2 et tous réels a et b :
– (au1 + bu2 ) ∧ v = a u1 ∧ v + b u2 ∧ v (linéarité à gauche)
– u ∧ (av1 + bv2 ) = a u ∧ v1 + b u ∧ v2 (linéarité à droite)
– u∧u=0
– u ∧ v = −v ∧ u (antisymétrie)
2. Le produit vectoriel de deux vecteurs est nul si et seulement si ces deux vecteurs
sont colinéaires.
3. Le produit vectoriel de deux vecteurs est orthogonal à chacun de ces vecteurs.
4. Si les vecteurs u et v forment un système libre, (u, v, u ∧ v) est une base directe
de E.
5. Si (e1 , e2 , e3 ) est une base orthonormée directe de E, les coordonnées de u∧v dans
cette base sont (u2 v3 − u3 v2 , u3 v1 − u1 v3 , u1 v2 − u2 v1 ), si u a pour coordonnées
(u1 , u2 , u3 ) et v (v1 , v2 , v3 ).
6. Pour tout couple (u, v) de vecteurs de E, on a :
ku ∧ vk2 + hu, vi2 = kuk2 kvk2 .
7. Pour tout couple (u, v) de vecteurs de E, on a :
ku ∧ vk = kuk kvk sin θ
où 0 ≤ θ ≤ π est une mesure de l’angle non orienté des vecteurs u et v.
Démonstration : La propriété 1 provient de la linéarité du produit scalaire et des

propriétés analogues du déterminant.
Si u et v sont colinéaires, u ∧ v est nul par 1. Si le système (u, v) est libre, on peut le
compléter en une base (u, v, w) de E et la relation 0 6= det(u, v, w) = hu ∧ v, wi montre
que u ∧ v n’est pas nul.
23
Les relations hu ∧ v, ui = det(u, v, u) = 0 et hu ∧ v, vi = det(u, v, v) = 0 montrent

que u ∧ v est orthogonal à chacun des deux vecteurs u et v.
La propriété 4 résulte de la relation det(u, v, u ∧ v) = ku ∧ vk2 > 0 si (u, v) est un
système libre.
Les composantes de u ∧ v s’obtiennent en développant le déterminant det(u, v, x)
par rapport à sa dernière colonne.
La relation 6 découle de l’identité algébrique :
(u2 v3 − u3 v2 )2 + (u3 v1 − u1 v3 )2 + (u1 v2 − u2 v1 )2 + (u1 v1 + u2 v2 + u3 v3 )2

= (u21 + u22 + u23 )(v12 + v22 + v32 ) .
La relation 7 découle de la précédente et de la relation hu, vi = kuk kvk cos θ.
Adjoint d’un endomorphisme

Soit E un espace vectoriel euclidien et f un endomorphisme de E (i.e. une applica-
tion linéaire de E dans E). Pour tout vecteur x de E, l’application y 7→ hx, f (y)i de E
dans R est une forme linéaire sur E. Il existe donc un vecteur f ∗ (x) de E et un seul qui
vérifie hx, f (y)i = hf ∗ (x), yi pour tout y ∈ E. On vérifie facilement que l’application
f ∗ de E dans E ainsi définie est linéaire. C’est donc un endomorphisme de E, appelé
endomorphisme adjoint de f .
Définition 15. Soit E un espace vectoriel euclidien et f un endomorphisme de E.

On appelle endomorphisme adjoint de f et on note f ∗ l’unique endomorphisme de E
vérifiant
hx, f (y)i = hf ∗ (x), yi
pour tout couple (x, y) de vecteurs de E.
Proposition 33. Propriétés de l’adjoint :

1. L’application de l’espace vectoriel L(E) des endomorphismes de E dans L(E) qui
à un endomorphisme f associe son adjoint f ∗ est linéaire et involutive : (f ∗ )∗ = f .
2. Si f et g sont deux endomorphismes de E, (f ◦ g)∗ = g ∗ ◦ f ∗ .
3. La matrice de f ∗ dans toute base orthonormée de E est la transposée de la matrice
de f dans cette même base.
4. Le noyau de f ∗ est l’orthogonal de l’image de f .
5. L’image de f ∗ est l’orthogonal du noyau de f .
6. Les endomorphismes f et f ∗ ont même rang.
Démonstration : La linéarité vient de la relation
hx, (af + bg)(y)i = ahx, f (y)i + bhx, g(y)i = haf ∗ (x) + bg ∗ (x), yi
24
où f et g sont deux endomorphismes de E, a et b deux réels, x et y deux vecteurs

quelconques de E.
La relation (f ∗ )∗ = f vient de même de
hx, (f ∗ )∗ (y)i = hf ∗ (x), yi = hx, f (y)i
et la relation (f ◦ g)∗ = g ∗ ◦ f ∗ de
hx, (f ◦ g)(y)i = hx, f (g(y))i = hf ∗ (x), g(y)i = hg ∗ (f ∗ (x)), yi .
La matrice A d’un endomorphisme f dans une base orthonormée (e1 , . . . , en ) a pour

coefficients
ai,j = hei , f (ej )i .
La matrice B de l’endomorphisme f ∗ dans cette même base a donc pour coefficients
bi,j = hei , f ∗ (ej )i = hf (ei ), ej i = aj,i
d’où B = tA.
Un vecteur x de E appartient au noyau de f ∗ si et seulement si f ∗ (x) = 0, i.e. si et
seulement si hf ∗ (x), yi = hx, f (y)i = 0 pour tout vecteur y de E, i.e. si et seulement si
x est orthogonal à l’image de f .
En remplaçant f par f ∗ dans la relation Ker(f ∗ ) = Im(f )⊥ , on obtient Im(f ∗ )⊥ =
Ker((f ∗ )∗ ) = Ker(f ), d’où Ker(f )⊥ = (Im(f ∗ )⊥ )⊥ = Im(f ∗ ).
Le rang d’un endomorphisme est la dimension de son image. Mais :
dim(Im(f ∗ )) = dim((Ker(f ))⊥ ) = dim(E) − dim(Ker(f )) = dim(Im(f )) .
Les endomorphismes f et f ∗ ont donc même rang. On retrouve ainsi, dans le cas des
matrices réelles carrées, le fait qu’une matrice et sa transposée ont même rang.

Endomorphismes symétriques
Proposition 34. Soit f un endomorphisme d’un espace vectoriel euclidien E. Les
propriétés suivantes sont équivalentes :
(i) hf (x), yi = hx, f (y)i pour tout couple (x, y) de vecteurs de E ;
(ii) la matrice de f dans toute base orthonormale de E est symétrique ;
(iii) il existe une base orthonormale de E dans laquelle la matrice de f est symé-
trique ;
(iv) f = f ∗ .
Un endomorphisme vérifiant ces propriétés est dit symétrique ou auto-adjoint.
Démonstration : L’équivalence de (i) et (iv) vient de la définition de l’adjoint, l’impli-

cation (ii) ⇒ (iii) est évidente et les implications (iii) ⇒ (iv) et (iv) ⇒ (ii) viennent
de la proposition 33.
25
Proposition 35. L’ensemble des endomorphismes symétriques d’un espace vectoriel

n(n + 1)
euclidien E de dimension n est un sous-espace vectoriel de dimension de
2
l’espace des endomorphismes de E.
Démonstration : La stabilité par combinaisons linéaires de l’ensemble des endomor-

phismes symétriques vient de la linéarité de l’application f 7→ f ∗ . Soit B une base
orthonormée de E. L’application qui à tout endomorphisme f de E associe sa matrice
dans la base B est un isomorphisme de L(E) sur Mn (R) qui induit un isomorphisme
du sous-espace des endomorphismes symétriques de E sur l’espace des matrices car-
n(n + 1)
rées symétriques d’ordre n. Ce dernier est de dimension , puisqu’une matrice
2
symétrique A = (ai,j ) est déterminée par les coefficients ai,j pour 1 ≤ i ≤ j ≤ n.
Remarque : le composé de deux endomorphismes symétriques f et g n’est en géné-
ral pas symétrique ; plus précisément, il n’est symétrique que si ces endomorphismes
commutent, puisque (f ◦ g)∗ = g ∗ ◦ f ∗ = g ◦ f .
La proposition suivante résulte immédiatement de la proposition 33 :
Proposition 36. Le noyau et l’image d’un endomorphisme symétrique sont des sous-
espaces vectoriels supplémentaires orthogonaux.
Exemple : projections et symétries orthogonales

Proposition 37. Une projection (resp. une symétrie) vectorielle est un endomor-
phisme symétrique si et seulement si c’est une projection (resp. une symétrie) ortho-
gonale.
Démonstration : Soit p une projection sur un sous-espace vectoriel F d’un espace vec-
toriel euclidien E dans la direction d’un sous-espace G, s la symétrie par rapport à F
dans la direction G. La relation s = 2 p − idE montre que p est symétrique si et seule-
ment si s l’est. Si p est symétrique, son noyau G et son image F sont supplémentaires
orthogonaux d’après la proposition 36 : p est donc une projection orthogonale. Récipro-
quement, si p est une projection orthogonale, F et G sont supplémentaires orthogonaux
et
hp(x), yi = hp(x), p(y)i + hp(x), y − p(y)i = hp(x), p(y)i
pour tout couple (x, y) de vecteurs de E, puisque p(x) ∈ F et y − p(y) ∈ G sont
orthogonaux. En échangeant x et y, on obtient de même hp(x), p(y)i = hx, p(y)i, d’où
hp(x), yi = hx, p(y)i, ce qui montre que p est un endomorphisme symétrique.
Formes quadratiques sur un espace vectoriel euclidien
Rappels
Une forme bilinéaire symétrique sur un espace vectoriel réel E est une application
b de E × E dans R linéaire par rapport à chacun de ses arguments et symétrique :
26
– b(x, a1 y1 + a2 y2 ) = a1 b(x, y1 ) + a2 b(x, y2 )

– b(a1 x1 + a2 x2 , y) = a1 b(x1 , y) + a2 b(x2 , y)
– b(x, y) = b(y, x)
pour tous vecteurs x, y, x1 , x2 , y1 , y2 de E et tous réels a, b.
Une application q de E dans R est une forme quadratique sur E s’il existe une
forme bilinéaire symétrique b sur E telle que q(x) = b(x, x) pour tout vecteur x de
E. La forme bilinéaire symétrique b, appelée forme polaire de q, est alors uniquement
déterminée, puisque
1 1
b(x, y) = [q(x + y) − q(x) − q(y)] = [q(x + y) − q(x − y)] .
2 4
Pour tout endomorphisme symétrique f de E, l’application b : (x, y) 7→ hx, f (y)i
de E × E dans R est une forme bilinéaire symétrique. Réciproquement :
Proposition 38. Pour toute forme bilinéaire symétrique b : E × E → R sur un espace
vectoriel euclidien E, il existe un endomorphisme symétrique f de E et un seul tel que
b(x, y) = hx, f (y)i pour tout couple (x, y) de vecteurs de E.
Démonstration : Pour tout vecteur x de E, l’application y 7→ b(x, y) de E dans R est

une forme linéaire sur E. Il en résulte (proposition 31) qu’il existe un vecteur f (x) et
un seul tel que b(x, y) = hf (x), yi pour tout vecteur y de E. Il résulte de la linéarité
en x de b que f est linéaire et de la symétrie de b que f est symétrique.
Corollaire 4. Pour toute forme quadratique q sur un espace vectoriel euclidien E, il
existe un endomorphisme symétrique f de E et un seul tel que q(x) = hx, f (x)i pour
tout vecteur x de E.
Réduction des matrices symétriques réelles

Théorème 1. Tout endomorphisme symétrique d’un espace vectoriel euclidien est dia-
gonalisable dans une base orthonormale : pour tout endomorphisme symétrique f d’un
espace vectoriel euclidien E, il existe une base orthonormale de E constituée de vecteurs
propres de f .
Corollaire 5. Soit E un espace vectoriel euclidien et b une forme bilinéaire symétrique
sur E. Alors il existe une base orthonormée (e1 , . . . , en ) de E orthogonale pour b :
b(ei , ej ) = 0 pour tout i 6= j.
Démonstration : D’après la proposition 38, il existe un endomorphisme symétrique f de

E tel que b(x, y) = hx, f (y)i pour tout couple (x, y) de vecteurs de E. Soit (e1 , . . . , en )
une base orthonormée de E constituée de vecteurs propres de f et λi les valeurs propres
correspondantes. Alors :
b(ei , ej ) = hei , f (ej )i = hei , λj ej i = λj hei , ej i = 0
pour tout couple (i, j) tel que i 6= j.
27
Théorème 2. Toute matrice symétrique réelle est diagonalisable dans R. Plus préci-
sément, pour toute matrice symétrique réelle A, il existe une matrice orthogonale P et
une matrice diagonale réelle D telles que A = tP D P .
Lemme 2. Tout endomorphisme symétrique d’un espace vectoriel euclidien admet au
moins une valeur propre réelle.
Démonstration : Soit f un endomorphisme symétrique d’un espace vectoriel euclidien

E, q la forme quadratique associée, S la sphère unité de E. La fonction q est continue
sur le compact S, elle est donc bornée sur S et atteint son maximum λ en un point
x de S. On a q(z) ≤ λ = q(x) = hx, f (x)i pour tout z ∈ S et donc q(z) ≤ λkzk2 par
homogénéité pour tout z ∈ E, d’où, pour z = x + ty :
hx + ty, f (x + ty)i = hx, f (x)i + 2 t hf (x), yi + t2 hy, f (y)i

≤ λkx + tyk2
= λ + 2 λt hx, yi + λt2 kyk2
soit encore
t2 λkyk2 − hy, f (y)i + 2t (λhx, yi − hf (x), yi) ≥ 0
pour tout y ∈ E et tout réel t. Ce trinôme du second degré en t atteint son minimum
en t = 0, sa dérivée est donc nulle en ce point, ce qui s’écrit hf (x), yi = λhx, yi pour
tout y ∈ E, ou encore hf (x) − λx, yi = 0 pour tout y ∈ E, et implique f (x) = λx.
Remarque : on vérifie immédiatement que la valeur propre λ introduite dans cette
démonstration est la plus grande valeur propre de f .
Lemme 3. Soit E un espace vectoriel euclidien, f un endomorphisme symétrique de
E, Eλ le sous-espace propre de f associé à une valeur propre λ. Alors l’orthogonal Eλ⊥
de Eλ est stable par f .
Démonstration : Soit y ∈ Eλ⊥ . Pour tout x ∈ Eλ , on a :
hf (y), xi = hy, f (x)i = hy, λxi = λhy, xi = 0 ,
d’où f (y) ∈ Eλ⊥ .
Démonstration du théorème 1 : On démontre le théorème par récurrence sur la di-

mension n de E. Pour n = 1, tout vecteur unitaire de E est vecteur propre de tout
endomorphisme et constitue une base orthonormée de E. Supposons le théorème vrai
pour tout espace vectoriel euclidien de dimension ≤ n − 1. Soit E un espace vectoriel
euclidien de dimension n et f un endomorphisme symétrique de E. D’après le lemme 2,
f admet une valeur propre réelle λ. Soit Eλ l’espace propre associé. D’après le lemme
3, l’orthogonal Eλ⊥ de Eλ est un sous-espace vectoriel de E de dimension < n stable par
f . La restriction de f à Eλ⊥ est un endomorphisme symétrique de Eλ⊥ . Par l’hypothèse
28
de récurrence, il existe une base orthonormée de Eλ⊥ constituée de vecteurs propres de

f . En la complétant par une base orthonormée de Eλ , on obtient une base orthonormée
de E constituée de vecteurs propres de f .
Corollaire 6. Une matrice réelle symétrique est positive (resp. définie positive) si et
seulement si toutes ses valeurs propres sont positives (resp. strictement positives).
Démonstration : Soit A une matrice réelle symétrique d’ordre n. D’après le théorème

2, il existe une matrice orthogonale P et une matrice diagonale réelle D, de coefficients
diagonaux les valeurs propres λi de A, telles que A = tP D P . On a alors, pour tout
vecteur colonne X de Rn :
n
t
XAX = tX tP DP X = tY DY = λi yi2
X
i=1
en posant Y = P X = t(y1 , . . . , yn ). Le corollaire en résulte immédiatement, en remar-

quant que X est nulle si et seulement si Y l’est.
1.2 Espaces affines euclidiens

1.2.1 Distance et orthogonalité
Définition 16. On appelle espace affine euclidien tout espace affine dont la direction
est un espace vectoriel euclidien.
Dans toute cette section, E désignera un espace affine euclidien de dimension finie
→
−
(souvent égale à 2 ou 3) de direction E . Les points de E seront désignés (sauf exception)
→
−
par des lettres majuscules, les vecteurs de E seront toujours notés avec des flèches pour
les distinguer des points de E. On notera ~u · ~v le produit scalaire de deux vecteurs ~u
et ~v .
Proposition 39. Un espace affine euclidien est naturellement muni d’une distance d,
appelée distance euclidienne, définie par
−→ −→ −→
q
d(A, B) = kABk = AB · AB .
Cette distance vérifie l’inégalité triangulaire :
|AB − AC| ≤ BC ≤ AB + AC
pour tout triplet (A, B, C) de points de E, et on a l’égalité BC = AB + AC si et

seulement si A appartient au segment [BC].
29
Démonstration : Les propriétés d(A, B) = d(B, A) et d(A, B) = 0 si et seulement si

A = B sont immédiates. L’inégalité triangulaire provient de l’inégalité triangulaire pour
−−→ −→ −→
la norme euclidienne et de la relation de Chasles BC = BA + AC. On a égalité dans
−→ −→
cette inégalité si et seulement si les vecteurs BA et AC sont directement proportionnels,
i.e. si et seulement si A appartient au segment [BC].
Conformément à un usage solidement établi, on notera systématiquement AB la
distance d(A, B) de deux points A et B.
Définition 17. Un repère cartésien (O, ~e1 , . . . , ~en ) d’un espace affine euclidien E est
→
−
dit orthonormé (ou orthonormal) si la base (~e1 , . . . , ~en ) de E est orthonormée.
→
−
Un espace affine euclidien E est dit orienté si sa direction E est un espace vectoriel
euclidien orienté.
Définition 18. Deux sous-espaces affines sont dits orthogonaux si leurs directions
sont des sous-espaces vectoriels orthogonaux.
Définition 19. Soit H un hyperplan d’un espace affine euclidien E. On appelle vecteur
normal à H tout vecteur non nul orthogonal à H.
Proposition 40. Soit E un espace affine euclidien de dimension n rapporté à un repère

orthonormé. L’hyperplan H passant par un point B de coordonnées (b1 , . . . , bn ) et de
vecteur normal ~n (a1 , . . . , an ) admet l’équation a1 (x1 − b1 ) + · · · + an (xn − bn ) = 0.
Réciproquement si un hyperplan H admet l’équation a1 x1 + . . . an xn + b = 0, alors
le vecteur ~n (a1 , . . . , an ) est un vecteur normal à H.
Démonstration : Pour démontrer la première assertion, il suffit d’écrire qu’un point M

−−→
de E appartient à H si et seulement si ~n · BM = 0. La seconde vient de ce que deux
équations représentent un même hyperplan si et seulement si elles sont proportionnelles.

Dans un plan affine euclidien, deux droites orthogonales sont toujours sécantes. Il
n’en va pas de même dans l’espace de dimension 3. Deux droites sont dites perpendi-
culaires si elles sont orthogonales et sécantes.
Proposition 41. Soient D1 et D2 deux droites non parallèles de l’espace affine eucli-
dien de dimension 3. Alors il existe une droite et une seule perpendiculaire à D1 et à
D2 . Cette droite est appelée perpendiculaire commune à D1 et D2 et ses points d’in-
tersection A1 et A2 avec D1 et D2 pieds de la perpendiculaire commune. La distance
A1 A2 réalise la distance minimale entre un point de D1 et un point de D2 :
A1 A2 = min{M1 M2 | M1 ∈ D1 , M2 ∈ D2 } = d(D1 , D2 )
et ce minimum n’est atteint que pour le couple (A1 , A2 ).
30
Démonstration : Soient D1 et D2 deux droites non parallèles, M1 (resp. M2 ) un point

de D1 (resp. D2 ), ~v1 (resp. ~v2 ) un vecteur directeur de D1 (resp. D2 ). Si une droite ∆ est
perpendiculaire à D1 et D2 , tout vecteur directeur de cette droite est orthogonal à ~v1 et
~v2 , donc colinéaire à w ~ = ~v1 ∧~v2 , qui n’est pas nul puisque ~v1 et ~v2 ne sont pas colinéaires.
La droite ∆ est donc incluse dans le plan P1 passant par M1 et de vecteurs directeurs
~v1 et w,
~ puisqu’elle rencontre D1 . De même, ∆ est incluse dans le plan P2 passant par
M2 et de vecteurs directeurs ~v2 et w. ~ Ces deux plans ne peuvent être parallèles, sinon
le système (~v1 , ~v2 , w)
~ serait lié, puisque ces trois vecteurs appartiendraient à un même
plan vectoriel. Leur intersection est donc une droite et ∆ ne peut être que cette droite,
ce qui prouve l’unicité de la perpendiculaire commune.
Pour montrer l’existence, il suffit de vérifier que l’intersection ∆ des deux plans P1
et P2 est perpendiculaire à D1 et D2 : elle leur est orthogonale, puisque w ~ en est un
vecteur directeur, et elle rencontre D1 , puisqu’elle est coplanaire avec D1 (ces deux
droites sont incluses dans P1 ) et non parallèle à D1 ; elle rencontre D2 pour des raisons
analogues.
Soient A1 et A2 les pieds de la perpendiculaire commune. Pour tout point M1 de
−−−−→ −−−→ −−−→ −−−→
D1 et tout point M2 de D2 , on a M1 M2 = M1 A1 + A1 A2 + A2 M2 d’après la relation
−−−→ −−−→ −−−→
de Chasles. Mais les vecteurs A1 A2 et M1 A1 + A2 M2 étant orthogonaux, on en déduit
−−−→ −−−→
M1 M22 = A1 A22 + kM1 A1 + A2 M2 k2 , d’où M1 M2 ≥ A1 A2 . L’égalité n’est obtenue que
−−−→ −−−→
pour M1 A1 + A2 M2 = ~0 ; les droites D1 et D2 n’étant pas parallèles, cette égalité
−−−→ −−−→
implique M1 A1 = A2 M2 = ~0.
Deux droites parallèles et distinctes de l’espace définissent un plan et admettent
une infinité de perpendiculaires communes, toutes parallèles entre elles.
Dans l’espace affine euclidien de dimension 3, une droite et un plan orthogonaux sont
toujours sécants (on dit indifféremment que la droite est orthogonale ou perpendiculaire
au plan). Deux plans d’un tel espace ne peuvent être orthogonaux : en effet la somme
des dimensions de deux sous-espace affines orthogonaux est toujours inférieure ou égale
à la dimension de l’espace.
Définition 20. Dans un espace affine euclidien de dimension 3, deux plans sont dits
perpendiculaires si leurs vecteurs normaux sont orthogonaux.
Proposition 42. Deux plans d’un espace affine euclidien de dimension 3 sont perpen-
diculaires si et seulement si un de ces plans contient une droite orthogonale à l’autre.
Démonstration : Soient P1 et P2 deux plans de l’espace, ~n1 et ~n2 des vecteurs normaux
à ces plans. Supposons que P1 contienne une droite D orthogonale à P2 . Le vecteur ~n2
est alors un vecteur directeur de D et il est orthogonal à ~n1 , puisque D est incluse dans
P1 .
Réciproquement, si ~n1 et ~n2 sont orthogonaux, pour tout point M de P1 , la droite
passant par M de vecteur directeur ~n2 est orthogonale à P2 et incluse dans P1 .
31
Corollaire 7. Soient P1 et P2 deux plans de l’espace. Si P1 contient une droite ortho-

gonale à P2 , alors P2 contient une droite orthogonale à P1 .
Projection orthogonale, problèmes de distances

Définition 21. Soit E un espace affine euclidien et F un sous-espace affine de E. On
→
−
appelle projection orthogonale sur F la projection sur F dans la direction F ⊥ .
Toute projection orthogonale de E est une application affine dont la partie linéaire
→
−
est un endomorphisme symétrique de E . La distance entre deux points de E est tou-
jours supérieure à la distance entre leurs projetés.
Proposition 43. Soit E un espace affine euclidien et F un sous-espace affine de E.
Alors pour tout point M de E, le projeté orthogonal H de M sur E est l’unique point
de F réalisant la distance de M à F :
M H = min{M N | N ∈ F } = d(M, F ) .
Démonstration : La proposition résulte immédiatement de la relation de Pythagore :

−−→ −−→
M N 2 = M H 2 + HN 2 pour tout point N de F , puisque les vecteurs M H et HN sont
orthogonaux.
Proposition 44. Soit, dans un espace affine euclidien E de dimension n, H un hy-
perplan défini par un point B et un vecteur normal ~n. Alors la distance de M à H est
donnée par
−−→
|~n · BM |
d(M, H) = .
k~nk
Si Eest rapporté à un repère orthonormé et si M a pour coordonnées (x1 , . . . , xn ) et H
comme équation a1 x1 + · · · an xn + b = 0, cette distance est donnée par
|a1 x1 + · · · + an xn + b|
d(M, H) = q .
a21 + · · · + a2n
Démonstration : Soit M 0 le projeté orthogonal de M sur H. La distance de M à H est

égale à M M 0 et
−−→ −−→ −−−→ −−−→
~n · BM = ~n · (BM 0 + M 0 M ) = ~n · M 0 M
−−→ −−−→
puisque les vecteurs ~n et BM 0 sont orthogonaux. Les vecteurs ~n et M M 0 étant coli-
−−−→ −−−→
néaires, on a |~n · M 0 M | = k~nk kM M 0 k, d’où le résultat.
Si H a comme équation a1 x1 + · · · an xn + b = 0 dans un repère orthonormé, le
vecteur ~n de composantes (a1 , . . . , an ) est un vecteur normal de H. Si B de coordonnées
(b1 , . . . , bn ) est un point de H, on a
−−→
~n · BM = a1 (x1 − b1 ) + · · · + an (xn − bn ) = a1 x1 + · · · + an xn + b
32
puisque le point B appartenant à H vérifie a1 b1 + · · · + an bn + b = 0.

On obtient ainsi la distance d’un point à une droite dans le plan et la distance d’un
point à un plan dans l’espace. La distance d’un point à une droite dans l’espace est
donnée par la proposition suivante.
Proposition 45. Soit, dans un espace affine euclidien de dimension 3, D une droite
définie par un point A et un vecteur directeur ~v . La distance d’un point M à D est
donnée par
−−→
k~v ∧ AM k
d(M, D) = .
k~v k
Démonstration : Soit M 0 le projeté orthogonal de M sur H. La distance de M à D est

égale à M M 0 et
−−→ −−→ −−−→ −−−→
~v ∧ AM = ~v ∧ (AM 0 + M 0 M ) = ~v ∧ M 0 M
−−→ −−−→
puisque les vecteurs ~v et AM 0 sont colinéaires. Les vecteurs ~v et M M 0 étant orthogo-
−−−→ −−−→
naux, on a k~v ∧ M 0 M k = k~v k kM M 0 k, d’où le résultat.
Symétrie orthogonale, réflexion, hyperplan médiateur

Définition 22. Soit E un espace affine euclidien et F un sous-espace affine de E.
On appelle symétrie orthogonale par rapport à F la symétrie par rapport à F dans la
→
−
direction F ⊥ .
On appelle réflexion toute symétrie orthogonale par rapport à un hyperplan.
Une réflexion est donc, dans le plan, une symétrie orthogonale par rapport à une
droite et, dans l’espace, une symétrie orthogonale par rapport à un plan.
Proposition 46. L’ensemble des points d’un espace affine euclidien E équidistants de
deux points A et B distincts est l’hyperplan orthogonal à la droite (AB) passant par le
milieu I de [AB]. Cet hyperplan est appelé hyperplan médiateur de [AB] ( médiatrice
si dim(E) = 2, plan médiateur si dim(E) = 3).
Les deux ensembles {M ∈ E | M A > M B} et {M ∈ E | M A < M B} (resp.
{M ∈ E | M A ≥ M B} et {M ∈ E | M A ≤ M B}) sont les deux demi-espaces ouverts
(resp. fermés) délimités par cet hyperplan.
Démonstration : La première partie de la proposition résulte de l’égalité

−−→ −−→ −−→ −−→ −→ −−→
M A2 − M B 2 = (M A − M B) · (M A + M B) = 2 AB · IM .
La seconde partie s’obtient en remplaçant les égalités par des inégalités.

Proposition 47. Soient A et B deux points distincts d’un espace affine euclidien E.
Il existe alors une réflexion et une seule échangeant ces deux points. Son hyperplan est
l’hyperplan médiateur de [AB].
33
Démonstration : Soit s une réflexion d’hyperplan H vérifiant s(A) = B (on a alors

s(B) = A puisque s ◦ s = idE ). Comme s est affine, elle laisse fixe le milieu I de [AB],
qui appartient donc à H. Par ailleurs, H est orthogonal à la droite (AB). C’est donc
l’hyperplan médiateur de [AB].
Réciproquement, si H est l’hyperplan médiateur de [AB], la droite (AB) est ortho-
gonale à H en I et la symétrie orthogonale par rapport à H échange les points A et
B.
Projection sur un convexe fermé, séparation de convexes

Proposition 48. Soit C un convexe fermé non vide d’un espace affine euclidien E.
Pour tout point M de E, il existe un unique point P de C vérifiant M P = d(M, C) =
inf{M Q | Q ∈ C}.
−−→ −→
Ce point P est l’unique point de C vérifiant P M · P Q ≤ 0 pour tout point Q de C.
L’application p qui à M associe P est 1-lipschitzienne : p(M )p(N ) ≤ M N pour
tout couple (M, N ) de points de E.
On l’appelle projection sur le convexe C.
Démonstration : Soit M un point de E et A un point de C. L’intersection de C et

de la boule fermée de centre M et de rayon M A est un convexe compact de E et la
fonction qui à tout point P de E associe la distance M P est continue sur ce compact.
Elle y atteint donc son minimum, qui est aussi le minimum de la distance M P pour P
dans C.
Supposons que ce minimum d soit atteint en deux points distincts P1 et P2 de C.
Le milieu I de [P1 P2 ] appartiendrait à C, puisque C est convexe, et vérifierait
2 d2 = M P12 + M P22 = 2 M I 2 + 2 IP12
par la relation de la médiane, d’où M I < d, ce qui contredit l’hypothèse. Le minimum

est donc atteint en un point et un seul.
34
Pour tout point Q de C, le segment [P Q] est inclus dans C, puisque C est convexe.
On a donc M P 2 ≤ M R2 pour tout point R de ce segment. Mais R appartient au
−→ −→
segment [M Q] si et seulement si il existe un réel t ∈ [0, 1] tel que P R = tP Q. On a
−−→ −→ −−→ −→
donc M P 2 ≤ (M P +tP Q)2 pour tout t ∈ [0, 1], soit encore 0 ≤ 2tM P ·P Q+t2 P Q2 pour
−−→ −→
tout t ∈ [0, 1]. En divisant par t et en faisant tendre t vers 0, on obtient 0 ≤ M P · P Q.
−−→ −−→
Si un point P 0 de C vérifie P 0 M · P 0 Q ≤ 0 pour tout point Q de C, il vérifie en
−−→ −−→ −−→ −−→
particulier P 0 M · P 0 P ≤ 0, soit encore M P 0 · P P 0 ≤ 0. En ajoutant cette inégalité à
−−→ −−→ −−→ −−→
l’inégalité P M · P P 0 ≤ 0, on obtient P P 02 = P P 0 · P P 0 ≤ 0, d’où P 0 = P .
Soient M et N deux points de E, P = p(M ) et Q = p(N ) leurs projetés sur C. On
−−→ −→ −→ −−→
a M P · P Q ≥ 0 et P Q · QN ≥ 0 d’après la propriété précédente. Il en résulte
−−→ −→ −−→
M N 2 = (M P + P Q + QN )2
−−→ −−→ −−→ −→ −→ −−→
= P Q2 + (M P + QN )2 + 2 M P · P Q + 2 P Q · QN
≥ P Q2
d’où P Q ≤ M N .
Remarque : L’application p définie dans cette proposition est une projection au sens
où elle vérifie p ◦ p = p (tout point de C est son propre projeté). Dans le cas où C
est un sous-espace affine de E, la projection p sur le convexe C n’est autre que la
projection orthogonale sur C définie précédemment. C’est le seul cas où p soit affine,
puisque l’image de E par une application affine est un sous-espace affine et que l’image
de p est C.
Corollaire 8. Soit C un convexe fermé non vide d’un espace affine euclidien E. Pour
tout point M de E n’appartenant pas à C, il existe un hyperplan affine H de E séparant
strictement M de C, i.e. tel que M appartienne à l’un des deux demi-espaces ouverts
délimités par H et que C soit contenu dans l’autre.
Démonstration : Soit P le projeté de M sur C, I le milieu du segment [M P ] et H

l’hyperplan médiateur de [M P ]. On a, pour tout point Q de C
−→ −→ −→ −→ −→ −→ −→
IP · IQ = IP · (IP + P Q) = IP 2 + IP · P Q ≥ IP 2 > 0
et
−→ −−→
IP · IM = −IP 2 < 0
ce qui montre que M appartient à un des deux demi-espaces ouverts délimités par H
et que C est inclus dans l’autre.
Corollaire 9. Tout convexe fermé d’un espace affine euclidien est l’intersection des
demi-espaces ouverts qui le contiennent.
35
Démonstration : Tout convexe fermé C est clairement inclus dans l’intersection des
demi-espaces ouverts qui le contiennent. Si un point M n’appartient pas à C, il existe
un demi-espace ouvert contenant C et pas M .
On démontrerait de même, en considérant le couple (M, N ) de points minimisant
la distance d’un point de C1 à un point de C2 et l’hyperplan médiateur de [M N ], le
corollaire suivant :
Corollaire 10. Soient C1 et C2 deux convexes compacts disjoints d’un espace affine
euclidien E. Il existe un hyperplan H de E qui sépare strictement C1 de C2 , i.e. tel
que C1 soit inclus dans l’un des deux demi-espaces ouverts délimités par H et C2 dans
l’autre.
Remarque : Ces corollaires ne font pas appel à la structure euclidienne de l’espace.

Tout espace affine de dimension finie pouvant être muni d’une structure euclidienne,
ils sont vrais pour tout espace affine réel.
Sphères
Définition 23. Soit E un espace affine euclidien, Ω un point de E et R un réel positif.

On appelle sphère de centre Ω et de rayon R l’ensemble
S(Ω, R) = {M ∈ E | ΩM = R}
des points de E dont la distance à Ω est égale à R et boule fermée (resp. boule ouverte)
de centre Ω et de rayon R l’ensemble des points de E dont la distance à Ω est inférieure
(resp. strictement inférieure) à R.
Proposition 49. Soit E un espace affine euclidien de dimension n rapporté à un repère

orthonormé . La sphère de centre Ω de coordonnées (a1 , . . . , an ) et de rayon R a pour
équation cartésienne
(x1 − a1 )2 + · · · + (xn − an )2 = R2
soit encore
x21 + · · · + x2n − 2 a1 x1 − · · · − 2 an xn + d = 0
en posant d = a21 + · · · + a2n − R2 .
Réciproquement, une équation de cette forme est celle d’une sphère si a21 + · · · + a2n −
d ≥ 0. Si a21 +· · ·+a2n −d = 0, cette sphère est réduite à un point. Si a21 +· · ·+a2n −d < 0,
l’ensemble des points la vérifiant est vide.
Définition 24. Deux points A et A0 d’une sphère S de centre Ω sont dits diamétrale-
ment opposés sur S s’ils sont symétriques par rapport à Ω. On dit alors que [AA0 ] est
un diamètre de la sphère S.
Proposition 50. Un point M appartient à la sphère de diamètre [AA0 ] si et seulement

−−→ −−→
si M A · M A0 = 0.
36
Démonstration : Soit Ω le centre de la sphère, i.e. le milieu de [AA0 ], et R son rayon.

Alors
−−→ −−→0 −−→ −→ −−→ −−→ −−→ −→ −−→ −→
M A · M A = (M Ω + ΩA) · (M Ω + ΩA0 ) = (M Ω + ΩA) · (M Ω − ΩA) = M Ω2 − R2 .
La proposition en découle.
Proposition 51. L’intersection d’une sphère de centre Ω et de rayon R avec un hy-
perplan H est :
0
q de l’hyperplan H de centre le projeté orthogonal Ω de Ω sur H et de
– la sphère
rayon R2 − d(Ω, H)2 si la distance d(Ω, H) de Ω à l’hyperplan H est strictement
inférieure à R :
– réduite au point Ω0 si d(Ω, H) = R ;
– vide si d(Ω, H) > R.
Démonstration : Pour tout point M de H, on a ΩM 2 = ΩΩ02 + Ω0 M 2 (relation de

−−→ −−→
Pythagore) puisque les vecteurs ΩΩ0 et Ω0 M sont orthogonaux, et ΩΩ0 = d(Ω, H).
Dans le plan, l’intersection d’une droite et d’un cercle est donc constituée de 2, 1
ou 0 points. Dans l’espace de dimension 3, l’intersection d’une sphère et d’un plan est
soit un cercle, soit un point, soit vide.
Définition 25. Un hyperplan H est dit tangent à une sphère S au point M si S ∩ H =
{M }.
Corollaire 11. Par tout point M d’une sphère S de centre Ω, il passe un et un seul
hyperplan tangent à cette sphère, qui est l’hyperplan orthogonal en M à la droite (ΩM ).
Démonstration : La distance de Ω à un hyperplan H passant par M est strictement

inférieure au rayon de S, sauf si H est orthogonal à (ΩM ), auquel cas elle lui est égale.

Les deux propositions suivantes sont énoncées pour un espace affine euclidien de
dimension 3, mais elles se généralisent immédiatement en dimension quelconque.
Proposition 52. Intersection de deux sphères
L’intersection de deux sphères de centres respectifs Ω et Ω0 distincts et de rayons
respectifs R et R0 est :
– un cercle d’axe la droite (ΩΩ0 ) si |R − R0 | ≤ ΩΩ0 ≤ R + R0 , ce cercle étant réduit
à un point si ΩΩ0 = |R − R0 | ou ΩΩ0 = R + R0 ;
– vide si ΩΩ0 > R + R0 ou ΩΩ0 < |R − R0 |.
Démonstration : On commence par remarquer que l’intersection des deux sphères

d’équations x21 + · · · + x2n − 2 a1 x1 − · · · − 2 an xn + d = 0 et x21 + · · · + x2n − 2 a01 x1 −
· · · − 2 a0n xn + d0 = 0 est aussi celle de l’une de ces sphères et de l’hyperplan d’équation
2 (a1 − a01 )x1 + · · · + 2 (an − a0n )xn + d − d0 = 0 orthogonal à la droite (ΩΩ0 ).
La proposition suivante découle de la précédente et de l’inégalité triangulaire.
37
Proposition 53. Positions relatives de deux sphères

Soient S et S 0 deux sphères de centres distincts Ω et Ω0 et de rayons respectifs R et
R0 et d = ΩΩ0 la distance entre leurs centres. La position relative des deux sphères est
alors donnée par l’un des cinq cas suivants :
– si d < |R−R0 |, l’intersection de S et S 0 est vide et l’une des sphères est intérieure
à l’autre ;
– si d = |R − R0 |, alors les deux sphères ont un unique point commun et les plans
tangents aux deux sphères en ce point sont confondus ; de plus l’une des sphères
est intérieure à l’autre ; elles sont dites tangentes intérieurement ;
– si |R − R0 | < d < R + R0 , alors les deux sphères se coupent selon un cercle ;
– si d = R + R0 , alors les deux sphères ont un unique point commun et les plans
tangents aux deux sphères en ce point sont confondus ; de plus chacune des sphères
est extérieure à l’autre ; elles sont dites tangentes extérieurement ;
– si d > R + R0 , l’intersection de S et S 0 est vide et chacune des sphères est
extérieure à l’autre.
1.2.2 Isométries, similitudes
Généralités
Définition 26. Soient E et F deux espaces affines euclidiens. On appelle isométrie
de E dans F toute application f de E dans F qui conserve la distance, i.e. qui vérifie
f (A)f (B) = AB pour tout couple (A, B) de points de E.
Une isométrie est clairement injective, puisque f (A) = f (B) implique AB =
f (A)f (B) = 0 et donc A = B. Elle est bijective si E et F ont même dimension,
en particulier si E = F , ce qui sera presque toujours ici le cas, mais cela ne se voit pas
immédiatement sur la définition. Cela résultera en fait de la proposition fondamentale
suivante :
Proposition 54. Toute isométrie est une application affine.
→
− →
−
Démonstration : Soit O un point de E et f~O l’application de E dans F définie par
−−−−−−→ →
−
f~O (~u) = f (O)f (A) pour tout vecteur ~u de E , où A = O + ~u est l’unique point de E
−→ →
−
tel que ~u = OA. Si ~u et ~v sont deux vecteurs de E et A et B les points de E tels que
−→ −−→
~u = OA, ~v = OB, on a :
−−−−−−→ −−−−−−→
f~O (~u) · f~O (~v ) = f (O)f (A) · f (O)f (B)
1
= f (O)f (A)2 + f (O)f (B)2 − f (A)f (B)2
2
1
= OA2 + OB 2 − AB 2
2
−→ −−→
= OA · OB
= ~u · ~v ,
38
ce qui montre que f~O conserve le produit scalaire et est donc linéaire d’après la propo-
sition 15. Il en résulte que f est affine, de partie linéaire f~O (qui ne dépend pas de O).

Nous nous intéresserons essentiellement ici aux isométries d’un espace affine eucli-
dien E dans lui-même.
Proposition 55. Soient E un espace affine euclidien et f une transformation affine
de E. Alors f est une isométrie si et seulement si sa partie linéaire f~ est une trans-
formation orthogonale.
−−−−−−→ −→
Démonstration : L’égalité f (A)f (B) = f~(AB) montre que f (A)f (B) = AB pour tout
−→ −→
couple (A, B) de points de E si et seulement si kf~(AB)k = kABk pour tout couple
(A, B) de points de E, ou encore si et seulement si kf~(~v )k = k~v k pour tout vecteur ~v
→
−
de E .
Proposition 56. L’ensemble des isométries d’un espace affine euclidien E est un sous-
groupe du groupe GA(E) des transformations affines de E. Ce groupe est noté Is(E)
et appelé groupe des isométries de E.
→
−
Démonstration : Cet ensemble est l’image réciproque du groupe orthogonal O( E ) de
→
− →
−
E par l’homomorphisme de groupes de GA(E) dans GL( E ) qui à toute transformation
affine f de E associe sa partie linéaire f~.
Définition 27. Une isométrie f d’un espace affine euclidien E est dite directe ou
→
−
positive si sa partie linéaire f~ est une transformation orthogonale positive de E :
→
−
f~ ∈ O+ ( E ). On dit aussi que f est un déplacement.
Une isométrie f de E est dite indirecte ou négative si sa partie linéaire f~ est une
→
− →
−
transformation orthogonale négative de E : f~ ∈ O− ( E ). On dit aussi que f est un
antidéplacement.
Les déplacements constituent un sous-groupe Is+ (E) du groupe des isométries de
E. On note Is− (E) l’ensemble des antidéplacements de E (Is− (E) n’est pas un groupe :
le composé de deux antidéplacements est un déplacement).
Décomposition en produit de réflexions
On rappelle que l’ensemble, noté Fix(f ), des points fixes d’une transformation affine
f d’un espace affine E est soit vide, soit un sous-espace affine de E.
Lemme 4. Toute symétrie orthogonale est une isométrie. En particulier, toute ré-
flexion est un antidéplacement.
Démonstration : La première assertion résulte de la proposition 16 . Pour démontrer

la seconde, il suffit de remarquer que la matrice de la partie linéaire de la réflexion
39
d’hyperplan H dans une base orthonormée dont le premier vecteur est orthogonal à H
est diagonale, de diagonale (−1, 1, . . . , 1).
Lemme 5. Soit f une isométrie de E différente de l’identité. Alors il existe une ré-
flexion s telle que dim(Fix(s ◦ f )) > dim(Fix(f )).
(Si f n’a pas de point fixe, il faut comprendre que s ◦ f a au moins un point fixe.)
Démonstration : Soit A un point de E tel que f (A) 6= A et s la réflexion par rapport
à l’hyperplan médiateur H de Af (A). Tout point fixe M de f appartient à H, puisque
M f (A) = f (M )f (A) = M A, et est donc fixe par s ◦ f . Comme A n’appartient pas à
H et est fixe par s ◦ f , Fix(s ◦ f ) est un sous-espace affine de E contenant strictement
Fix(f ).
On en déduit par récurrence sur la dimension du sous-espace des points fixes, que
les réflexions engendrent le groupe des isométries. Plus précisément :
Théorème 3. Toute isométrie f d’un espace affine euclidien E de dimension n peut
se décomposer en produit de k réflexions, avec k ≤ n − p, où p est la dimension du
sous-espace des points fixes de f (p = −1 si f n’a pas de point fixe).
Démonstration : Supposons E fixé et démontrons le théorème par récurrence descen-

dante sur p. Si p = n, Fix(f ) = E et f = id. Soit −1 ≤ p ≤ n − 1 un entier et
f une isométrie telle que dim(Fix(f )) = p. Alors il existe une réflexion s telle que
dim(Fix(s ◦ f )) > dim(Fix(f )). Si la propriété est vraie pour tout entier q vérifiant
p < q ≤ n, g = s ◦ f peut s’écrire comme produit de k réflexions, avec k ≤ n − p − 1 ;
f = s ◦ g s’écrit donc comme produit de k + 1 réflexions et k + 1 ≤ n − p.
Cette décomposition n’est pas unique, mais la parité du nombre k de réflexions y
intervenant l’est, puisque le déterminant de f~ est (−1)k .
Classification des isométries planes
On suppose ici que E est un plan affine euclidien et on se propose de préciser la
nature géométrique des isométries.
Déplacements
Le cas des déplacements est simple : si f est un déplacement du plan, sa partie
linéaire f~ est soit l’identité, auquel cas f est une translation, soit une rotation vectorielle
d’angle non nul θ. Dans ce cas, f possède un point fixe O et un seul, puisque +1
n’est pas valeur propre de f~. On dit que f est la rotation de centre O et d’angle θ.
L’image M 0 = f (M ) d’un point M est caractérisée par les relations OM 0 = OM ,
−−→ −−→
(OM , OM 0 ) = θ (modulo 2π). On a donc démontré :
Proposition 57. Tout déplacement du plan est une translation ou une rotation.
On en déduit que :
40
– le produit de deux rotations planes d’angles θ et θ0 est :

– une rotation d’angle θ + θ0 si θ + θ0 6≡ 0 (mod 2π) ;
– une translation si θ + θ0 ≡ 0 (mod 2π) ;
– le produit d’une translation et d’une rotation d’angle θ est une rotation d’angle
θ.
Ces produits ne sont en général pas commutatifs.
Antidéplacements
Lemme 6. Le produit de deux réflexions d’axes parallèles est une translation de vec-
teur orthogonal aux axes de ces réflexions. Réciproquement, toute translation peut se
décomposer en produit de deux réflexions, l’axe de l’une pouvant être choisi arbitraire-
ment parmi toutes les droites orthogonales au vecteur de la translation et l’axe de la
seconde étant alors uniquement déterminé.
Démonstration : Deux réflexions d’axes parallèles ont même partie linéaire, qui est une
réflexion vectorielle. Leur produit est donc une transformation affine de partie linéaire
l’identité, i.e. une translation. Pour trouver le vecteur de cette translation, il suffit de
connaître l’image d’un point. Soit donc s et s0 deux réflexions d’axes parallèles D et
D0 , ∆ une droite perpendiculaire à D et D0 les coupant respectivement en A et A0 . Le
point A00 = sD0 ◦ sD (A) = sD0 (A) est le symétrique de A par rapport à A0 et vérifie
−−→ −−→ −−→
donc AA00 = 2 AA0 . Il en résulte que sD0 ◦ sD est la translation de vecteur 2 AA0 . La
réciproque est immédiate (on peut choisir l’un des deux points A et A0 arbitrairement,
l’autre est alors uniquement déterminé).
→
−
La partie linéaire f~ d’un antidéplacement f est une réflexion vectorielle. Soit D son
axe.
Si f admet un point fixe A, f est la réflexion vectorielle d’axe la droite D de
→
−
direction D passant par A.
Sinon, il existe un vecteur ~u tel que t−~u ◦ f admette un point fixe et soit donc une
→
−
réflexion sD d’axe D. On décompose le vecteur ~u sous la forme ~u = ~v + w, ~ où ~v ∈ D
→
−
et w~ est orthogonal à D . On a alors f = t~u ◦ sD = t~v ◦ tw~ ◦ sD . On peut alors (lemme
6) décomposer tw~ sous la forme tw~ = sD0 ◦ sD , où D0 est une droite parallèle à D. Il en
−
→
résulte f = t~v ◦ sD0 où ~v ∈ D0 .
41
Définition 28. Soit D une droite et ~v un vecteur non nul appartenant à la direction
de D. On appelle symétrie glissée d’axe D et de vecteur ~v le produit de la réflexion
d’axe D et de la translation de vecteur ~v .
Ce produit est commutatif : sD ◦ t~v = t~v ◦ sD . Une symétrie glissée n’admet pas de
point fixe. L’axe et le vecteur d’une symétrie glissée f sont entièrement déterminés :
en effet l’axe peut être caractérisé comme :
– l’ensemble des milieux des segments [M f (M )] ;
– l’ensemble des points M du plan tels que la distance M f (M ) soit minimale ;
−−−−−→
– l’ensemble des points M du plan tels que le vecteur M f (M ) appartienne à l’axe
de f~.
On a donc démontré :
Proposition 58. Tout antidéplacement du plan est une réflexion ou une symétrie
glissée.
Invariants dépl/antidépl nature géométrique

plan déplacement identité
droite antidéplacement réflexion
point déplacement rotation
∅ déplacement translation
∅ antidéplacement symétrie glissée
Classification des isométries planes
Classification des isométries de l’espace

Déplacements
Soit f un déplacement de l’espace affine euclidien E de dimension 3. Sa partie
linéaire f~ est soit l’identité, soit une rotation vectorielle. Si f~ est l’identité, f est
→
−
une translation. Si f~ est une rotation vectorielle d’axe D et d’angle θ, deux cas se
présentent :
– soit f a un point fixe A : dans ce cas f est une rotation d’axe D et d’angle θ,
→
−
où D est la droite affine de direction D passant par A (f laisse globalement invariant
42
tout plan P orthogonal à D et sa restriction à un tel plan est une rotation de centre le
point d’intersection de P et de D et d’angle θ) ;
– soit f n’a pas de point fixe ; il existe alors un vecteur ~u tel que t−~u ◦ f admette
un point fixe et soit donc une rotation r d’axe D ; on décompose le vecteur ~u sous la
→
− →
−
~ où ~v ∈ D et w
forme ~u = ~v + w, ~ est orthogonal à D ; on a alors f = t~u ◦ r = t~v ◦ tw~ ◦ r ;
mais tw~ ◦ r laisse globalement invariant tout plan orthogonal à D et sa restriction à un
tel plan est une rotation plane d’angle θ (composée d’une translation et d’une rotation
plane) ; soit D0 la droite parallèle à D passant par le centre d’une de ces rotations ; tw~ ◦r
est alors la rotation de E d’axe D0 et d’angle θ ; il en résulte que f est produit d’une
rotation et d’une translation de vecteur un vecteur directeur de l’axe de la rotation ;
ce produit est commutatif.
Définition 29. Soit D une droite orientée, θ un réel 6≡ 0 (mod 2π) et ~v un vecteur
non nul appartenant à la direction de D. On appelle vissage d’axe D, d’angle θ et de
vecteur ~v le produit commutatif de la rotation d’axe D et d’angle θ et de la translation
de vecteur ~v .
On vérifie que cette décomposition est unique. L’axe D peut être caractérisé comme :
– l’ensemble des points M de l’espace tels que la distance M f (M ) soit minimale ;
−−−−−→
– l’ensemble des points M de l’espace tels que le vecteur M f (M ) appartienne à
l’axe de la rotation vectorielle f~.
Définition 30. On appelle demi-tour ou retournement toute rotation de l’espace d’angle

plat.
Un demi-tour est donc simplement une symétrie orthogonale par rapport à une
droite. Les retournements sont les seuls déplacements involutifs. Leur importance vient
en particulier du fait qu’ils engendrent le groupe des déplacements, comme le montre
la proposition suivante.
Proposition 59. 1) Le produit de deux retournements s et s0 d’axes distincts D et D0

est :
– une translation de vecteur orthogonal à D et D0 si D et D0 sont parallèles ;
– une rotation d’axe la perpendiculaire commune à D et D0 si D et D0 sont sécants ;
– un vissage d’axe la perpendiculaire commune à D et D0 si D et D0 ne sont pas
coplanaires.
2) Réciproquement, tout déplacement de l’espace peut s’écrire comme produit de deux
retournements.
Antidéplacements
La partie linéaire f~ d’un antidéplacement f est soit une réflexion vectorielle, soit une
antirotation vectorielle (isométrie vectorielle gauche). Si f~ est une réflexion vectorielle,
on montre comme dans le cas des antidéplacements du plan que f est soit une réflexion,
43
Figure 1 – Vissage et antirotation
soit une symétrie glissée (produit commutatif d’une réflexion et d’une translation de
vecteur appartenant à la direction du plan de la réflexion). Si f~ est une antirotation, 1
n’est pas valeur propre de f~ ; il en résulte que f admet un point fixe et un seul ; f est
donc encore une antirotation (produit commutatif d’une rotation et d’une réflexion de
plan orthogonal à l’axe de la rotation).
Invariants dépl/antidépl nature géométrique

espace déplacement identité
plan antidéplacement réflexion
droite déplacement rotation
point antidéplacement antirotation
∅ déplacement vissage ou translation
∅ antidéplacement symétrie glissée
Classification des isométries de l’espace
Groupe d’isométries conservant une figure
Proposition 60. Soit E un espace affine euclidien et A une partie non vide de E.
L’ensemble G des isométries f de E qui conservent A (i.e. qui vérifient f (A) = A) est
un sous-groupe du groupe Is(E) des isométries de E. L’ensemble G+ des déplacements
de E qui conservent A est un sous-groupe de G. L’ensemble G− des antidéplacements
de E qui conservent A est, soit vide, soit en bijection avec G+ . En particulier, si G+
est fini et G− non vide, G+ et G− ont le même nombre d’éléments.
44
Démonstration : L’ensemble G contient l’identité, est stable par composition et par

passage à l’inverse ; c’est donc un sous-groupe du groupe Is(E). L’ensemble G+ est
l’intersection des sous-groupes G et Is+ (E) de Is(E) ; c’est donc un sous-groupe de G.
Si G− n’est pas vide, pour tout s ∈ G− , l’application f 7−→ s ◦ f est une bijection de
G+ sur G− de bijection réciproque f 7−→ s−1 ◦ f .
Remarque : L’ensemble des isométries f de E qui vérifient f (A) ⊂ A est stable par
composition, mais n’est pas nécessairement un sous-groupe de Is(E) (si A est une
demi-droite de vecteur directeur ~u, la translation de vecteur ~u conserve A, mais pas
celle de vecteur −~u). C’est toutefois le cas si A est fini, puisque dans ce cas f (A) = A
pour toute isométrie f vérifiant f (A) ⊂ A, ou si A est un sous-espace affine, puisque
dans ce cas f (A) est un sous-espace affine inclus dans A et de même dimension que A,
donc égal à A.
Proposition 61. Soit E un espace affine euclidien et A une partie finie non vide de
E. Toute isométrie de E qui conserve A laisse fixe l’isobarycentre de A. Il en résulte
que le groupe G de ces isométries est isomorphe à un sous-groupe du groupe orthogonal
→
− →
−
O( E ) de E .
Démonstration : Une isométrie est une application affine et toute application affine
conserve les barycentres. Il en résulte que l’isobarycentre O de A est fixe par toute
isométrie conservant A. L’application f 7→ f~ est un isomorphisme du groupe des iso-
→
−
métries de E laissant O fixe sur le groupe orthogonal de E ; G est donc isomorphe à
→
−
son image par cet homomorphisme, qui est un sous-groupe de O( E ).
Exemple : le groupe diédral Dn

C’est le groupe des isométries planes conservant un polygone régulier convexe
A0 A1 . . . An−1 à n côtés. Son sous-groupe des déplacements Dn+ est le groupe cyclique
d’ordre n constitué des n rotations de centre le centre O du polygone et d’angle 2kπ/n
(k = 0, . . . , n − 1). Les éléments de Dn− sont les n réflexions d’axes les droites OAk
(k = 0, . . . , n − 1) et les médiatrices des côtés du polygone (ces deux familles étant
confondues si n est impair et ayant chacune n/2 éléments si n est pair).
Remarque : Une isométrie qui conserve globalement l’ensemble des sommets d’un
polygone régulier conserve ce polygone (et réciproquement). Il ne faut pas croire que
cette propriété s’étend à tout polygone, comme en témoigne la figure ci-dessous : les
rotations de centre O et d’angle ±2π/3 conservent les sommets du polygone OABC
mais pas ce polygone.
45
B C
Similitudes
Définition 31. On appelle similitude d’un espace affine euclidien E toute application
f de E dans E telle qu’il existe un réel k > 0 tel qu’on ait f (A)f (B) = kAB pour tout
couple (A, B) de points de E. Le nombre k est appelé rapport de la similitude.
Une application f de E dans E est donc une similitude si et seulement si elle

conserve les rapports de distances.
Une similitude de rapport 1 est une isométrie. Une homothétie de rapport λ est une
similitude de rapport |λ|.
Proposition 62. Toute similitude est une transformation affine. L’ensemble des simi-
litudes d’un espace affine euclidien E constitue un sous-groupe du groupe GA(E) des
transformations affines de E. Les homothéties et les isométries engendrent ce sous-
groupe : plus précisément, si f est une similitude de rapport k et h une homothétie de
rapport k (et de centre quelconque), f ◦ h−1 est une isométrie.
Démonstration : Soit f une similitude de rapport k > 0 et h une homothétie de

rapport k (et de centre quelconque). Alors h est une transformation affine de E d’inverse
l’homothétie h−1 de même centre et de rapport 1/k et g = f ◦ h−1 est une isométrie,
puisque
1
g(A)g(B) = k h−1 (A)h−1 (B) = k AB = AB
k
pour tout couple (A, B) de points de E. Il en résulte que g est une transformation affine
de E, ainsi que f = g ◦ h. Toute similitude de rapport k s’écrit donc comme produit
d’une isométrie et d’une homothétie de rapport k. Il découle immédiatement de la
définition que le composé de deux similitudes de rapports k et k 0 est une similitude de
rapport kk 0 et que l’inverse d’une similitude de rapport k est une similitude de rapport
1/k.
Définition 32. Une similitude f est dite directe si detf~ > 0, indirecte si detf~ < 0.
Deux figures sont dites semblables (resp. directement semblables) s’il existe une
similitude (resp. une similitude directe) transformant la première en la seconde.
46
Proposition 63. Toute similitude qui n’est pas une isométrie admet un point fixe et
un seul.
Démonstration : Soit f une similitude de rapport k différent de 1. Il suffit de montrer

que 1 n’est pas valeur propre de f~ (voir le chapitre « Géométrie affine »). Mais si ~v est
→
−
un vecteur de E , l’égalité f~(~v ) = ~v implique kf~(~v )k = k k~v k = k~v k, d’où k~v k = 0 et
~v = ~0.
Similitudes planes
Proposition 64. Toute similitude directe d’un plan affine euclidien qui n’est pas une
isométrie est le produit commutatif d’une homothétie de rapport positif et d’une rotation
de même centre. Cette décomposition est unique.
Une similitude directe qui n’est pas une isométrie est donc caractérisée par son
centre (son seul point fixe), son rapport et son angle (l’angle de la rotation de la
décomposition précédente).
Démonstration : Soit f une similitude plane directe de rapport k > 0 différent de 1.
D’après la proposition 63, f admet un point fixe O et un seul. Soit h l’homothétie de
centre O et de rapport k. La transformation affine g = f ◦ h−1 est une isométrie directe
laissant fixe le point O, i.e. une rotation de centre O, et on a f = g ◦ h. Comme une
homothétie de centre O commute avec toute transformation affine laissant O fixe, on
a f = g ◦ h = h ◦ g.
Si f = g 0 ◦ h0 est une décomposition de f en produit (nécessairement commutatif)
d’une homothétie de rapport k 0 > 0 et d’une rotation de même centre O0 , on a k = k 0
et O = O0 , puisque O est le seul point fixe de f , d’où h = h0 et g = g 0 , ce qui établit
l’unicité de la décomposition.
Proposition 65. Toute similitude indirecte d’un plan affine euclidien qui n’est pas
une isométrie est le produit commutatif d’une homothétie de rapport positif et d’une
réflexion dont l’axe passe par le centre de l’homothétie. Cette décomposition est unique.
Une similitude indirecte qui n’est pas une isométrie est donc caractérisée par son
centre (l’unique point fixe), son rapport et son axe (l’axe de la réflexion de la décom-
position précédente), qui est une droite passant par le centre.
Démonstration : Soit f une similitude plane indirecte de rapport k > 0 différent de
1. D’après la proposition 63, f admet un point fixe O et un seul. Soit h l’homothétie
de centre O et de rapport k. La transformation affine g = f ◦ h−1 est une isométrie
indirecte laissant fixe le point O, i.e. une réflexion d’axe passant par O, et on a f = g◦h.
Comme une homothétie de centre O commute avec toute transformation affine laissant
O fixe, on a f = g ◦ h = h ◦ g.
Si f = g 0 ◦ h0 est une décomposition de f en produit (nécessairement commutatif)
d’une homothétie de centre O0 et de rapport k 0 > 0 et d’une réflexion d’axe passant
47
par O0 , on a k = k 0 et O = O0 , puisque O est le seul point fixe de f , d’où h = h0 et

g = g 0 , ce qui établit l’unicité de la décomposition.
Similitudes planes et nombres complexes

Le corps C des nombres complexes est un espace vectoriel de dimension 2 sur R.
Il est donc muni d’une structure naturelle de plan affine. La base canonique (1, i) de
C et l’origine 0 constituent un repère cartésien naturel pour ce plan. On appellera ce
plan plan complexe. Réciproquement, le choix d’un repère cartésien (O,~i, ~j) permet
d’identifier tout plan affine E à R2 , ou encore à C : au point M de coordonnées
(x, y) on associe le nombre complexe z = x + iy, qu’on appelle affixe de M . On peut
également définir l’affixe d’un vecteur : l’application qui au vecteur ~u = x~i + y~j de
→
−
E associe le nombre complexe x + iy est un isomorphisme d’espaces vectoriels, qui
→
−
permet d’identifier E à C. Cela permet de ramener certains problèmes géométriques à
des problèmes d’algèbre.
Mais l’intérêt du plan complexe en géométrie vient surtout de ce√ qu’il possède aussi
une structure euclidienne naturelle. En effet l’application z 7→ |z| = z z̄ est une norme
euclidienne sur C déduite du produit scalaire
z1 z̄2 + z2 z̄1
hz1 , z2 i = Re(z1 z̄2 ) = Re(z2 z̄1 ) =
2
et la base canonique (1, i) de C est orthonormée pour cette structure euclidienne.
La distance de deux points A et B, d’affixes respectives a et b, est alors d(A, B) =
|b −a|. L’angle (~u1 , ~u2 ) de deux vecteurs non nuls d’affixes respectives z1 et z2 est
z2 z2
Arg . En particulier, ces deux vecteurs sont colinéaires si et seulement si est
z1 z1
z2
réel, et orthogonaux si et seulement si est imaginaire pur.
z1
Proposition 66. Pour tout couple (a, b) ∈ C∗ × C, l’application fa,b de C dans C
définie par fa,b (z) = az + b est une similitude directe de rapport |a|. Réciproquement,
pour toute similitude directe f du plan complexe, il existe un couple (a, b) ∈ C∗ × C et
un seul tel que f = fa,b .
Proposition 67. Pour tout couple (a, b) ∈ C∗ × C, l’application ga,b de C dans C

définie par ga,b (z) = az̄ + b est une similitude indirecte de rapport |a|. Réciproquement,
pour toute similitude indirecte g du plan complexe, il existe un couple (a, b) ∈ C∗ × C
et un seul tel que g = ga,b .
1.2.3 Géométrie du triangle et du cercle

Dans toute cette partie, triangle signifie triangle non aplati (sauf mention explicite
du contraire). On note BC = a, CA = b, AB = c les longueurs des côtés d’un triangle
ABC et Â, B̂, Ĉ les (mesures des) angles géométriques du triangle.
48
Un triangle ABC est dit rectangle en A si l’angle Â est droit ; le côté BC est alors
appelé hypoténuse.
Il est dit acutangle si ses trois angles sont aigus, isocèle en A si les côtés AB et AC
ont même longueur, équilatéral si ses trois côtés ont même longueur.
Proposition 68. Formule d’Al Kashi
Dans tout triangle ABC, on a :
a2 = b2 + c2 − 2bc cos Â .
En particulier, un triangle ABC est rectangle en A si et seulement si a2 = b2 + c2

(théorème de Pythagore).
Démonstration : Par la relation de Chasles :

−−→ −→ −→
a2 = BC 2 = (AC − AB)2 = AC 2 + AB 2 − 2AC × AB × cos Â = b2 + c2 − 2bc cos Â .

Proposition 69. Pour tout triangle ABC, la somme des angles orientés de vecteurs
−→
\ −→ −−→
\ −→ −→
\ −−→
(AB, AC) + (BC, BA) + (CA, CB) est égale à l’angle plat. Les mesures principales de
ces trois angles (comprises entre −π et +π) ont même signe et la somme des mesures
des angles géométriques du triangle est égale à π.
−→
\ −→ −−→
\ −→ −→\ −−→
Démonstration : L’égalité (AB, AC) + (BC, BA) + (CA, CB) = π (où on a identifié
l’angle plat et sa mesure π) découle de la relation de Chasles pour les angles orientés
−−→
\ −→ −−→
\ −→ −→\ −−→ −→
\ −−→
et des relations (BC, BA) = (BC, AB) + π et (CA, CB) = (AC, BC).
−−→ −→ −→ −→ −→ −→ −→ −→ −−→
Les égalités det(BC, BA) = det(AC−AB, −AB) = det(AB, AC) et det(CA, CB) =
−→ −→
det(AB, AC) montrent que les sinus de ces trois angles orientés ont le même signe. Il
en résulte que la somme des mesures des angles géométriques Â, B̂, Ĉ du triangle est
égale à π.
1 −→ −→ 1 −−→ −→ 1 −→ −−→
Le réel det(AB, AC) = det(BC, BA) = det(CA, CB) est l’aire algébrique du
2 2 2
triangle orienté ABC. Sa valeur absolue est l’aire géométrique de ce triangle et s’écrit
1 1 1
aussi AB × AC × sin(Â) = BC × BA × sin(B̂) = CA × CB × sin(Ĉ).
2 2 2
Elle est aussi égale au demi-produit de la longueur d’un des côtés par la longueur de
la hauteur correspondante (distance de la droite portant ce côté au sommet opposé).
Médiatrices, cercle circonscrit
Proposition 70. Les trois médiatrices d’un triangle sont concourantes. Leur point de
concours est l’unique point du plan équidistant des trois sommets. C’est aussi le centre
de l’unique cercle du plan passant par ces trois sommets. Ce cercle est appelé cercle
circonscrit au triangle.
49
Démonstration : Les médiatrices de deux côtés sont sécantes, sinon ces côtés seraient
parallèles et le triangle aplati. Leur point d’intersection est équidistant des trois som-
mets du triangle et appartient donc à la troisième médiatrice.
Hauteurs, orthocentre
Définition 33. On appelle hauteurs d’un triangle les droites perpendiculaires aux côtés
passant par le sommet opposé.
Proposition 71. Les trois hauteurs d’un triangle sont concourantes en un point appelé
orthocentre du triangle.
Démonstration : Les parallèles aux côtés menées par les sommets opposés déterminent
un triangle A0 B 0 C 0 . Les hauteurs du triangle initial ABC sont les médiatrices du tri-
angle A0 B 0 C 0 : elles sont donc concourantes.
50
Bissectrices, cercles inscrit et exinscrits
Définition 34. On appelle bissectrice intérieure en A d’un triangle ABC la bissec-

trice du couple de demi-droites [AB) et [AC). L’autre bissectrice de l’angle de droites
\
(AB, AC) est appelée bissectrice extérieure en A du triangle ABC.
La proposition suivante justifie cette terminologie :
Proposition 72. La bissectrice intérieure en A d’un triangle ABC coupe le côté [BC]
en un point A1 (appelé pied de cette bissectrice) qui est le barycentre du système pon-
déré [(B, b), (C, c)]. La bissectrice extérieure en A est perpendiculaire à la bissectrice
intérieure. Elle ne rencontre pas l’intérieur du triangle et coupe, si le triangle n’est
pas isocèle en A, la droite (BC) en un point A01 qui est le barycentre du système pon-
déré [(B, b), (C, −c)]. Les points A1 et A01 sont donc les deux points de la droite (BC)
vérifiant :
A1 B A0 B AB
= 10 = .
A1 C A1 C AC
b c
Démonstration : Soit A1 = B+ C le barycentre du système pondéré [(B, b),
b+c b+c
(C, c)]. Le point A1 appartient au segment [BC] et les aires algébriques S1 et S2 des
triangles ABA1 et AA1 C vérifient
−→ −−→ −→\ −−→
2S1 = det(AB, AA1 ) = AB × AA1 × sin((AB, AA1 ))
−−→ −→ −−\
→ −→
2S2 = det(AA1 , AC) = AC × AA1 × sin((AA1 , AC)) .
−−→ b −→ c −→
Mais il ressort de l’égalité AA1 = AB + AC que
b+c b+c
c −→ −→ b −→ −→
2S1 = det(AB, AC), 2S2 = det(AB, AC) ,
b+c b+c
−→\ −−→ −−\
→ −→ −→\ −−→ −−\→ −→
d’où sin((AB, AA1 )) = sin((AA1 , AC)) et (AB, AA1 ) = (AA1 , AC) (on ne peut avoir
−→\ −−→ −−\
→ −→
(AB, AA1 ) + (AA1 , AC) = π sinon le triangle serait aplati). Le point A1 appartient
donc à la bissectrice intérieure en A du triangle ABC.
La démonstration est analogue pour le point A01 .
Proposition 73. Les bissectrices intérieures d’un triangle ABC sont concourantes en
un point de coordonnées barycentriques (a, b, c) dans le repère affine (A, B, C). Ce point
est centre d’un cercle tangent aux trois côtés du triangle, appelé cercle inscrit dans le
triangle ABC. Chaque bissectrice intérieure rencontre les bissectrices extérieures en les
deux autres sommets en un point qui est également centre d’un cercle tangent aux trois
côtés du triangle. Ces trois cercles sont appelés cercles exinscrits.
51
Il y a donc exactement quatre points équidistants des trois côtés d’un triangle ;
chacun de ces points est intersection de trois bissectrices et centre d’un cercle tangent
aux trois côtés.
a b
Démonstration : Il suffit de vérifier que le point I = A+ B+
a+b+c a+b+c
c
C appartient aux trois bissectrices intérieures du triangle. Ce point est in-
a+b+c
térieur au triangle. Les points de coordonnées barycentriques respectives (−a, b, c),
(a, −b, c), (a, b, −c) sont extérieurs au triangle et appartiennent tous à deux bissectrices
extérieures et une bissectrice intérieure. Ils sont ainsi équidistants des trois droites por-
tant les côtés du triangle.
Cercles
Définition 35. Soit E un plan affine euclidien, O un point de E et R un réel positif.

On appelle cercle de centre O et de rayon R l’ensemble des points M de E vérifiant
OM = R.
Si OM > R (resp. OM < R), on dit que M est extérieur (resp. intérieur) au cercle.
Représentation paramétrique, équation
Dans le plan rapporté à un repère orthonormé (O,~i, ~j), le cercle de centre Ω(a, b)
et de rayon R admet la représentation paramétrique :
(
x = a + R cos t
(t ∈ [0, 2π[)
y = b + R sin t
Son équation cartésienne s’écrit (x − a)2 + (y − b)2 = R2 , et est donc de la forme

x2 + y 2 − 2ax − 2by + c = 0, où c = a2 + b2 − R2 . Réciproquement, une équation de
52
cette forme est celle d’un cercle si a2 + b2 − c ≥ 0 (si a2 + b2 − c = 0, ce cercle est réduit
à un point ; si a2 + b2 − c < 0, l’ensemble des points la vérifiant est vide).
Intersection d’une droite et d’un cercle, tangentes
Proposition 74. Soit, dans le plan affine euclidien, D une droite et C un cercle de
centre O et de rayon R. L’intersection de D et de C est :
– constituée de deux points si d(O, D) < R ;
– réduite à un point si d(O, D) = R ;
– vide si d(O, D) > R.
Si d(O, D) = R, l’unique point d’intersection de D et de C est le projeté orthogonal

H de O sur D. On dit alors que D est tangente à C en H. La tangente à un cercle
de centre O en un point M de ce cercle est donc la perpendiculaire menée par M au
rayon OM .
Cette définition de la tangente, particulière au cercle, coïncide avec la définition
usuelle de la tangente à une courbe paramétrée comme position limite d’une sécante,
comme on le vérifie immédiatement en partant de la représentation paramétrique.
Positions relatives de deux cercles
Proposition 75. Soient C et C 0 deux cercles distincts du plan affine euclidien, de

centres respectifs O et O0 et de rayons R et R0 . On note d = OO0 la distance de leurs
centres. Alors cinq cas sont possibles :
– si d < |R − R0 |, les deux cercles sont disjoints et l’un est intérieur à l’autre ;
– si d = |R − R0 |, les cercles sont tangents intérieurement (leur intersection est
réduite à un point, ils ont même tangente en ce point, et l’un est intérieur à
l’autre, à l’exception de ce point) ;
– si |R − R0 | < d < R + R0 , ils sont sécants (leur intersection est constituée de deux
points, symétriques par rapport à la droite des centres) ;
– si d = R + R0 , ils sont tangents extérieurement (leur intersection est réduite à un
point, ils ont même tangente en ce point, et chacun d’eux est extérieur à l’autre,
à l’exception de ce point) ;
– si d > R + R0 , ils sont disjoints et chacun d’eux est extérieur à l’autre.
Puissance d’un point par rapport à un cercle
Proposition 76. Soit C un cercle de centre O et de rayon R, M un point du plan et D

une droite passant par M et coupant C en deux points A et B. Alors le produit scalaire
−−→ −−→
M A · M B est égal à M O2 − R2 et ne dépend donc pas de la droite D. Ce nombre est
appelé puissance de M par rapport au cercle C et noté pC (M ).
53
Démonstration : Soit A0 le point diamétralement opposé à A sur le cercle C. On a :

−−→ −−→ −−→ −−→ −−→0 −−→ −−→ −−→ −→ −−→ −→
M A · M B = M A · (M B + BA ) = M A · M A0 = (M O + OA) · (M O − OA) = M O2 − R2 .

Ce nombre permet de situer le point M par rapport au cercle. Plus précisément :
– M est extérieur au cercle si et seulement si pC (M ) > 0 ;
– M appartient au cercle si et seulement si pC (M ) = 0 ;
– M est intérieur au cercle si et seulement si pC (M ) < 0.
En particulier, si le point M est extérieur au cercle, on a pC (M ) = M T 2 = M T 02 , où
T et T 0 sont les points de contact des deux tangentes menées par M au cercle C.
Expression analytique. Le plan étant rapporté à un repère orthonormé, la puissance
du point M (x, y) par rapport au cercle C d’équation x2 + y 2 − 2ax − 2by + c = 0 est
pC (M ) = x2 + y 2 − 2ax − 2by + c.
Axe radical de deux cercles
Proposition 77. Soient C et C 0 deux cercles distincts du plan affine euclidien. L’en-
semble des points du plan ayant même puissance par rapport à C et C 0 est :
– vide si C et C 0 sont concentriques ;
– une droite perpendiculaire à la droite des centres si leurs centres sont distincts.
Cette droite est alors appelée axe radical des deux cercles.
Dans le cas où les cercles sont sécants, leur axe radical est la droite passant par
les deux points d’intersection de ces cercles. Dans le cas où ils sont tangents, leur axe
radical est leur tangente commune.
Faisceaux linéaires de cercles
Définition 36. Soient C1 et C2 deux cercles non concentriques du plan affine euclidien.
On appelle faisceau de cercles engendré par C1 et C2 l’ensemble des cercles C du plan
tels que l’axe radical de C et C1 soit égal à l’axe radical de C1 et C2 .
54
Proposition 78. Soient C1 et C2 deux cercles non concentriques du plan affine eucli-
dien rapporté à un repère orthonormé, d’équations respectives f1 (x, y) = 0 et f2 (x, y) =
0. Le faisceau de cercles engendré par C1 et C2 est l’ensemble des cercles du plan d’équa-
tion αf1 (x, y) + (1 − α)f2 (x, y) = 0, pour α ∈ R.
On a supposé ici les équations normalisées (les coefficients de x2 et y 2 égaux à
1). L’équation f1 (x, y) − f2 (x, y) = 0 est alors l’équation de l’axe radical de deux
quelconques des cercles du faisceau.
Théorème de l’angle inscrit, cocyclicité
Proposition 79. (Théorème de l’angle inscrit).
Soient A, B et C trois points distincts d’un cercle de centre O, TB la tangente en
B à ce cercle. Alors on a les égalités d’angles orientés de vecteurs :
−−→
\ −→ \
(OB, OC) = 2(AB, AC) = 2(T\
B , BC) .
−−→
\ −→ \
L’angle (OB, OC) est un angle orienté de vecteurs, et les angles (AB, AC) et
(T\ \ \
B , BC) des angles orientés de droites ; mais 2(AB, AC) (resp. 2(TB , BC)) est alors
aussi un angle orienté de vecteurs (dont la mesure, en supposant le plan orienté, est
définie modulo 2π).
Démonstration : Soit s1 (resp. s2 ) la réflexion d’axe la médiatrice ∆1 de [AB] (resp. la
médiatrice ∆2 de [AC]). La composée s2 ◦ s1 est une rotation de centre O (puisque ∆1
−−→
\ −→
et ∆2 se coupent en O) qui transforme B en C. Son angle est donc (OB, OC) ; mais
\
c’est aussi 2(∆ \
1 , ∆2 ) d’après la proposition 24, qui est égal à (AB, AC), puisque ∆1
est orthogonale à (AB) et ∆2 à (AC).
De même, si s4 est la réflexion d’axe la médiatrice ∆ de [BC] et s3 la réflexion
d’axe (OB), la composée s4 ◦ s3 est la rotation de centre O transformant B en C, i.e. la
−−→
\ −→ −−→
\ −→ \
rotation de centre O et d’angle (OB, OC), d’où (OB, OC) = 2(OB, ∆) = 2(T\B , BC),
puisque les droites (OB) et ∆ sont respectivement orthogonales à (OB) et (BC).
55
Remarque : l’égalité impliquant la tangente peut être vue comme le cas limite de
l’égalité précédente quand le point A tend vers le point B.
Proposition 80. Quatre points distincts A, B, C, D du plan sont cocycliques ou

\
alignés si et seulement si les angles orientés de droites (AB, \
AC) et (DB, DC) sont
égaux.
Plus précisément, ils sont alignés si et seulement si ces deux angles de droites sont
−→
\ −→ −−→
\ −−→
nuls (ce qui revient à dire que les angles de vecteurs (AB, AC) et (DB, DC) sont nuls
ou plats), cocycliques si ces angles sont égaux mais non nuls.
Démonstration : Le cas des points alignés est trivial.
Si les quatre points sont cocycliques et si O est le centre du cercle les contenant, le
−−→
\ −→ \ \
théorème de l’angle inscrit nous dit que (OB, OC) = 2(AB, AC) = 2(DB, DC) (égalité
\
d’angles orientés de vecteurs). Il en résulte que (AB, AC) = (DB,\ DC) (égalité d’angles
orientés de droites).
Réciproquement, si (AB,\ AC) = (DB, \ DC) n’est pas l’angle nul, les triangles ABC
et DBC ne sont pas aplatis. Soient alors Γ1 et Γ2 les cercles circonscrits à ces triangles,
T1 et T2 les tangentes en B à ces cercles. Il résulte de la proposition 79 que T1 = T2 .
Les deux cercles Γ1 et Γ2 ont même tangente en B et passent par les deux points B et
C : ils sont donc confondus et les points A, B, C et D sont cocycliques.
56
2 Entraînement
2.1 Vrai ou faux
Vrai-Faux 1. Soit E un espace vectoriel euclidien. Parmi les affirmations suivantes,
1. Deux vecteurs u et v sont orthogonaux si et seulement si ku+vk2 = kuk2 +kvk2 .
2. Deux vecteurs u et v sont orthogonaux si et seulement si ku−vk2 = kuk2 +kvk2 .
3. Deux vecteurs u et v ont même norme si et seulement si les vecteurs u + v et
u − v ont même norme.
4. Deux vecteurs u et v ont même norme si et seulement si les vecteurs u + v et
u − v sont orthogonaux.
5. Deux vecteurs u et v sont orthogonaux si et seulement si les vecteurs u + v et
u − v ont même norme.
6. Soient A et B deux parties de E telles que A ⊂ B. Alors B ⊥ ⊂ A⊥ .
7. Soient A et B deux parties non vides de E telles que B ⊥ ⊂ A⊥ . Alors A ⊂ B.
8. Soient A et B deux parties non vides de E telles que B ⊥ ⊂ A⊥ . Alors Vect(A) ⊂
Vect(B).
9. Soient A et B deux parties non vides de E telles que A⊥ = B ⊥ . Alors A = B.
10. Soient F et G deux sous-espaces vectoriels de E tels que dim(F ) ≤ dim(G).
Alors dim(G⊥ ) ≤ dim(F ⊥ ).
11. Soient F et G deux sous-espaces vectoriels de E. Alors (F + G)⊥ = F ⊥ ∩ G⊥ .
12. Soient F et G deux sous-espaces vectoriels de E. Alors (F ∪ G)⊥ = F ⊥ ∩ G⊥ .
13. Soient F et G deux sous-espaces vectoriels de E. Alors (F ∩ G)⊥ = F ⊥ ∪ G⊥ .
14. Soient F et G deux sous-espaces vectoriels de E. Alors (F ⊥ ∩ G⊥ )⊥ = F ∪ G.
15. Soient F et G deux sous-espaces vectoriels de E. Alors (F ⊥ ∩ G⊥ )⊥ = F + G.
16. Soient F et G deux sous-espaces vectoriels supplémentaires de E. Alors F ⊥ et
G⊥ sont des sous-espaces vectoriels supplémentaires de E.
17. Soient F et G deux sous-espaces vectoriels de E tels que F + G = E. Alors
F ⊥ ∩ G⊥ = ∅.
Vrai-Faux 2. Soit E un espace vectoriel euclidien de dimension n ≥ 2, (e1 , . . . , en )

une base orthonormée de E. Parmi les affirmations suivantes, lesquelles sont vraies,
lesquelles sont fausses, et pourquoi ?
1. Si une famille (v1 , . . . , vm ) de vecteurs de E est orthogonale (hvi , vj i = 0 pour
i 6= j), alors m ≤ n.
2. Si une famille (v1 , . . . , vm ) de vecteurs est orthonormée (hvi , vj i = 0 si i 6= j, 1
si i = j), alors m ≤ n.
57
3. Si un vecteur x de E est orthogonal à chacun des vecteurs e1 , . . . , en , alors x

est nul.
4. Une base (v1 , . . . , vn ) de E est orthonormée si et seulement si le déterminant
de la matrice de passage de la base (e1 , . . . , en ) à la base (v1 , . . . , vn ) est égal à
±1.
n
P
5. Les coordonnées x1 , . . . , xn d’un vecteur x = xi ei de E dans la base
i=1
(e1 , . . . , en ) sont données par xi = hei , xi.
6. Toute famille orthonormée de n vecteurs de E est une base de E.
7. Si une famille v1 , . . . , vn+1 de n + 1 vecteurs de E est orthogonale, alors au
moins un de ces vecteurs est nul.
8. Une famille v1 , . . . , vn de n vecteurs de E est une base de E si et seulement si
la matrice A de coefficients ai,j = hei , vj i (1 ≤ i, j ≤ n) est inversible.
9. Une famille v1 , . . . , vn de n vecteurs de E est une base orthonormée de E
si et seulement si la matrice A de coefficients ai,j = hei , vj i (1 ≤ i, j ≤ n) est
orthogonale.
Vrai-Faux 3. Soit E un espace vectoriel euclidien orienté de dimension 3, u, v, w des

vecteurs de E. Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont
1. Si hu, vi = 0, alors u = 0 ou v = 0.
2. det(u, v, u ∧ v) = ku ∧ vk2 .
3. Si det(u, v, u ∧ v) = 0, alors u et v sont colinéaires.
4. Si hu, vi = 0 et u ∧ v = 0, alors u = 0 ou v = 0.
5. (u ∧ v) ∧ w = w ∧ (v ∧ u).
6. (u ∧ v) ∧ w = u ∧ (v ∧ w).
7. Si hu ∧ v, wi = 0, alors le système (u, v, w) est lié.
8. Si kuk = kvk = 1, alors (u, v, u ∧ v) est une base orthonormée directe de E.
9. Si le système (u, v) est libre, alors (u, v, u ∧ v) est une base directe de E.
Vrai-Faux 4. Soit E un espace vectoriel euclidien . Parmi les affirmations suivantes,

1. Toute application f de E dans E qui conserve la norme (kf (v)k = kvk pour
tout v ∈ E) est linéaire.
2. Toute transformation orthogonale f de E conserve le produit scalaire : hf (u), f (v)i =
hu, vi pour tout couple (u, v) de vecteurs de E.
3. Toute symétrie vectorielle par rapport à un sous-espace vectoriel de E est un
endomorphisme symétrique.
58
4. Une projection vectorielle p sur un sous-espace vectoriel de E est un endomor-

phisme symétrique si et seulement si elle vérifie kp(u)k ≤ kuk pour tout vecteur
u de E.
5. Toute transformation orthogonale de E est un endomorphisme symétrique.
6. Tout endomorphisme symétrique de E est bijectif.
7. Toute application f de E dans E qui conserve le produit scalaire (hf (u), f (v)i =
hu, vi pour tout couple (u, v) de vecteurs de E) est linéaire.
8. Toute application f de E dans E qui conserve l’orthogonalité (hf (u), f (v)i = 0
pour tout couple (u, v) de vecteurs de E vérifiant hu, vi = 0) est linéaire.
Vrai-Faux 5. On se place dans un plan affine euclidien. Parmi les affirmations suivantes,
1. Deux rotations commutent si et seulement si elles ont même centre.
2. Le composé de deux rotations est toujours une rotation.
3. Le composé d’une rotation et d’une translation est toujours une rotation.
4. Le composé de deux réflexions d’axes parallèles est une translation.
5. Toute translation peut s’écrire comme composé de deux réflexions.
6. Le composé de deux rotations d’angles opposés et de centres respectifs O1 et
−−−→
O2 est une translation de vecteur colinéaire à O1 O2 .
7. Deux réflexions d’axes sécants commutent.
8. Deux réflexions commutent si et seulement si leurs axes sont confondus ou
perpendiculaires.
Vrai-Faux 6. Soit C1 et C2 deux cercles, de centres O1 et O2 et de rayons R1 et

R2 . Parmi les affirmations suivantes, lesquelles sont vraies, lesquelles sont fausses, et
pourquoi ?
1. C1 et C2 sont tangents si et seulement si O1 O2 = R1 + R2 .
2. C1 et C2 sont orthogonaux si et seulement si O1 O22 = R12 + R22 .
3. C1 et C2 sont sécants si et seulement si O1 O2 < R1 + R2 .
4. Il existe toujours une homothétie et une seule transformant C1 en C2 .
5. Si C1 est extérieur à C2 , alors il existe exactement deux tangentes communes
à C1 et C2 .
6. Si C1 et C2 sont sécants, alors il existe exactement deux tangentes communes
à C1 et C2 .
Vrai-Faux 7. On se place dans un espace affine euclidien de dimension 3. Parmi les

1. Tout déplacement est une translation ou une rotation.
59
2. Tout déplacement peut s’écrire comme composé de deux réflexions.

3. Tout déplacement peut s’écrire comme composé de deux demi-tours.
4. Une translation et une rotation commutent si et seulement si le vecteur de la
translation appartient à la direction de l’axe de la rotation.
5. Toute rotation peut s’écrire comme composé de deux réflexions.
6. Une symétrie centrale est une rotation d’angle plat.
7. Une symétrie centrale est un déplacement.
8. Le composé de deux rotations d’angles θ1 et θ2 est une rotation d’angle θ1 + θ2 .
9. Deux rotations de même axe commutent.
Vrai-Faux 8. On se place dans le plan complexe. Parmi les affirmations suivantes,

1. Deux vecteurs d’affixes z1 et z2 sont orthogonaux si et seulement si z1 z2 = 0.
2. Deux vecteurs ~v1 et ~v2 d’affixes z1 et z2 non nulles vérifient k~v1 + ~v2 k =
z1
k~v1 k + k~v2 k si et seulement si le quotient est réel.
z2
3. Deux points d’affixes z1 et z2 non nulles sont alignés avec l’origine si et seule-
ment si z1 z̄2 est réel.
4. L’application qui à tout point d’affixe z associe le point d’affixe 2 − iz est une
rotation.
5. L’application qui à tout point d’affixe z associe le point d’affixe 2 − z est une
symétrie centrale.
6. L’application qui à tout point d’affixe z associe le point d’affixe 2z̄ est une
réflexion.
7. L’application qui à tout point d’affixe z associe le point d’affixe iz̄ est une
réflexion.
8. L’application qui à tout point d’affixe z associe le point d’affixe z − 2z̄ est une
similitude.
2.2 Exercices
Exercice 1. Soit E un espace vectoriel euclidien de dimension n, (e1 , . . . , en ) une base
orthonormale de E, H un hyperplan vectoriel de E d’équation a1 x1 + · · · + an xn = 0
dans cette base. Donner la matrice dans la base (e1 , . . . , en ) des projections orthogonales
sur H ⊥ et sur H.
Exercice 2. 1) Soit v un vecteur non nul d’un espace vectoriel euclidien E de dimension
n. Exprimer en fonction de u et v le projeté orthogonal u0 d’un vecteur u de E sur
l’hyperplan orthogonal à v.
60
2) Soient v0 , v1 , . . . , vm m + 1 vecteurs de E vérifiant hvi , vj i < 0 pour tout couple

(i, j) d’indices distincts. Montrer que les projetés orthogonaux v10 , . . . , vm 0
des vecteurs
0 0
v1 , . . . , vm sur l’hyperplan orthogonal à v0 vérifient hvi , vj i < 0 pour tout couple (i, j)
d’indices distincts.
3) En déduire par récurrence sur n que m ≤ n.
4) Montrer qu’il existe n + 1 vecteurs v0 , v1 , . . . , vn de E vérifiant hvi , vj i < 0 pour
tout couple (i, j) d’indices distincts. La borne dans l’inégalité de la question précédente
ne peut donc pas être améliorée.
Exercice 3. Soient F et G deux sous-espaces vectoriels d’un espace vectoriel euclidien
E. Montrer que les trois propriétés suivantes sont équivalentes :
(i) F ⊥ ⊂ G ;
(ii) G⊥ ⊂ F ;
(iii) F ⊥ et G⊥ sont orthogonaux.
Exercice 4. Soit F et G deux sous-espaces vectoriels d’un espace vectoriel euclidien
E tels que F ⊂ G, pF et pG les projections orthogonales sur F et G. Montrer que
pF ◦ pG = pF .
Exercice 5. Soit u, v, w trois vecteurs d’un espace vectoriel euclidien orienté de di-
mension 3. Montrer que que la famille (u, v, w) est libre si et seulement si la famille
(u ∧ v, u ∧ w) est libre.
Exercice 6. Soit, dans un espace vectoriel euclidien E, f une tranformation orthogonale
et F un sous-espace vectoriel de E tels que f (F ) = F . Montrer que f (F ⊥ ) = F ⊥ .
Exercice 7. Soit, dans un plan vectoriel euclidien, r une rotation vectorielle et s une
réflexion vectorielle .
1) Déterminer s ◦ r ◦ s et r ◦ s ◦ r.
2) Donner une condition nécessaire et suffisante pour que r et s commutent.
Exercice 8. Soit, dans un espace vectoriel euclidien de dimension
 3 rapporté à une base
0 1 0
orthonormée, f l’endomorphisme de matrice A = 0 0 1. Montrer que f est une
 
1 0 0
rotation vectorielle dont on précisera l’axe et l’angle.
Exercice 9. Soit, dans un espace vectoriel euclidien
 de dimension
 3 rapporté à une
0 1 0
base orthonormée, f l’endomorphisme de matrice  0 0 1. Montrer que f est une
 
−1 0 0
antirotation dont on déterminera l’axe et l’angle.
Exercice 10. Dans un espace vectoriel euclidien de dimension 3, déterminer le produit
de deux demi-tours. Montrer que toute rotation vectorielle peut s’écrire comme produit
de deux demi-tours. Cette écriture est-elle unique ?
61
Exercice 11. 1) Soit, dans un espace vectoriel euclidien de dimension 3, s une réflexion
vectorielle de plan P , r une rotation vectorielle d’axe D et u un vecteur directeur de
D. Montrer que si s ◦ r = r ◦ s, alors s(u) = ±u et r(P ) = P .
2) Donner une condition nécessaire et suffisante pour qu’une rotation vectorielle et
une réflexion vectorielle commutent.
Exercice 12. On se place dans un espace vectoriel euclidien de dimension 3.

1) Soient r1 et r2 deux rotations vectorielles de même axe. Montrer que r1 ◦ r2 =
r2 ◦ r1 .
2) Soient r1 et r2 deux demi-tours d’axes D1 et D2 orthogonaux. Montrer que
r1 ◦ r2 = r2 ◦ r1 et déterminer cette rotation.
3) Soit r une rotation différente de l’identité, et D son axe. Soit ∆ une droite
vectorielle distincte de D telle que r(∆) = ∆. Montrer que D et ∆ sont orthogonales
et que r est un demi-tour.
4) Soient r1 et r2 deux rotations vectorielles distinctes de l’identité d’axes D1 et D2
distincts. On suppose r1 ◦ r2 = r2 ◦ r1 . Montrer que r2 (D1 ) = D1 . En déduire que r1 et
r2 sont deux demi-tours d’axes orthogonaux.
5) Donner une condition nécessaire et suffisante pour que deux rotations vectorielles
commutent.
Exercice 13. 1) Soit f un endomorphisme d’un espace vectoriel euclidien E. Montrer

que les propriétés suivantes sont équivalentes :
(i) hx, f (x)i = 0 pour tout vecteur x de E ;
(ii) hf (x), yi = −hx, f (y)i pour tout couple (x, y) de vecteurs de E ;
(iii) la matrice de f dans toute base orthonormale de E est antisymétrique ;
(iv) il existe une base orthonormale de E dans laquelle la matrice de f est antisy-
métrique ;
(v) f = −f ∗ .
Un endomorphisme vérifiant ces propriétés est dit antisymétrique.
2) Montrer que l’ensemble des endomorphismes antisymétriques d’un espace vecto-
n(n − 1)
riel euclidien E de dimension n est un sous-espace vectoriel A de dimension
2
de l’espace vectoriel L des endomorphismes de E.
3) Soit S l’espace des endomorphismes symétriques de E. Montrer que les sous-
espaces vectoriels S et A sont supplémentaires dans L. Écrire la décomposition d’un
endomorphisme f de E suivant ces deux sous-espaces.
4) Montrer que le noyau et l’image d’un endomorphisme antisymétrique sont des
sous-espaces vectoriels supplémentaires orthogonaux.
5) Montrer que le déterminant de tout endomorphisme antisymétrique d’un espace
vectoriel euclidien de dimension impaire est nul.
6) Déduire des deux questions précédentes que le rang d’un endomorphisme antisy-
métrique est toujours pair (on pourra considérer la restriction de cet endomorphisme
à son image).
62
7) Décrire les endomorphismes antisymétriques d’un espace vectoriel euclidien de

dimension 2.
8) Soit f un endomorphisme antisymétrique d’un espace vectoriel euclidien orienté
E de dimension 3. Montrer qu’il existe un vecteur v de E et un seul tel que f (x) = v ∧x
pour tout vecteur x de E. Exprimer le noyau et l’image de f en fonction de v.
9) Soient u et v deux vecteurs d’un espace vectoriel euclidien orienté E de dimension
3. Discuter en fonction de u et v l’existence et le nombre de solutions de l’équation
u ∧ x = v.
!
a b
Exercice 14. Montrer qu’une matrice réelle carrée d’ordre 2 symétrique est
b c
définie positive si et seulement si a > 0 et ac − b2 > 0.
Exercice 15. On identifie, dans tout cet exercice, toute matrice réelle à n lignes et
p colonnes à l’application linéaire de Rp dans Rn qui lui est associée. On identifie
également tout vecteur de Rp à la matrice colonne de ses composantes.
1) Soit M une matrice à n lignes et p colonnes et X un vecteur de Rp . Exprimer
t t
X M M X en fonction de la norme euclidienne de M X.
2) Montrer que la matrice tM M est symétrique positive.
3) Comparer les noyaux, puis les rangs, de M et tM M .
4) Montrer que tM M est définie positive si et seulement si les vecteurs colonnes de
M sont linéairement indépendants.
Exercice 16. Matrice de Gram

Soit E un espace vectoriel euclidien de dimension n et v1 , . . . , vp une famille de p vec-
teurs de E. On appelle matrice de Gram de (v1 , . . . , vp ) la matrice Gram(v1 , . . . , vp ) =
(gi,j )i,j=1...p de coefficients
gi,j = hvi , vj i
et déterminant de Gram de cette famille le déterminant
G(v1 , . . . , vp ) = det (Gram(v1 , . . . , vp ))
de sa matrice de Gram.
1) Soit (e1 , . . . , en ) une base orthonormale de E et M la matrice des vecteurs
(v1 , . . . , vp ) dans cette base. Montrer que Gram(v1 , . . . , vp ) = tM M . En déduire que
G(v1 , . . . , vp ) ≥ 0.
2) Montrer que les vecteurs v1 , . . . , vp sont linéairement indépendants si et seulement
si G(v1 , . . . , vp ) > 0.
3) Soient a ∈ E, F un sous-espace vectoriel de E et (w1 , . . . , wp ) une base (non
nécessairement orthonormée) de F . Montrer que la distance d(a, F ) de a au sous-espace
vectoriel F est donnée par :
G(a, w1 , . . . , wp )
d(a, F )2 = .
G(w1 , . . . , wp )
63
4) On suppose E orienté de dimension 3. Montrer que G(v1 , v2 ) = kv1 ∧ v2 k2 pour

tout couple (v1 , v2 ) de vecteurs de E.
5) Soient u1 , u2 , u3 trois vecteurs unitaires de E et α, β, γ trois éléments de [0, π]
tels que
hu1 , u2 i = cos α, hu2 , u3 i = cos β, hu3 , u1 i = cos γ .
Calculer G(u1 , u2 , u3 ) et en déduire les inégalités
α + β + γ ≤ 2π, α ≤ β + γ, β ≤ γ + α, γ ≤α+β .
Interpréter géométriquement ces inégalités.
Exercice 17. Soit E un espace vectoriel euclidien de dimension n, (v1 , . . . , vn ) une base
de E, G la matrice de Gram de la famille (v1 , . . . , vn ), f un endomorphisme de E de
matrice A dans la base (v1 , . . . , vn ).
1) Exprimer en fonction de A et de G la matrice de l’endomorphisme adjoint f ∗ de
f dans la base (v1 , . . . , vn ).
2) Montrer que f est symétrique si et seulement si GA = tAG.
Exercice 18. Quotient de Rayleigh

Soit A une matrice symétrique réelle d’ordre n. On définit, pour tout vecteur colonne
non nul X ∈ Rn , le quotient de Rayleigh RA (X) par
t
XAX
RA (X) = t .
XX
1) Montrer que RA (λX) = RA (X) pour tout réel λ non nul.
2) Montrer que la plus grande (resp. la plus petite) valeur propre λmin (resp. λmax )
de A est donnée par
λmax = max RA (X) = max RA (X)

X∈Rn , X6=0 X∈Rn , kXk=1
λmin = min RA (X) = min RA (X) .

X∈Rn , X6=0 X∈Rn , kXk=1
Exercice 19. 1) Montrer que toute matrice symétrique positive A (i.e. vérifiant tX A X ≥
0 pour tout X) possède une racine carrée symétrique positive (i.e. une matrice A1 sy-
métrique positive vérifiant A21 = A).
2) En déduire que toute matrice symétrique positive d’ordre n est la matrice de
Gram d’une famille de n vecteurs.
Exercice 20. Inégalité de Hadamard

Soit (v1 , . . . , vn ) une famille libre de n vecteurs d’un espace vectoriel euclidien E
de dimension n, (e1 , . . . , en ) une base orthonormale de E et (e01 , . . . , e0n ) la base ortho-
normale de E obtenue à partir de (v1 , . . . , vn ) par le procédé d’orthonormalisation de
Gram-Schmidt. On note
64
– M la matrice de passage de la base (e1 , . . . , en ) à la base (v1 , . . . , vn ) ;

– Q la matrice de passage de la base (e1 , . . . , en ) à la base (e01 , . . . , e0n ) ;
– T la matrice de passage de la base (e01 , . . . , e0n ) à la base (v1 , . . . , vn ).
1) Que peut-on dire des matrices Q et T ?
2) Montrer que M = QT .
3) Comparer les matrices tM M et tT T .
4) En déduire une relation entre les normes des vecteurs colonnes de M et celles
des vecteurs colonnes de T .
5) Exprimer la valeur absolue du déterminant de M en fonction des coefficients
diagonaux ti,i de T .
6) En déduire que la valeur absolue du déterminant d’une matrice carrée réelle est
inférieure ou égale au produit des normes euclidiennes de ses vecteurs colonnes et que la
valeur absolue du déterminant de n vecteurs d’un espace vectoriel euclidien orienté de
dimension n est inférieure ou égale au produit des normes de ces vecteurs. Interpréter
ces inégalités en termes d’aire ou de volume quand n = 2 ou 3. Dans quels cas a-t-on
l’égalité ?
Exercice 21. Soit A ∈ M3 (R) une matrice symétrique définie positive et V l’ellipsoïde
plein
V = {(x1 , x2 , x3 ) ∈ R3 |t XAX ≤ 1}
où X = t(x1 , x2 , x3 ). Exprimer en fonction des valeurs propres de A le rayon R de la
plus petite boule de centre l’origine contenant V et le rayon r de la plus grande boule
de centre l’origine contenue dans V .
Exercice 22. Méthode des moindres carrés

Soit A ∈ Mn,m (R) une matrice réelle à n lignes et m colonnes et V un vecteur de
R . On identifiera A à l’application linéaire de Rm dans Rn qui lui est naturellement
n
associée et V à la matrice colonne de ses composantes.

On dit que le vecteur colonne U ∈ Rm est solution du problème des moindres carrés
associé au couple (A, V ) si
kAU − V k = min{kAW − V k | W ∈ Rm } .
1) Montrer que U ∈ Rm est solution du problème des moindres carrés associé au

couple (A, V ) si et seulement si AU est le projeté orthogonal de V sur le sous-espace
vectoriel Im A de Rn .
2) En déduire que U ∈ Rm est solution du problème des moindres carrés associé
au couple (A, V ) si et seulement si AU − V est orthogonal à Im A, ou encore si et
seulement si t AAU = t AV .
3) Montrer que si le rang de A est m, le problème des moindres carrés associé au
couple (A, V ) admet une unique solution, et que si le rang de A est strictement plus
petit que m, l’ensemble des solutions est un sous-espace affine de Rm de dimension
m − rgA.
65
4) On suppose le rang de A égal à m. Montrer que l’erreur δ = kAU − V k au sens

des moindres carrés du problème associé à (A, V ) (dont U est l’unique solution) est
donnée par :
G(V, A1 , · · · , Am )
δ2 =
G(A1 , · · · , Am )
où A1 , · · · , Am sont les vecteurs colonnes de A et G le déterminant de Gram.
Exercice 23. Soient B et C deux points d’un espace affine euclidien E et b et c deux
réels positifs vérifiant b + c = BC. Montrer qu’il existe un et un seul point A de E
vérifiant AB = c et AC = b et que ce point appartient au segment [BC]. En particulier
1
le milieu I de BC est l’unique point de E vérifiant IB = IC = BC.
2
Exercice 24. Fonction scalaire de Leibniz
Soit (Ai , λi )i=1,...,n un système de points pondérés d’un espace affine euclidien E.
n
λi M A2i .
P
On définit une fonction ϕ de E dans R par ϕ(M ) =
n
i=1
n

λi 6= 0. Montrer que ϕ(M ) = λi M G2 + ϕ(G), où G est le
P P
1) On suppose
i=1 i=1
barycentre du système pondéré (Ai , λi )i=1,...,n .
En particulier, si I est le milieu d’un segment AB, on obtient l’identité de la médiane :
AB 2
M A2 + M B 2 = 2M I 2 + 2AI 2 = 2M I 2 + .
2
n −−→
λi = 0. Montrer que ϕ(M ) = 2M N · ~u + ϕ(N ) pour tout couple
P
2) On suppose
i=1
n
P −−→
(M, N ) de points de E, où le vecteur ~u = λi N Ai ne dépend pas du point N .
i=1
3) Application : Soient A et B deux points d’un plan affine euclidien E et k un réel
non nul. Déterminer l’ensemble des points M de E vérifiant M A2 + M B 2 = k (resp.
MA
M A2 − M B 2 = k, = k).
MB
Exercice 25. Le plan est rapporté à un repère orthonormé . Donner l’expression en
coordonnées de la projection orthogonale sur la droite D d’équation x + 2y + 3 = 0,
puis de la symétrie orthogonale par rapport à cette même droite.
Exercice 26. Théorème des trois perpendiculaires

Soit P un plan de l’espace affine euclidien E de dimension 3 et D une droite incluse
dans ce plan. On note pP (resp. pD ) la projection orthogonale sur P (resp. D). Montrer
que pD = pD ◦ pP . Si M est un point de E, H = pP (M ) son projeté orthogonal sur P
et K = pD (M ) son projeté orthogonal sur D, écrire une relation entre M H, HK et
M K.
66
Exercice 27. L’espace est rapporté à un repère orthonormé. Donner des équations de
la perpendiculaire commune aux droites D1 d’équations

x + y −z−1=0
2x + y + z = 0
et D2 déterminée par le point A2 de coordonnées (1, 0, 1) et le vecteur directeur ~v2 de

composantes (1, −1, 0). Calculer la distance de ces deux droites.
Exercice 28. Montrer qu’un point d’un espace affine euclidien E est uniquement dé-
terminé par ses distances aux points d’un repère affine, i.e. que si (A0 , A1 , . . . , An ) est
un repère affine de E, l’application M 7→ (M A0 , M A1 , . . . , M An ) de E dans Rn+1 est
injective.
Exercice 29. Soit E un espace affine euclidien et p la projection affine sur un sous-
espace affine F de E dans la direction d’un sous-espace affine G. Montrer que p est
1-lipschitzienne (i.e. vérifie p(M )p(N ) ≤ M N pour tout couple (M, N ) de points de
→
− →
−
E) si et seulement si p est une projection orthogonale (i.e. si et seulement si F et G
→
−
sont des sous-espaces vectoriels supplémentaires orthogonaux de E ).
Exercice 30. L’espace affine euclidien de dimension 3 est rapporté à un repère or-
thonormé. Donner une condition nécessaire et suffisante pour que deux plans P et
P 0 d’équations respectives ax + by + cz + d = 0 et a0 x + b0 y + c0 z + d0 = 0 soient
perpendiculaires.
Exercice 31. Montrer que deux droites orthogonales de l’espace affine euclidien de
dimension 3 se projettent orthogonalement sur un plan P en deux droites orthogonales
si et seulement si l’une de ces droites est parallèle à P , l’autre n’étant pas orthogonale
à P.
Exercice 32. Soit, dans l’espace rapporté à un repère orthonormé, D1 la droite d’équa-
tions
x + 4y + z − 12 = 0, 2x + 2y − z − 9 = 0
et D2 la droite définie par le point B de coordonnées (2, 1, 4) et le vecteur directeur ~v2
de composantes (1, −1, 1).
1) Donner un vecteur directeur de D1 .
2) Donner un vecteur directeur de la perpendiculaire commune ∆ à D1 et D2 .
3) Donner une équation cartésienne du plan Q1 défini par D1 et ∆.
4) Donner une équation cartésienne du plan Q2 défini par D2 et ∆.
5) Donner les coordonnées des pieds de la perpendiculaire commune ∆.
6) Calculer la distance de la droite D1 à la droite D2 .
67
Exercice 33. Dans l’espace affine euclidien de dimension 3 rapporté à un repère or-
thonormé d’origine O, on considère les trois points A(a, 0, 0), B(0, b, 0), C(0, 0, c), avec
abc 6= 0.
1) Ecrire l’équation du plan (ABC). Donner un vecteur normal à ce plan.
2) Montrer que le projeté orthogonal H de O sur le plan (ABC) est l’orthocentre
du triangle ABC.
3) Ecrire l’équation de la sphère circonscrite au tétraèdre OABC. Déterminer son
−→ −→
rayon et les coordonnées de son centre Ω. Comparer les vecteurs OΩ et OG, où G est
l’isobarycentre des sommets du tétraèdre.
Exercice 34. Soit ABCD un tétraèdre non aplati de l’espace affine euclidien de di-
mension 3. Montrer qu’il existe une sphère et une seule passant par les 4 points A, B,
C et D. Cette sphère est appelée sphère circonscrite au tétraèdre.
Exercice 35. Dans l’espace rapporté à un repère orthonormé, on considère les deux
sphères S1 et S2 d’équations respectives :
x2 + y 2 + z 2 − 2x + 4y − 6z − 11 = 0
et
x2 + y 2 + z 2 − 6x − 4z + 9 = 0 .
1) Donner pour chacune de ces sphères les coordonnées de son centre et son rayon.
2) Montrer que S1 et S2 sont tangentes. Donner les coordonnées de leur point de
contact et l’équation de leur plan tangent en ce point.
3) Montrer qu’il existe exactement deux homothéties transformant S1 en S2 . Donner
pour chacune de ces homothéties son rapport et les coordonnées de son centre.
Exercice 36. Soient, dans le plan affine euclidien rapporté à un repère orthonormé
(O,~i, ~j), D et D0 deux droites sécantes d’équations respectives ax + by + c = 0 et
a0 x + b0 y + c0 = 0. Ecrire l’équation de la réunion des deux bissectrices de ces droites.
Exercice 37. Soient P et P 0 deux plans de l’espace affine euclidien E de dimension 3
d’équations respectives ax + by + cz + d = 0 et a0 x + b0 y + c0 z + d0 = 0 dans un repère
orthonormé. Déterminer l’ensemble des points M de E équidistants de P et P 0 .
Exercice 38. Montrer que, dans le plan affine euclidien rapporté à un repère ortho-
normé, la tangente en M0 (x0 , y0 ) au cercle d’équation x2 + y 2 − 2ax − 2by + c = 0 a
pour équation x0 x + y0 y − a(x + x0 ) − b(y + y0 ) + c = 0.
Exercice 39. Montrer que par tout point M du plan extérieur à un cercle C de centre
O on peut mener deux tangentes à C et que ces tangentes sont symétriques par rapport
à la droite OM . Donner une construction de ces tangentes.
Exercice 40. Ecrire l’équation de l’axe radical de deux cercles donnés par leurs équa-
tions cartésiennes en repère orthonormé x2 + y 2 − 2ax − 2by + c = 0 et x2 + y 2 − 2a0 x −
2b0 y + c0 = 0. Vérifier que cet axe radical est perpendiculaire à la droite des centres.
68
Exercice 41. On suppose les cercles C1 et C2 sécants en A et B. Montrer que le faisceau

de cercles engendré par C1 et C2 est exactement l’ensemble des cercles du plan passant
par A et B.
Exercice 42. On suppose les cercles C1 et C2 tangents en un point A. Montrer que le
faisceau de cercles engendré par C1 et C2 est exactement l’ensemble des cercles du plan
tangents en A à C1 et C2 .
Exercice 43. Cercles orthogonaux
Soient, dans le plan affine euclidien, C et C 0 deux cercles de centres respectifs O et
O0 et de rayons respectifs R et R0 . Montrer l’équivalence des propriétés suivantes :
(i) les cercles C et C 0 sont sécants et leurs tangentes en leurs points d’intersection
sont orthogonales ;
(ii) OO02 = R2 + R02 ;
(iii) pC (O0 ) = R02 ;
(iv) pC 0 (O) = R2 .
Deux cercles C et C 0 remplissant ces conditions sont dits orthogonaux.
Exercice 44. Faisceaux de cercles orthogonaux
1) Montrer qu’un cercle orthogonal à deux cercles d’un faisceau est orthogonal à
tout cercle du faisceau.
2) En déduire que l’ensemble des cercles orthogonaux à tous les cercles d’un faisceau
est un autre faisceau de cercles, et que l’axe radical de l’un ces faisceaux est la droite
des centres de l’autre.
Exercice 45. Arc capable.
Soient A et B deux points distincts du plan affine euclidien orienté et α un réel.
Déterminer l’ensemble des points M du plan tels que la mesure de l’angle orienté
−−→\ −−→
de vecteurs (M A, M B) soit congrue à α modulo π (resp. modulo 2π). En déduire
l’ensemble des points M du plan tels que la mesure de l’angle géométrique AM\ B soit
égale à α.
Exercice 46. Soient a, b, c trois réels positifs. Montrer qu’il existe un triangle de lon-
gueurs de côtés a, b, c si et seulement si on a la double inégalité : |b − c| < a < b + c.
Exercice 47. Montrer qu’un triangle ABC est isocèle en A si et seulement si les angles
géométriques B̂ et Ĉ sont égaux. Un triangle est donc équilatéral si et seulement si ses
trois angles sont égaux.
Exercice 48. 1) Montrer que, pour tout quadruplet (A, B, C, M ) de points d’un espace
affine euclidien E, on a :
−−→ −−→ −−→ −→ −−→ −→
M A · BC + M B · CA + M C · AB = 0 .
2) Redémontrer en utilisant cette relation que les hauteurs d’un triangle sont
concourantes.
69
3) Montrer que si deux des trois couples d’arêtes opposées d’un tétraèdre sont
constitués de droites orthogonales, le troisième couple l’est aussi.
Exercice 49. Tétraèdres orthocentriques
1) Soit, dans l’espace affine euclidien de dimension 3, ABCD un tétraèdre non
aplati et A1 , B1 , C1 , D1 les projetés orthogonaux des sommets A, B, C, D sur les
faces opposées (les droites (AA1 ), (BB1 ), (CC1 ), (DD1 ) sont appelées hauteurs du
tétraèdre).
Démontrer l’équivalence des deux propriétés :
(i) les droites (AB) et (CD) sont orthogonales ;
(ii) les droites (AA1 ) et (BB1 ) sont sécantes.
2) Montrer que les quatre hauteurs d’un tétraèdre sont concourantes si et seulement
si toute arête de ce tétraèdre est orthogonale à l’arête opposée. Un tel tétraèdre est dit
orthocentrique.
3) Montrer qu’un tétraèdre régulier est orthocentrique. Donner un exemple de té-
traèdre orthocentrique qui n’est pas régulier.
Exercice 50. Cercle d’Euler
Soit dans le plan affine euclidien ABC un triangle non aplati, G son centre de
gravité, H son orthocentre, A0 , B 0 , C 0 les milieux des côtés BC, CA et AB, Γ le cercle
circonscrit au triangle ABC et O son centre.
1) Montrer que l’homothétie hG,−1/2 de centre G et de rapport −1/2 transforme le

triangle ABC en le triangle A0 B 0 C 0 .
2) Montrer que les points O, G et H sont alignés. Écrire une relation entre les
−−→ −→
vecteurs GH et GO.
3) Soit Γ0 le cercle circonscrit au triangle A0 B 0 C 0 et O0 son centre. Montrer que Γ0
est l’image de Γ par l’homothétie hG,−1/2 , puis que O0 est le milieu de HO. En déduire
70
que l’homothétie de centre H et de rapport 1/2 transforme Γ en Γ0 , puis que Γ0 passe

par les milieux A00 , B 00 et C 00 des segments HA, HB et HC.
−−→ −−−→ −−−→ −−−→
4) Comparer les vecteurs C 0 B 0 et B 00 C 00 , puis les vecteurs C 0 B 00 et B 0 C 00 . Montrer
que C 0 B 00 C 00 B 0 est un rectangle. En déduire que C 0 C 00 et B 0 B 00 sont des diamètres du
cercle Γ0 .
5) Montrer que le cercle Γ0 passe par les pieds des hauteurs du triangle ABC.
Exercice 51. Montrer que si un quadrilatère convexe ABCD possède un cercle inscrit,
il vérifie AB + CD = BC + DA.
Exercice 52. Cercle exinscrit et périmètre (théorème des trois tangentes)
Soit ABC un triangle, P , Q, R les points de contact du cercle exinscrit dans l’angle
en A avec les côtés (BC), (CA) et (AB). Montrer que la somme AQ + AR est égale
au périmètre du triangle ABC. En déduire le théorème des trois tangentes : soit A un
point extérieur à un cercle Γ, (AQ) et (AR) les deux tangentes menées de A à Γ, P
_
un point de l’arc QR du cercle Γ situé du côté de A, B et C les points d’intersection
de la tangente en P à Γ avec les droites (AR) et (AQ) ; alors le périmètre du triangle
ABC ne dépend pas de P .
71
Exercice 53. Droites de Simson et de Steiner

Soit ABC un triangle du plan affine euclidien. Montrer qu’un point M du plan
appartient au cercle circonscrit à ABC si et seulement si ses projetés orthogonaux sur
les trois côtés (resp. ses symétriques par rapport aux trois côtés) sont alignés. La droite
qui les porte s’appelle la droite de Simson (resp. la droite de Steiner) de ce point.
Exercice 54. Soit ABC un triangle et A0 , B 0 , C 0 trois points situés respectivement

sur les côtés BC, CA et AB de ce triangle et différents des sommets. Montrer que les
cercles circonscrits aux trois triangles AB 0 C 0 , BC 0 A0 et CA0 B 0 ont un point commun.
Exercice 55. Montrer qu’un déplacement du plan qui admet deux points fixes distincts
est l’identité. Que peut-on dire d’un antidéplacement du plan qui admet deux points
fixes distincts ? d’une isométrie plane qui admet deux points fixes distincts ?
72
Exercice 56. Soit (A, B) et (A0 , B 0 ) deux couples de points distincts du plan affine
euclidien vérifiant AB = A0 B 0 . Montrer qu’il existe un et seul déplacement f (resp.
un et un seul antidéplacement g) du plan vérifiant A0 = f (A) et B 0 = f (B) (resp.
A0 = g(A) et B 0 = g(B)). Construire géométriquement les éléments caractéristiques de
f et de g.
Exercice 57. Soient C1 et C2 deux cercles du plan de centres O1 et O2 distincts et de

rayons R1 et R2 distincts.
1) Montrer qu’il existe exactement deux homothéties transformant C1 en C2 . Indi-
quer une construction des centres de ces homothéties.
2) Déterminer l’ensemble des centres des similitudes directes transformant C1 en
C2 .
Exercice 58. Soit ABC un triangle, R le rayon de son cercle circonscrit, S son aire.
On note H le pied de la hauteur issue de A et D le point diamétralement opposé à A
sur le cercle circonscrit à ABC.
1) Montrer que les triangles AHC et ABD sont semblables.
2) En déduire la relation AB × BC × CA = 4 R S.
Exercice 59. Hauteurs et triangle orthique

Soit ABC un triangle non aplati du plan affine euclidien et A0 , B 0 , C 0 les pieds des
hauteurs.
1) Montrer que les côtés du triangle ABC sont des bissectrices du triangle A0 B 0 C 0 .
On suppose que le triangle ABC a tous ses angles aigus. Montrer que les hauteurs AA0 ,
BB 0 et CC 0 du triangle ABC sont les bissectrices intérieures du triangle A0 B 0 C 0 .
2) Soient P , Q, R trois points distincts situés respectivement sur les côtés BC, CA
et AB du triangle ABC et tels que les côtés du triangle ABC soient des bissectrices
du triangle P QR et f = sAB ◦ sCA ◦ sBC la composée des réflexions d’axes ces côtés.
Montrer que f est une symétrie glissée laissant globalement invariante la droite P R.
En déduire que cette droite est l’axe de la symétrie glissée f , puis que les points P , Q,
R sont les pieds des hauteurs du triangle ABC.
Exercice 60. Soit D une droite du plan affine euclidien et P et Q deux points du
plan situés d’un même côté de cette droite. Déterminer le point I de la droite D qui
minimise la somme P I + IQ.
Exercice 61. Problème de Fagnano

Soit ABC un triangle du plan affine euclidien dont tous les angles sont aigus. On
cherche à déterminer un triangle de périmètre minimal inscrit dans le triangle ABC,
c’est-à-dire un triangle P QR dont les sommets P , Q et R appartiennent respectivement
aux côtés BC, CA et AB du triangle et tel que la somme P Q+QR+RP soit minimale.
1) Montrer en utilisant l’exercice précédent que si P , Q et R sont trois points
intérieurs aux côtés du triangle ABC tels que le triangle P QR soit solution de ce
73
problème, alors les côtés du triangle ABC sont les bissectrices extérieures du triangle
P QR. En déduire que les points P , Q, R sont les pieds des hauteurs du triangle ABC.
2) Soit P le pied de la hauteur issue de A dans le triangle ABC, P1 et P2 les
symétriques de P par rapport à AB et AC. Montrer que les points P1 , R, Q et P2 sont
alignés et que le périmètre du triangle P QR est égal à P1 P2 . Exprimer ce périmètre
en fonction de AP et de l’angle en A du triangle ABC. En déduire que le problème de
minimisation admet une solution unique donnée par les pieds des hauteurs.
Exercice 62. Isométries du rectangle et du losange

Déterminer le groupe des isométries planes conservant :
1. un carré ;
2. un rectangle qui n’est pas un carré ;
3. un losange qui n’est pas un carré ;
4. un parallélogramme qui n’est ni un rectangle ni un losange.
Exercice 63. L’espace affine euclidien E de dimension 3 est rapporté à un repère or-
thonormé. Déterminer la nature géométrique de la transformation f de E qui à un
point M de coordonnées (x, y, z) associe le point M 0 de coordonnées (x0 , y 0 , z 0 ) définies
par :  √ √
 0 x + y − 2z − 3 + 2

 x =
√2 √




x + y + 2 z − 1 − 2

0
y =

 √ √ 2 √
2 x − 2 y + 2 + 2


0

z =

2
(on précisera les éléments caractéristiques de cette transformation).
74
Exercice 64. L’espace affine euclidien E de dimension 3 est rapporté à un repère or-
thonormé. Déterminer la nature géométrique de la transformation de E qui à un point
M de coordonnées (x, y, z) associe le point M 0 de coordonnées (x0 , y 0 , z 0 ) définies par :
x − 2y − 2z − 1

x0 =



3


−2x + y − 2z + 5


0
y =
 3
−2x − 2y + z + 2


z 0 =



3
(on précisera les éléments caractéristiques de cette transformation).
Exercice 65. Soit E un espace affine euclidien de dimension 3, (O,~i, ~j, ~k) un repère
−→ −−→ −→
orthonormé de E, A, B, C les points de E définis par OA = ~i, OB = ~j, OC = ~k.
Déterminer le groupe G des isométries de E laissant globalement invariant l’ensemble
{O, A, B, C}. Préciser la nature géométrique des éléments de G et écrire les matrices
→
−
de leurs parties linéaires dans la base (~i, ~j, ~k) de E . Montrer que G est isomorphe au
groupe des permutations de trois éléments.
Exercice 66. Soit E un espace affine euclidien de dimension 3, ~i, ~j, ~k une base ortho-
normée de l’espace vectoriel E ~ associé, A et B deux points de E vérifiant − →
AB = ~k. On
note D1 la droite de vecteur directeur ~i passant par A, D2 la droite de vecteur directeur
~j passant par B, et, pour i = 1, 2, si le retournement d’axe Di .
1) Écrire les matrices des parties linéaires de s1 , s2 , s2 ◦ s1 et s1 ◦ s2 dans la base
(~i, ~j, ~k).
2) Montrer que f = s2 ◦ s1 est un vissage dont on précisera l’axe et le vecteur.
3) Calculer f 2 . Déterminer les images f (A) et f (B) de A et B par f .
4) Soit G le sous-groupe du groupe des isométries de E engendré par s1 et s2 .
Montrer qu’il existe une droite de E globalement invariante par tout élément de G.
5) Décrire géométriquement tous les éléments de G.
Exercice 67. Isométries du cube, du tétraèdre et de l’octaèdre

Soit ABCDA0 B 0 C 0 D0 un cube de diagonales AA0 , BB 0 , CC 0 , DD0 dont le carré
ABCD est une face. On se propose de déterminer le groupe G des isométries de l’espace
conservant ce cube et de comparer ce groupe aux groupes des isométries du tétraèdre
et de l’octaèdre.
1) Montrer que tout élément de G transforme toute diagonale du cube en une
diagonale du cube. En déduire que tout élément de G laisse globalement invariant
l’ensemble des sommets du cube. Réciproquement, montrer que toute isométrie de
l’espace laissant globalement invariant l’ensemble des sommets du cube conserve le
cube.
75
2) Soit ϕ l’application de G dans l’ensemble S des permutations des diagonales

du cube qui à tout élément de G associe la permutation induite sur l’ensemble des
diagonales. Montrer que ϕ est un morphisme de groupes et que sa restriction au sous-
groupe G+ des isométries directes de G est injective.
3) Identifier les éléments de G+ et montrer que ϕ est un isomorphisme de G+ sur
S.
4) En considérant la symétrie centrale de centre le centre du cube, montrer que G
est isomorphe au produit direct de S par un groupe à 2 élements.
5) Soit T1 = ACD0 B 0 et T2 = A0 C 0 DB les deux tétraèdres réguliers dont les arêtes
sont les diagonales des faces du cube. Montrer que l’ensemble G1 des éléments de G
qui conservent T1 est un sous-groupe de G, et que G est réunion disjointe de G1 et de
l’ensemble G2 des éléments de G qui échangent T1 et T2 . Retrouver ainsi la structure
de G (on rappelle que le groupe des isométries du tétraèdre régulier est isomorphe au
groupe des permutations de 4 éléments).
6) Montrer que les ensembles des milieux des arêtes de T1 et de T2 sont les mêmes
(ces milieux sont aussi les centres de gravité des faces du cube) et que ces milieux
constituent les sommets d’un octaèdre régulier. Montrer que tout élément de G conserve
cet octaèdre. En déduire une injection naturelle du groupe du tétraèdre dans celui de
l’octaèdre.
7) Montrer que les groupes des isométries du cube et de l’octaèdre sont isomorphes.
Exercice 68. Isométries de l’hélice circulaire

Soit, dans l’espace affine euclidien E de dimension 3 rapporté à un repère ortho-
normé (O,~i, ~j, ~k), H l’hélice circulaire de représentation paramétrique x = R cos t, y =
R sin t, z = at, t ∈ R, où R et a sont deux réels strictement positifs donnés.
1) Montrer que toute isométrie de R est de la forme t 7−→ t + b ou t 7−→ 2b − t pour
un certain réel b.
2) Montrer que pour toute isométrie ϕ de R, il existe un et un seul déplacement
de E qui transforme, pour tout t ∈ R, le point de paramètre t de H en le point de
paramètre ϕ(t) de H. Un tel déplacement conserve donc l’hélice. Expliciter la nature
géométrique de ce déplacement (on discutera suivant la valeur de ϕ).
76
3) Montrer que toute isométrie conservant l’hélice H conserve l’axe Oz du repère. En

déduire que les déplacements décrits à la question précédente sont les seuls à conserver
H et que le groupe des déplacements de l’hélice est donc isomorphe au groupe des
déplacements de la droite.
4) Montrer qu’il n’existe pas d’antidéplacement de E qui conserve H.
Exercice 69. Montrer qu’une application f du plan complexe dans lui-même est affine
si et seulement si elle est de la forme f (z) = az + bz̄ + c pour 3 nombres complexes a, b
et c. Donner l’expression complexe de f~, ainsi qu’une condition nécessaire et suffisante
portant sur a et b pour que f soit bijective.
Exercice 70. Montrer que tout cercle du plan complexe est défini par une équation
de la forme z z̄ − az̄ − āz + c = 0, où a est un nombre complexe et c un réel vérifiant
c−|a|2 < 0. Montrer que réciproquement toute équation de ce type est celle d’un cercle.
Exercice 71. Soient a et b deux nombres complexes non nuls. Donner une condition
nécessaire et suffisante pour que |a + b| = |a| + |b|. Interpréter géométriquement cette
condition.
Exercice 72. Soient A, B, C trois points du plan complexe d’affixes respectives a, b, c.
1) Donner une condition nécessaire et suffisante sur a, b, c pour que l’origine O soit
le centre du cercle circonscrit au triangle ABC.
2) Donner une condition nécessaire et suffisante sur a, b, c pour que l’origine O soit
le centre de gravité du triangle ABC.
3) Donner une condition nécessaire et suffisante pour que la somme de trois nombres
complexes non nuls de même module soit nulle.
Exercice 73. Soient f et g les deux applications de C dans C définies par f (z) =
(1 + i)z − 1, g(z) = (1 − i)z − i. Donner la nature géométrique de f , g et g ◦ f (on
précisera les éléments caractéristiques de chacune de ces transformations).
Exercice 74. Déterminer la nature géométrique et les éléments caractéristiques des
applications f et g de C dans C définies par f (z) = 2j z̄ + j 2 et g(z) = j z̄ + j 2 , où
2iπ
j=e 3 .
Exercice 75. Soient A, B, A0 , B 0 quatre points distincts du plan d’affixes respectives
a, b, a0 , b0 .
1) Montrer l’équivalence de :
(i) l’unique similitude directe f transformant A en A0 et B en B 0 admet un point
fixe ;
(ii) l’unique similitude directe g transformant A en B et A0 en B 0 admet un point
fixe.
2) On suppose cette condition remplie. Donner les expressions complexes de f et
de g. Montrer que f et g ont même centre.
3) Retrouver géométriquement ce résultat.
77
Exercice 76. Montrer quatre points distincts d’affixes respectives z1 , z2 , z3 , z4 sont

(z3 − z1 )(z4 − z2 )
alignés ou cocycliques si et seulement si leur birapport est réel.
(z4 − z1 )(z3 − z2 )
Exercice 77. Théorème de Ptolémée
Soient A, B, C, D quatre points du plan complexe, d’affixes respectives a, b, c et d.
1) Montrer qu’on a toujours l’inégalité :
AC.BD ≤ AB.CD + AD.BC (∗)
(le produit des longueurs des diagonales d’un quadrilatère est inférieur à la somme des
produits des longueurs des côtés opposés).
2) Montrer qu’on a égalité dans (∗) si et seulement si les quatre points A, B, C, D
sont cocycliques ou alignés dans cet ordre.
Exercice 78. Montrer que toute application linéaire non nulle d’un espace vectoriel
euclidien dans lui-même qui préserve l’orthogonalité est une similitude.
Exercice 79. Donner une condition nécessaire et suffisante sur les affixes a, b, c de trois
points A, B, C du plan complexe pour que le triangle ABC soit équilatéral.
Exercice 80. On construit à l’extérieur d’un parallélogramme ABCD quatre carrés de

bases les côtés et de centres M , N , P , Q.
1) Calculer les affixes des points M , N , P , Q en fonction des affixes de A, B, C, D.

2) En déduire que M N P Q est un carré.
Exercice 81. À l’extérieur d’un triangle ABC, on construit trois carrés de bases les
côtés et de centres P , Q, R. Montrer que les segments [AP ] et [QR] (resp. [BQ] et [RP ],
[CR] et [P Q]) sont orthogonaux et de même longueur. En déduire que les droites (AP ),
(BQ) et (CR) sont concourantes.
78
2.3 QCM
rapporte 2 points.
Question 1. Soit E un espace vectoriel euclidien, A une partie non vide quelconque de
E, A⊥ son orthogonal.
A A = {0} si et seulement si A⊥ = E.
B (A⊥ )⊥ = A.
C A = E si et seulement si A⊥ = {0}.
D Si A est un sous-espace vectoriel de E, alors dim(A) = dim(A⊥ ).
E (A⊥ )⊥ = A si et seulement si A est un sous-espace vectoriel de E.
Question 2. Soit n ≥ 2 un entier et A une matrice carrée d’ordre n à coefficients réels.
A A est orthogonale si et seulement si det(A) = ±1.
B Si A est orthogonale, alors det(A) = 1.
C Si A est orthogonale, ses vecteurs lignes sont deux à deux orthogonaux.
D Si tA est orthogonale, alors A est orthogonale.
E Si les vecteurs colonnes de A sont deux à deux orthogonaux, alors A est ortho-
gonale.
Question 3. Soit E un espace vectoriel euclidien, (e1 , . . . , en ) une base orthonormée
de E, (v1 , . . . , vn ) une base quelconque de E, (e01 , . . . , e0n ) la base orthonormée de E
obtenue à partir de la base (v1 , . . . , vn ) par le procédé d’orthonormalisation de Gram-
Schmidt, P la matrice de passage de la base (e1 , . . . , en ) à la base (v1 , . . . , vn ), Q la
79
matrice de passage de la base (e1 , . . . , en ) à la base (e01 , . . . , e0n ), R la matrice de passage

de la base (v1 , . . . , vn ) à la base (e01 , . . . , e0n ).
A Q = RP .
B R est triangulaire inférieure.
C Q est orthogonale.
D det(P ) = det(R).
E Q = P R.
Question 4. Soit E un espace vectoriel euclidien, f une application linéaire de E dans
E.
A Si f est un endomorphisme symétrique de E, sa matrice dans toute base de E
est symétrique.
B S’il existe une base orthonormée de E dans laquelle la matrice de f est symé-
trique, alors la matrice de f dans toute base orthonormée de E est symétrique.
C Si f est symétrique, alors f est diagonalisable.
D Si f ◦ f = f , alors f est symétrique.
E Si f ◦ f = idE , alors f est symétrique.
Question 5. Soit E un espace vectoriel euclidien de dimension 3, u, v, w des vecteurs
quelconques de E.
A u ∧ v = 0 si et seulement si u et v sont colinéaires.
B det(u, v, u ∧ v) = 0.
C (u, v, u ∧ v) est une base orthonormée de E.
D det(u, v, w) = hv ∧ w, ui.
E (u ∧ v) ∧ w = u ∧ (v ∧ w).
Question 6. Dans un espace vectoriel euclidien de dimension 3 rapporté à une base
orthonormée,les matrices
 suivantes sont des matrices de rotations :
0 1 0
A A= 1 0 0 ;

0 0 1
 
0 1 1
B B = 1 0 0 ;
 
0 1 0
 
2 √0 √ 0
1
C C = 0 √2 √2;
2
0 2 − 2
 
0 0 1
D D = −1 0 0 ;
 
0 −1 0
 
−2 −1 2
1
E E=   2 −2 1.

3
1 2 2
80
Question 7. Tous les triangles considérés sont supposés non aplatis.

A Le centre du cercle circonscrit à un triangle est toujours intérieur à ce triangle.
B L’orthocentre d’un triangle est toujours intérieur à ce triangle.
C Le centre de gravité d’un triangle est toujours intérieur à ce triangle.
D Il existe un point du plan et un seul équidistant des trois droites portant les
côtés d’un triangle.
E Pour tout triangle, l’orthocentre, le centre de gravité et le centre du cercle
circonscrit sont alignés.
Question 8. On se place dans un plan affine euclidien.
A Le composé de deux rotations est toujours une rotation ou une translation.
B Étant donné deux droites sécantes, il existe toujours une rotation et une seule
transformant la première en la seconde.
C Étant donné deux points distincts, il existe toujours une réflexion et une seule
échangeant ces deux points.
D Le composé d’une réflexion et d’une translation est toujours une réflexion.
E Le composé d’une réflexion et d’une rotation est toujours une réflexion.
Question 9. On se place dans un espace affine euclidien de dimension 3.
A Si f et g sont deux rotations d’axes sécants, alors f ◦ g = g ◦ f .
B Si f et g sont deux rotations d’axes sécants, alors f ◦ g est une rotation.
C Si P et Q sont deux plans non parallèles, alors le composé des réflexions de
plans P et Q est une rotation.
D Le composé de deux demi-tours est toujours une rotation.
E Le composé d’une rotation et d’une symétrie centrale est une rotation ou un
vissage.
Question 10. On se place dans le plan complexe.
A L’application z 7→ 2z − z̄ est une similitude.
B L’application z 7→ 2z − 1 est une homothétie de centre z0 = −1.
C L’application z 7→ −z̄ est la réflexion d’axe Oy.
D L’application z 7→ −iz + 2 est une rotation d’angle droit.
E L’application z 7→ −2z̄ + 2 est une réflexion.
Réponses : 1–AE 2–CD 3–CE 4–BC 5–AD 6–DE 7–CE 8–AC 9–BC 10–CD
2.4 Devoir
répondu.
81
1. Rappeler la définition de l’orthogonal d’une partie d’un espace vectoriel euclidien

. Donner une relation entre les dimensions d’un sous-espace vectorielet de son
orthogonal.
2. Rappeler les définitions du produit mixte et du produit vectoriel dans un espace
vectoriel euclidien orienté de dimension 3. Donner une condition nécessaire et
suffisante sur deux vecteurs pour que la norme de leur produit vectoriel soit nulle
(resp. égale au produit de leurs normes).
3. Énoncer le théorème de diagonalisation des endomorphismes symétriques d’un
espace vectoriel euclidien . Caractériser la plus grande et la plus petite valeur
propre d’un endomorphisme symétrique f d’un tel espace E en fonction des
produits scalaires hx, f (x)i pour x ∈ E.
4. Soient a, b, c, a0 , b0 , c0 , a00 , b00 , c00 des réels. Montrer l’équivalence des deux proprié-
tés :

 a2+ b2 + c2 = a02 + b02 + c02 = a002 + b002 + c002 = 1
(P1 )
aa0 + bb0 + cc0 = a0 a00 + b0 b00 + c0 c00 = aa00 + bb00 + cc00 = 0
et

 a2+ a02 + a002 = b2 + b02 + b002 = c2 + c02 + c002 = 1
(P2 )
ab + a0 b0 + a00 b00 = bc + b0 c0 + b00 c00 = ac + a0 c0 + a00 c00 = 0 .
5. Donner l’écriture complexe d’une similitude directe du plan complexe. Déterminer

les éléments caractéristiques (rapport, angle, points fixes) d’une similitude directe
donnée sous forme complexe.
Exercice 1 : Soit A et B deux points distincts du plan affine euclidien E et k un réel
strictement positif différent de 1. On se propose d’étudier l’ensemble Γ des points M
MA
de E vérifiant =k:
MB
MA

Γ= M ∈ E =k .
MB
1. Montrer qu’un point M du plan appartient à Γ si et seulement si les vecteurs
−−→ −−→ −−→ −−→
M A − k M B et M A + k M B sont orthogonaux.
−→ −→
2. Montrer qu’il existe un point J (resp. K) du plan et un seul tel que JA − k JB =
~0 (resp. −
−→ −−→
KA + k KB = ~0). Exprimer, pour tout point M du plan, le vecteur
−−→ −−→ −−→ −−→ −−→ −−→
M A − k M B (resp. M A + k M B) en fonction du vecteur M J (resp. M K).
3. En déduire que Γ est un cercle dont on précisera le centre.
4. Soit G le barycentre du système pondéré [(A, 1), (B, −k 2 )]. Exprimer, pour tout
point M du plan, M A2 − k 2 M B 2 en fonction de M G2 , GA2 et GB 2 . Retrouver
ainsi le résultat de la question précédente.
82
5. Montrer que la puissance pΓ (I) du milieu I de [AB] par rapport au cercle Γ

est égale à IA2 . En déduire que le cercle Γ et le cercle de diamètre [AB] sont
orthogonaux.
6. Montrer que tout cercle passant par les deux points A et B est orthogonal à Γ.
Exercice 2 :
Le but de cet exercice est d’étudier le groupe des isométries du tétraèdre régulier
et en particulier de montrer que ce groupe est isomorphe au groupe S4 des permuta-
tions de quatre éléments. On considère donc un tétraèdre régulier ABCD de l’espace
affine euclidien E de dimension 3 et on note G le groupe des isométries de E laissant
globalement invariant l’ensemble {A, B, C, D} des sommets de ce tétraèdre. On note
G+ le sous-ensemble de G constitué des isométries directes et G− le sous-ensemble de
G constitué des isométries indirectes.
1. Montrer qu’il existe un point O de E fixe par tout élément de G.
2. Montrer que tout élément g de G induit une permutation ϕ(g) des sommets du
tétraèdre et que l’application ϕ ainsi définie est un homomorphisme injectif du
groupe G dans le groupe S des permutations de ces sommets.
3. Soit I le milieu du segment [AB]. Montrer que le plan (CDI) est le plan médiateur
de [AB]. En déduire qu’il existe dans G une réflexion échangeant les points A et
B et laissant fixes C et D.
4. Montrer que l’image ϕ(G) de ϕ contient toutes les transpositions des sommets. En
déduire que ϕ est surjectif. On rappelle qu’une transposition est une permutation
échangeant deux éléments et laissant les autres fixes et que les transpositions
engendrent le groupe symétrique.
5. En déduire les cardinaux de G, G+ et G− et montrer que l’image ϕ(G+ ) de G+
par ϕ est égale au groupe alterné (sous-groupe de S constitué des permutations
de signature +1).
6. Montrer que tous les éléments de G+ autres que l’identité sont des rotations.
Préciser les axes et les angles de ces rotations.
7. Montrer que G− contient exactement 6 réflexions dont on précisera les plans.
Donner la nature géométrique et l’ordre dans le groupe G des autres éléments de
G− .

1. L’orthogonal d’une partie A d’un espace vectoriel euclidien E est l’ensemble des
vecteurs de E orthogonaux à tout vecteur de A :
A⊥ = {u ∈ E | hu, xi = 0 ∀x ∈ A} .
83
C’est un sous-espace vectoriel de E.

Si F est un sous-espace vectoriel de E, on a dim(F ⊥ ) = dim(E) − dim(F ).
2. Le produit mixte det(u, v, w) de trois vecteurs u, v, w d’un espace vectoriel eucli-
dien orienté de dimension 3 est le déterminant de ces trois vecteurs évalué dans
une base orthonormée directe (ce déterminant ne dépend pas du choix d’une telle
base).
Le produit vectoriel de deux vecteurs u et v d’un tel espace E est l’unique vecteur
u ∧ v vérifiant det(u, v, x) = hu ∧ v, xi pour tout vecteur x de E.
3. Pour tout endomorphisme symétrique f d’un espace vectoriel euclidien E, il existe
une base orthonormée de E constituée de vecteurs propres de f . La matrice de
f dans une telle base est donc diagonale.
La plus grande et la plus petite des valeurs propres de f sont données par
hx, f (x)i
λmax = sup = sup hx, f (x)i .
x6=0 kxk2 kxk=1
resp.
hx, f (x)i
λmin = inf = inf hx, f (x)i .
x6=0 kxk2 kxk=1
 
a b c
4. Soit A la matrice A =  a b0 c0 . Les relations P1 (resp. P2 ) expriment que
 0 
a00 b00 c00

A tA = I3 (resp. tAA = I3 ). Elles sont donc vérifiées si et seulement si A est
inversible et a pour inverse sa transposée, i.e. si et seulement si A est orthogonale,
et sont donc équivalentes.
5. Toute similitude directe du plan complexe s’écrit sous la forme z 7→ az + b
pour un nombre complexe b et un nombre complexe non nul a. Le rapport d’une
telle similitude est |a| et son angle Arg(a). Elle admet comme unique point fixe
b
z= si a 6= 1. Si a = 1 et b 6= 0, la similitude est une translation de vecteur
1−a
non nul et n’admet pas de point fixe. Si a = 1 et b = 0, c’est l’identité et tout
point est fixe.
Exercice 1 :
1. Un point M de E appartient à Γ si et seulement si M A2 − k 2 M B 2 = 0, soit
−−→ −−→ −−→ −−→
encore (M A − k M B) · (M A + k M B) = 0.
−→ −→
2. L’égalité JA − k JB = ~0 signifie que J est le barycentre du système pondéré
[(A, 1), (B, −k)]. Ce barycentre existe et est unique puisque 1 − k 6= 0. On a
alors, pour tout point M de E :
−−→ −−→ −−→ −→ −−→ −→ −−→
M A − k M B = (M J + JA) − k(M J + JB) = (1 − k)M J .
84
De même, le point K est le barycentre du système pondéré [(A, 1), (B, k)] et on
a, pour tout point M de E :
−−→ −−→ −−→ −−→ −−→ −−→ −−→
M A + k M B = (M K + KA) + k(M K + KB) = (1 + k)M K .
−−→ −−→ −−→ −−→
3. L’orthogonalité des vecteurs M A − k M B et M A + k M B équivaut donc à l’or-
−−→ −−→
thogonalité des vecteurs M J et M K. Un point M de E appartient à Γ si et
seulement si ces vecteurs sont orthogonaux, on en déduit que Γ est le cercle de
diamètre [JK]. Son centre est le milieu de ce segment et appartient donc à la
droite (AB), puisque ces deux points sont situés sur cette droite (K appartient
au segment [AB] et J au complémentaire de ce segment dans la droite).
4. Le barycentre du système pondéré [(A, 1), (B, −k 2 )] est bien défini puisque 1 −
k 2 6= 0. On a :
−−→ −→ −−→ −−→
M A2 − k 2 M B 2 = (M G + GA)2 − k 2 (M G + GB)2
−−→ −→ −−→ −−→
= M G2 + 2 M G · GA + GA2 − k 2 (M G2 + 2 M G · GB + GB 2 )
= (1 − k 2 ) M G2 + GA2 − k 2 GB 2
−→ −−→
puisque GA − k 2 GB = ~0.
Un point M de E appartient à Γ si et seulement si M A2 − k 2 M B 2 = 0, i.e. si et
seulement si
k 2 GB 2 − GA2
M G2 =
1 − k2
ce qui montre que Γ est un cercle de centre G (Γ n’est pas vide puisqu’il contient
les deux points J et K). On pouvait vérifier directement que G est le milieu du
segment [JK], cette propriété découle aussi des deux dernières questions.
−
→ −→
5. La puissance pΓ (I) du milieu I de [AB] par rapport au cercle Γ est égale à IJ · IK,
puisque la droite (AB) coupe le cercle Γ en J et K.
En faisant M = I dans le résultat de la question 2, on obtient les relations
−
→ − → −→
(1 − k) IJ = IA − k IB
−→ − → −→
(1 + k) IK = IA + k IB .
Il en résulte
−
→ −→ −
→ −→ −→ −→
(1 − k 2 ) IJ · IK = (IA − k IB) · (IA + k IB)
= IA2 − k 2 IB 2
= (1 − k 2 ) IA2
puisque IA = IB, d’où pΓ (I) = IA2 , ce qui montre que le cercle Γ et le cercle de
diamètre [AB] sont orthogonaux.
85
6. La puissance du centre G du cercle Γ par rapport au cercle de diamètre [AB] est

égale au carré R2 du rayon de Γ, puisque ces deux cercles sont orthogonaux. Mais
la puissance de G par rapport à tout cercle passant par les deux points A et B
est égale à la puissance de G par rapport au cercle de diamètre [AB], puisqu’elle
−→ −−→
vaut GA · GB. Il en résulte que Γ est orthogonal à tout cercle passant par A et
B.
Exercice 2 :
1. L’isobarycentre O des sommets A, B, C, D du tétraèdre est fixe par tout élément
de G, puisqu’une isométrie est une transformation affine et qu’une transformation
affine conserve les barycentres.
2. Tout élément de G permute les sommets du tétraèdre et induit donc une permu-
tation de l’ensemble {A, B, C, D}. L’application ϕ qui associe à tout élément de
G sa restriction à l’ensemble {A, B, C, D} est un homomorphisme du groupe G
dans le groupe S des permutations de ces sommets. Cet homorphisme est injec-
tif, puisque (A, B, C, D) constitue un repère affine de E et qu’une transformation
affine est entièrement déterminée par les images des points d’un repère affine.
3. Le tétraèdre ABCD étant régulier, on a CA = CB et DA = DB, ce qui montre
que C et D appartiennent au plan médiateur du segment [AB]. Le milieu I de
[AB] appartient également à ce plan. Les trois points C, D, I ne sont pas alignés
et déterminent donc un plan, qui est le plan médiateur de [AB]. Ce plan est
perpendiculaire en I à la droite (AB) et la symétrie orthogonale par rapport à
ce plan échange les points A et B. Elle laisse fixe les points C et D et a donc
comme image par ϕ la transposition échangeant A et B.
86
4. En procédant de même avec les autres arêtes du tétraèdre, on voit que G contient
6 réflexions de plans les plans médiateurs des 6 arêtes, dont les images par ϕ sont
les 6 transpositions que contient le groupe S. Ces transpositions engendrent le
groupe S. Comme l’image ϕ(G) du groupe G par l’homomorphisme de groupes
ϕ est un sous-groupe de S, cette image est égale à S. L’homomorphisme ϕ est
donc surjectif ; comme il est injectif, c’est un isomorphisme de G sur S.
5. Il en résulte que G, étant en bijection avec S, a même cardinal que S, i.e. 4 !=24.
G est réunion disjointe de G+ et de G− et ces deux ensembles ont le même
nombre d’éléments : en effet G− n’est pas vide, puisqu’il contient les 6 réflexions
précédemment trouvées et l’application g 7→ s ◦ g, où s est l’une quelconque de
ces réflexions, est une bijection de G+ sur G− . Il en résulte que G+ et G− ont
tous deux 12 éléments.
6. Les éléments de G+ autres que l’identité sont des déplacements de E ayant un
point fixe O, donc des rotations d’axes passant par O. Pour chaque sommet
du tétraèdre, la perpendiculaire à la face opposée à ce sommet passant par ce
sommet rencontre la face opposée au centre de gravité de cette face. Les rotations
2π
d’angles ± autour de cet axe appartiennent donc à G. Leurs images par ϕ sont
3
les 8 cycles de longueur 3 que contient S. Par ailleurs, les demi-tours d’axes les
bimédianes du tétraèdres (droites joigant les milieux de deux arêtes opposées)
appartiennent à G, puisque ces bimédianes sont perpendiculaires aux arêtes dont
elles joignent les milieux (par exemple si J est le milieu de [CD], la droite (IJ)
est incluse à la fois dans le plan médiateur de [AB] et dans le plan médiateur de
[CD]). On obtient ainsi 3 demi-tours d’axes les 3 bimédianes, dont les images par
ϕ sont les 3 produits de deux transpositions de supports disjoints que contient S.
Le groupe G+ des déplacements conservant le tétraèdre contient donc 8 éléments
d’ordre 3, 3 éléments d’ordre 2 et un élément d’ordre 1 (l’identité).
7. On a déjà vu que G− contenait 6 réflexions de plans les plans médiateurs des
arêtes du tétraèdre. L’image par ϕ d’une réflexion est un élément d’ordre 2 de S,
c’est-à-dire une transposition ou un produit de deux transpositions de supports
disjoints. G ne peut donc contenir d’autre réflexions que les 6 déjà trouvées. Les
autres éléments de G sont donc des antirotations d’axes et de plans passant par
O. Ils ont pour images par ϕ les 6 permutations circulaires des quatre sommets et
sont donc d’ordre 4 dans G. Si s ◦ r = r ◦ s est la décomposition canonique d’une
telle antirotation, avec s une réflexion et r une rotation d’axe perpendiculaire au
plan de la réflexion, (s ◦ r)2 = r2 doit être un élément d’ordre 2 de G+ , i.e. un
des trois demi-tours d’axes les bimédianes. La rotation r a donc pour axe une
π
bimédiane et pour angle ± et le plan de s est le plan perpendiculaire en O à
2
cette bimédiane, i.e. le plan médiateur du segment joignant les milieux de deux
arêtes opposées (ce plan contient les milieux des 4 autres arêtes).
87
3 Compléments
3.1 Constructions à la règle et au compas
Pendant des siècles, les Éléments d’Euclide ont été le livre de référence en géométrie.
Ce traité, écrit vers 300 avant J.-C., constitue la première tentative connue d’une
présentation axiomatique de la géométrie. Toutes les constructions y sont effectuées à
la règle et au compas et les problèmes de construction à la règle et au compas sont restés
longtemps au cœur des problèmes de la géométrie classique, en raison non seulement
de la simplicité de ces instruments, mais aussi de la pureté mathématique des objets
qu’ils permettent de construire, les droites et les cercles.
Très vite cependant, les grecs se sont aperçus de la difficulté de tracer certaines
figures au seul moyen de ces seuls instruments. Trois problèmes classiques de la géo-
métrie grecque sont ainsi restés célèbres : celui de la quadrature du cercle, dont le
nom est passé dans le langage courant pour désigner une tâche impossible, celui de la
duplication du cube, et celui de la trisection de l’angle.
Le premier consiste à construire √ un carré de même aire qu’un disque donné (au-
trement dit à construire le nombre π), le second à construire l’arête√d’un cube de
volume double d’un cube donné (autrement dit à construire le nombre 3 2), et le der-
nier à diviser en trois angles égaux un angle donné, toutes ces constructions devant
s’effectuer à la règle et au compas seuls.
Précisons ce qu’on entend par construction à la règle et au compas : il s’agir de
construire, à partir d’un certain nombre de points donnés, d’autres points au moyen
d’une règle non graduée et d’un compas fixe (il est impossible de reporter des distances
au moyen d’un tel compas, la seule opération possible est de tracer un cercle de centre
déjà construit passant par un point déjà construit).
Un autre problème classique est celui de la construction des polygones réguliers. Il
est facile de construire à la règle et au compas un triangle équilatéral ou un carré, et,
par suite, les polygones réguliers à 6, 12, 8, 16, . . . côtés (comme la construction des
bissectrices se fait aisément à la règle et au compas, si on sait construire un polygone
régulier à n côtés, on sait construire les polygones réguliers à 2a n côtés pour tout
entier a). Pour le pentagone régulier, c’est un peu plus difficile, mais la construction
figurait déjà dans les Éléments. Le problème de la construction de l’heptagone (polygone
régulier à 7 côtés) a tenu longtemps les géomètres en échec et les grecs avaient sans
doute déjà pressenti l’impossibilité de sa construction.
Mais la démonstration de l’impossibilité de ces constructions nécessitait l’introduc-
tion d’outils mathématiques nouveaux, des outils issus de l’algèbre, en particulier la
théorie des corps, outils qui ne se sont développés qu’au début du XIXième siècle.
Il fallut en effet attendre plus de vingt siècles pour que C. F. Gauss (1777-1855)
démontre, en 1796, alors qu’il était âgé de 18 ans et encore étudiant à l’Université de
Göttingen, que l’on pouvait construire à la règle et au compas un polygone régulier à 17
côtés. Quelques années à peine plus tard, en 1801, il énonce dans son livre Disquisitiones
88
Arithmeticae le théorème suivant :

Théorème 4. Un polygone régulier à n côtés peut être construit à la règle et au compas
si et seulement si n se décompose sous la forme
n = 2r p1 . . . ps
où r est un entier positif ou nul et les pi (i = 1, . . . , r) des nombres premiers de Fermat

distincts.
(Un nombre premier est dit de Fermat s’il est de la forme 2a + 1 pour un entier
a. On montre assez facilement qu’alors a doit être une puissance de 2, mais tous les
m
nombres de la forme 22 ne sont pas premiers. En fait les seuls nombres de Fermat
premiers connus sont 3, 5, 17, 257 et 65 537, correspondant à m = 0, 1, 2, 3, 4.)
En fait, Gauss démontre seulement que la condition énoncée est suffisante et conjec-
ture qu’elle est nécessaire. C’est P.-L. Wantzel (1814-1848) qui en a démontré la né-
cessité en 1827, alors qu’il était encore élève-ingénieur des Ponts et Chaussées. C’est
pourquoi ce théorème est connu sous le nom de théorème de Gauss-Wantzel.
Il en découle immédiatement qu’il n’est pas possible de construire à la règle et au
compas un polygone régulier à 9 côtés, et donc de trisecter un angle de π/3, d’où :
Corollaire 12. Il est impossible de trisecter tous les angles à la règle et au compas.
Pour le problème de la quadrature du cercle, il faudra attendre la démonstration en
1882 de la transcendance de π par F. von Lindemann (1852-1939) pour en démontrer
l’impossibilité. Un nombre est dit algébrique s’il est racine d’une équation polynomiale
à coefficients entiers, transcendant√ sinon. Tous les nombres constructibles à la règle et
au compas sont algébriques, et si π était algébrique, π le serait aussi, ce qui démontre
l’impossibilité de la quadrature du cercle.
Constatant (sans savoir la démontrer) l’impossibilité de certaines de ces construc-
tions, les grecs avaient essayé de contourner le problème en autorisant d’autres ins-
truments que la règle et le compas, en particulier l’utilisation de courbes auxiliaires
tracées, soit point par point, soit mécaniquement.
À l’opposé, on peut se demander lesquelles de ces constructions restent possibles à

l’aide, soit du compas seul, soit de la règle seule.
Pour le compas, la réponse est simple :
Théorème 5. Toute construction d’un point du plan pouvant être effectuée à la règle
et au compas peut être effectuée au compas seul.
Ce théorème, démontré en 1797 par l’italien L. Mascheroni (1750-1800) dans son
livre Geometria del Compasso, est aujourd’hui appelé théorème de Mohr-Mascheroni.
On a en effet découvert depuis que les résultats de Mascheroni avaient été largement an-
ticipés dans un livre publié en 1672 à Amsterdam par le mathématicien danois G. Mohr
(1640-1697) et intitulé Euclides Danicus.
89
Démontrer la possibilité d’une telle construction est une chose, la réaliser en pra-
tique n’est pas forcément aussi simple (essayez déjà de construire par vous-mêmes au
compas seul le milieu d’un segment . . .). On attribue souvent à Napoléon le problème
de construire au compas seul le centre d’un cercle donné.
Quant aux constructions à la règle seule, on constate immédiatement qu’il n’est
pas possible de construire grand-chose si on ne se donne pas un nombre suffisant de
points au départ (si on part des seuls sommets d’un triangle, on ne peut pas construire
d’autres points). On démontre en fait le résultat suivant :
Proposition 81. Si on se donne les quatre points du plan de coordonnées (1, 0), (0, 1),
(0, 2) et (2, 0), les points constructibles à la règle seule sont exactement les points du
plan dont les deux coordonnées sont rationnelles.
Pour aller plus loin, il faut se donner plus de points au départ. On a en particulier
le théorème de Poncelet-Steiner :
Théorème 6. Tout point constructible à la règle et au compas peut être construit à la
règle seule à condition que soit donné dans le plan un cercle et son centre.
3.2 Frises et pavages

En architecture, une frise est une bande horizontale ornée d’un décor, généralement
constitué par la répétition d’un même motif. Le groupe des isométries conservant une
telle figure contient donc une translation dans une direction (mais pas dans deux di-
rections, sinon la frise ne pourrait être contenue dans une bande), et par conséquent
un sous-groupe de translations isomorphe à Z.
On est ainsi amené à appeler groupe de frise un groupe d’isométries du plan dont le
sous-groupe des translations est monogène, c’est-à-dire isomorphe à Z. Si on prend un
motif et si on représente les images de ce motif par toutes les isométries d’un groupe
de frise, on obtient un dessin contenu dans une bande, qui se répète périodiquement
comme une frise.
Un groupe de frise est un sous-groupe du groupe des isométries conservant un
réseau linéaire, c’est-à-dire la figure constitué des images d’un point A0 par toutes les
translations de vecteur k~u, où ~u est un vecteur non nul et k décrit Z. Un tel groupe
ne peut contenir que des translations de vecteur k~u (k ∈ Z), des symétries centrales
de centre situé sur la droite D définie par A0 et le vecteur directeur ~u, des réflexions
d’axe D ou orthogonal à D, des symétries glissées d’axe D et de vecteur k~u/2.
On montre plus précisément qu’il existe exactement 7 types de groupes de frise,
illustrés par les figures suivantes (les transformations appartenant au groupe sont exac-
tement celles qui laissent la frise invariante) :
... P P P P P ...
90
P P
... P P P ...
... B B B B B ...
... A A A A A ...
... S S S S S ...
A A
... A A A ...
... H H H H H ...
De même, on appelle groupe de pavage (en anglais : wallpaper group) ou groupe cris-
tallographique du plan un groupe d’isométries planes qui laisse invariant un réseau (i.e.
un sous-groupe additif de R2 engendré par deux vecteurs linéairement indépendants)
et contient deux translations de vecteurs linéairement indépendants.
Étant donné un tel groupe, on montre en effet qu’il existe un polygone plein (un
pavé de base) tel que ses images par tous les éléments du groupe recouvrent le plan
sans se chevaucher.
On montre qu’il y a 17 types de groupes de pavage. La plupart de ces groupes étaient
connus depuis fort longtemps de manière empirique par les mosaïstes et les décorateurs.
On peut ainsi en retrouver un grand nombre dans les mosaïques ornant l’Alhambra de
Grenade (la discussion est encore ouverte parmi les historiens pour savoir si ces dix-sept
groupes y sont effectivement tous représentés).
Vous pouvez télécharger aux adresses suivantes des logiciels libres vous permettant
de réaliser vous-mêmes vos propres pavages ou vos propres frises :
http://www.geom.uiuc.edu/java/Kali/welcome.html
http://www.morenaments.de/
La classification complète de ces groupes est un peu fastidieuse. Une des premières
étapes dans cette classification consiste à montrer que les seules rotations pouvant
appartenir à un tel groupe sont d’ordre 2, 3, 4 ou 6 (i.e. ont pour angle un multiple de
π/2 ou π/3). En particulier, un tel groupe ne peut contenir une rotation d’angle 2π/5.
Il existe cependant des pavages du plan invariants par une rotation d’ordre 5, mais
ces pavages ne sont pas périodiques. Les plus connus sont les pavages de Penrose (Roger
Penrose, né en 1931, est un physicien et mathématicien britannique), dont certains sont
représentés ci-dessous. Conçus au départ comme de simples jeux de l’esprit, ils sont
apparus par la suite comme un modèle possible des quasi-cristaux après la découverte
de ces derniers par les physiciens en 1984.
91
3.3 Polyèdres réguliers

Si dans le plan il existe une infinité de polygones réguliers (pour chaque entier n ≥ 3,
il existe un polygone régulier convexe à n sommets et n côtés, et un seul à similitude
près), la situation est très différente dans l’espace. En effet il n’existe, à similitude
près, que 5 types de polyèdres réguliers convexes : le tétraèdre, le cube, l’octaèdre, le
dodécaèdre et l’icosaèdre. Ces polyèdres sont connus depuis l’antiquité : un dialogue
de Platon, le Timée, les mentionne déjà, plus de trois siècles avant notre ère, d’où le
nom de solides platoniciens qui leur est parfois donné. De nombreuses interprétations
ésotériques leur ont par la suite été données au fil des siècles.
Avant de donner une indication de démonstration de ce résultat, il convient de

définir ce qu’on entend par polyèdre régulier. Il ne suffit pas en effet de demander que
les faces soient toutes des polygones réguliers convexes isométriques : en collant deux
tétraèdres réguliers isométriques selon une face, on obtient un polyèdre dont toutes les
faces sont des triangles équilatéraux isométriques, mais en 3 sommets aboutissent 4
faces, alors qu’en les 2 autres sommets n’en aboutissent que 3. Il faut donc demander
de plus qu’en chaque sommet aboutissent le même nombre de faces.
Une première démonstration consiste à admettre le fait, assez intuitif, que la somme
des angles des faces aboutissant en un sommet doit être strictement inférieure à 2π. En
notant p le nombre de sommets de chaque face et q le nombre d’arêtes (ou de faces)
aboutissant en un sommet, on obtient alors l’inégalité
(p − 2)π
q < 2π
p
soit encore qp − 2q − 2p < 0 ou (p − 2)(q − 2) < 4, puisque les angles d’un polygone
(p − 2)π
régulier convexe à p côtés ont tous pour mesure . Il en résulte facilement que
p
les faces ne peuvent être que des triangles équilatéraux, des carrés ou des pentagones
réguliers.
92
Une autre démonstration repose sur la formule d’Euler pour les polyèdres convexes :
si on note s le nombre de sommets, a le nombre d’arêtes et f le nombre de faces d’un tel
polyèdre, Euler a remarqué que s − a + f = 2 pour tout polyèdre convexe de l’espace.
Chaque arête est commune à 2 faces et relie 2 sommets. On obtient ainsi, en comp-
tant de deux manières le nombre d’arêtes, les relations
2a = pf = qs .
Mais d’après la formule d’Euler

2a 2a
−a+ =2
q p
ou encore
1 1 1 1 1
+ = + > .
q p 2 a 2
Comme p et q sont tous deux supérieurs ou égaux à 3, il en résulte que le couple (p, q)
ne peut prendre que l’une des 5 valeurs (3, 3), (3, 4), (3, 5), (4, 3), (5, 3).
Solide s a f
Tétraèdre 4 6 4
Cube 8 12 6
Octaèdre 6 12 8
Dodécaèdre 20 30 12
Icosaèdre 12 30 20
Une fois démontré qu’il ne peut exister plus de 5 types de polyèdres réguliers, il
faut encore les construire. C’est élémentaire pour le cube, le tétraèdre et l’octaèdre, un
peu moins pour le dodécaèdre et l’icosaèdre.
93
On remarque que p et q jouent des rôles symétriques dans les formules précédentes,
ainsi que s et f . Géométriquement, cette remarque s’interprète de la façon suivante :
les centres des faces d’un de ces polyèdres réguliers sont les sommets d’un autre poly-
èdre régulier, et en réitérant l’opération on retombe sur un polyèdre homothétique au
polyèdre de départ. On obtient ainsi une dualité entre les polyèdres réguliers, le cube
étant dual de l’octaèdre et l’icosaèdre du dodécaèdre, le tétraèdre étant quant à lui son
propre dual.
94
3.4 Géométrie sphérique

On peut faire de la géométrie à la surface d’une sphère comme on en fait dans
le plan euclidien. Cette géométrie, appelée géométrie sphérique, a toujours joué un
rôle fondamental en navigation et en astronomie. Elle fournit également un modèle
de géométrie dans lequel le cinquième postulat d’Euclide sur l’existence des parallèles
n’est pas vérifié (une telle géométrie est dite non-euclidienne).
En géométrie euclidienne classique, le chemin le plus court entre deux points est le
segment joignant ces points. La droite s’obtient en prolongeant ce segment. On appelle,
sur une surface S, géodésique un chemin de longueur minimale parmi tous les chemins
tracés sur cette surface reliant deux points donnés. Les géodésiques jouent donc sur une
surface le rôle que tiennent les segments de droites dans le plan euclidien. La distance
entre deux points de la surface est alors la longueur d’une géodésique reliant ces deux
points.
Dans le cas où cette surface est une sphère, on montre que les géodésiques sont
exactement les arcs de grands cercles tracés sur cette sphère (un grand cercle d’une
sphère est l’intersection de cette sphère avec un plan passant par son centre) de longueur
inférieure ou égale à πR, où R est le rayon de la sphère. Les grands cercles jouent donc
sur une sphère le rôle des droites dans le plan.
On voit immédiatement que, par deux points non diamétralement opposés d’une
sphère, il passe un grand cercle et un seul, qui est l’intersection de la sphère avec le
plan défini par les deux points et le centre de la sphère. Il n’existe donc pas sur la
sphère de parallèles (au sens de la géométrie euclidienne plane classique : des droites
qui ne se rencontrent pas). Cependant, par deux points diamétralement opposés de la
sphère, il passe une infinité de grands cercles, ce qui montre que la géométrie sphérique
ne satisfait pas non plus le premier axiome d’Euclide (par deux points, il passe une
droite et une seule). On peut cependant construire, à partir de la sphère, un modèle de
95
géométrie non-euclidienne satisfaisant ce premier axiome (mais pas celui des parallèles)
en identifiant les points diamétralement opposés (nous ne développerons pas ici cette
construction).
On peut étudier en géométrie sphérique la plupart des problèmes de la géométrie
euclidienne plane classique, à commencer par ceux concernant les triangles. On appelle,
sur une sphère, triangle sphérique la figure formée par trois points de la sphère (les
sommets), les côtés étant les géodésiques joignant ces points. Les angles d’un triangle
sphérique sont les angles formés par les tangentes à ses côtés en ses sommets. Les
triangles sphériques ont cependant des propriétés bien différentes des triangles usuels
de la géométrie plane.
En premier lieu, en géométrie euclidienne plane, la somme des angles d’un triangle
est toujours égale à π. En géométrie sphérique, cette somme peut varier : elle est
toujours supérieure ou égale à π, et la différence entre cette somme et π est l’aire du
triangle (en supposant que la sphère est de rayon unité). L’aire d’un triangle sphérique
est donc complètement déterminée par ses angles.
C’est la formule de Girard (Albert Girard, 1595-1632, mathématicien français ayant
travaillé principalement aux Pays-Bas) :
Proposition 82. L’aire d’un triangle sphérique ABC d’angles α, β, γ d’une sphère
de rayon 1 est donnée par
aire(ABC) = α + β + γ − π .
−→ −−→ −→
En particulier, si le repère (O, OA, OB, OC) est orthonormal, les trois angles α, β,
γ du triangle sphérique ABC sont droits. Il en résulte que l’aire d’un triangle sphérique
trirectangle est égale à π/2, ce qui était immédiat, puisque la sphère est réunion de 8
triangles sphériques isométriques au précédent et que son aire totale est 4π.
Pour démontrer cette formule, on commence par remarquer que l’aire d’un fuseau de
la sphère unité d’angles α est égale à 2απ (un fuseau d’une sphère est une des portions
de cette sphère délimitées par deux demi-grands cercles de mêmes extrémités) : en effet
cette aire est proportionnelle à α et pour α = 2π, c’est l’aire totale de la sphère.
96
On construit alors à partir d’un triangle sphérique ABC trois fuseaux de sommets
A, B, C (voir figures). Ces fuseaux recouvrent la réunion d’une demi-sphère et du tri-
angle symétrique de ABC par rapport au centre de la sphère ; de plus le triangle ABC
lui-même est recouvert deux fois, si bien qu’on obtient la formule 2π+2S = 2α+2β +2γ
(où S est l’aire du triangle sphérique ABC), équivalente à la formule de Girard.
On peut également faire de la trigonométrie sur la sphère comme on en fait dans le
plan. Donnons simplement une formule qui relie les longueurs des côtés d’un triangle
sphérique aux mesures de ses angles (la longueur a du côté BC d’un triangle sphérique
ABC de la sphère unité est la mesure de l’angle au centre BOC)
\ :
Proposition 83. Formule fondamentale de la trigonométrie sphérique

Soit ABC un triangle sphérique de la sphère unité, a, b, c les longueurs de ses côtés,
α, β, γ les mesures de ses angles. Alors :
cos c = cos a cos b + sin a sin b cos γ
Il résulte en particulier de cette égalité que cos c est toujours compris entre cos(a+b)
et cos(a − b). On peut en déduire les inégalités
a + b + c ≤ 2π, a ≤ b + c, b ≤ c + a, c≤a+b.
3.5 Cartographie
Si on assimile la surface de la terre à une sphère (elle est en fait plus proche d’un
ellipsoïde légèrement aplati aux pôles), le problème de la cartographie est de représenter
tout ou partie du globe terrestre sur une surface plane. Or on peut montrer qu’il n’est
pas possible d’appliquer un domaine d’une sphère sur un plan sans déformation : on
ne peut conserver à la fois les distances, les aires, les angles. Il importe donc de faire
un choix.
Une projection est dite conforme si elle conserve les angles (en particulier, les pa-
rallèles et les méridiens se coupent à angle droit), équivalente si elle conserve les aires.
97
Une projection quelconque ne conserve ni les aires, ni les angles, mais peut constituer
un bon compromis entre ces deux exigences.
On peut par ailleurs projeter directement la sphère sur un plan (en général un
plan tangent) ou sur une surface développable, c’est-à-dire une surface que l’on peut
développer sans déformation sur un plan (un cylindre ou un cône, en général tangent
ou presque à la sphère) et développer ensuite la figure obtenue. Le choix du centre et
du type de projection est également important. C’est ainsi que plusieurs milliers de
types de projection ont été développés par les géographes au cours du temps.
Si on veut représenter une petite surface du globe, le résultat diffère en général
peu, car la projection entraîne peu de distorsions. S’il s’agit par contre de représenter
une grande partie (voire la totalité : planisphère ou mappemonde) du globe terrestre,
les distorsions deviennent beaucoup plus importantes et des systèmes de projection
distincts mènent à des résultats radicalement différents.
Un des plus anciens systèmes de projection, encore utilisé de nos jours pour repré-
senter une grande partie du globe, est le système de Mercator, établi en 1569 par le
géographe flamand Gerardus Mercator (1512-1594).
L’idée était d’établir une représentation conforme de la terre, de sorte que les loxo-
dromies (courbes faisant un angle constant avec les méridiens) apparaissent sous forme
de droites. Ces trajets entre deux points, même s’ils ne sont pas les plus courts (les
trajets les plus courts sont, comme on l’a vu, les arcs de grands cercles, appelés ortho-
dromies en navigation), sont faciles à suivre par les navigateurs, puisqu’ils se font en
maintenant le cap constant. Par contre, la carte de Mercator ne respecte ni les distances,
ni les aires, si bien que les territoires ne sont pas représentés proportionnellement à leur
importance réelle.
Pour établir une carte en projection de Mercator, on commence par projeter le
surface de la terre sur un cylindre tangent le long de l’équateur, et on développe ensuite
ce cylindre en le découpant le long d’une génératrice. Les méridiens sont ainsi espacés
régulièrement, tandis que l’espace entre les parallèles croît à mesure que l’on s’approche
98
des pôles (on ne représente en général pas toute la surface de la terre, mais on se limite
aux zones habitées).
Les formules exprimant les coordonnées (x, y) du point projeté en fonction de la
latitude θ et de la longitude ϕ d’un point de la terre sont alors
!!
θ π
x = ϕ, y = ln tan + .
2 4
Ces formules s’obtiennent en exprimant la conservation des angles (la dérivée de y par
1
rapport à θ est ).
cos θ
Naturellement, Mercator ne connaissait pas les logarithmes (la première table de
logarithmes a été publiée en 1614 par John Napier) et encore moins le calcul différentiel
(apparu seulement à la fin du XVIIième siècle avec les travaux de Newton et Leibniz).
Son approche était donc empirique, mais remarquablement précise.
3.6 Projection stéréographique et homographies

Une projection qui est moins utilisée par les géographes, mais qui présente de re-
marquables propriétés mathématiques, est la projection stéréographique.
On projette la surface de la terre, assimilée à la sphère unité, sur le plan de l’équateur
par une projection centrale de centre le pôle Nord. Par tout point M de la terre distinct
du pôle Nord N , on trace donc la droite (N M ), qui coupe le plan de l’équateur en un
unique point M 0 = p(M ).
N
M’
Si on rapporte l’espace à un repère orthonormé d’origine le centre O de la sphère et

tel que N ait pour coordonnées (0, 0, 1), cette transformation p est donnée en formules
par
x y
X= , Y =
1−z 1−z
où (x, y, z) sont les coordonnées du point M et (X, Y ) celles du point M 0 dans le plan
Oxy. L’application p est une bijection de la sphère privée du point N sur le plan Oxy
99
et la bijection réciproque est donnée par
2X 2Y X2 + Y 2 − 1
x= , y= , z= .
1 + X2 + Y 2 1 + X2 + Y 2 1 + X2 + Y 2
Ces formules permettent de montrer que l’image par p de tout cercle tracé sur la
sphère est une droite ou un cercle : plus précisément, c’est une droite si le cercle passe
par N et un cercle sinon.
Si on identifie le plan Oxy au corps des nombres complexes en associant à chaque
point son affixe, on obtient ainsi une bijection de la sphère privée du point N sur C.
Pour obtenir une bijection définie sur la sphère tout entière, on complète C par un
point à l’infini : en effet, quand un point M de la sphère s’approche de N , son image
p(M ) s’éloigne à l’infini.
Le plan complexe ainsi complété, noté Ĉ, est appelé sphère de Riemann et constitue
le cadre naturel pour étudier les homographies.
az + b
Une homographie est une application f : z 7→ où a, b, c, d sont des nombres
cz + d
complexes vérifiant ad − bc 6= 0 (sinon l’application serait constante). Cette application
définit, si c 6= 0, une bijection de C privé du point −d/c sur C privé du point a/c (si
c = 0, c’est une similitude directe). On la complète en une bijection de Ĉ sur Ĉ en
posant f (−d/c) = ∞ et f (∞) = a/c. Elle a la propriété de transformer une droite ou
un cercle en une droite ou un cercle.
Projection stéréographique et projection de Mercator

Si on repère le point M de la sphère par sa latitude θ et sa longitude ϕ et son
projeté M 0 = p(M ) sur le plan Oxy par ses coordonnées polaires r = OM 0 et ϕ, on
voit sur la figure dans le plan OM N que
!
θ π
r = tan α = tan + .
2 4
100
L’affixe du point M 0 est donc

θ π
Z = reiϕ = eln(tan( 2 + 4 ))+iϕ .
Cette formule rappelle celle donnant les coordonnées de l’image de M par la projection
de Mercator et ce n’est pas un hasard : en effet, si on échange les rôles de x et y dans
les formules donnant la projection de Mercator (ce qui revient à noter Ox l’axe vertical
et Oy l’axe horizontal) et si on note z = x + iy l’affixe du point (x, y), on obtient
Z = ez . La projection stéréographique comme la projection de Mercator sont en effet
des projections conformes (elles conservent les angles). Si on les restreint à la sphère
privée de ses deux pôles, elles définissent des bijections respectivement sur C∗ = C\{0}
et sur la bande {z | −π < Im(z) ≤ π} et la fonction exponentielle réalise précisément
une bijection conforme entre ces deux domaines de C.
Pour en savoir plus sur la projection stéréographique et sur d’autres sujets abordés
dans ces compléments (et sur bien d’autres choses encore), vous pouvez consulter le
site : http://www.dimensions-math.org/Dim_fr.htm qui vous fera voyager jusque
dans la quatrième dimension.
101

Edby 0 H

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Edby 0 H

Transféré par

Droits d'auteur :

Formats disponibles

edby0h

Université Joseph Fourier, Grenoble Maths en Ligne

Table des matières

n<5 l’entier n est strictement inférieur à 5

des 4 cas si l’assertion composée est elle-même vraie ou fausse.

négation conjonction disjonction

L’implication et l’équivalence sont les outils de base du raisonnement mathématique.

« non (non A) » équivaut à « A ».

« non (A ou B) » équivaut à « (non A) et (non B) ».

« non (A et B) » équivaut à « (non A) ou (non B) ».

Proposition 1. Soient A, B et C trois assertions. L’énoncé suivant est toujours vrai.

Si A implique B et B implique C, alors A implique C.

On en déduit facilement la transitivité de l’équivalence :

Corollaire 1. Soient A, B et C des assertions, l’énoncé suivant est toujours vrai.

Si A équivaut à B et B équivaut à C, alors A équivaut à C.

Proposition 2. Soient A et B deux assertions. Les équivalences suivantes sont tou-

« L’implication A =⇒ B est fausse si et seulement si A est vrai et B est faux ».

« A implique B » est équivalent à « non B implique non A ».

Démonstration : Nous pourrions démontrer ces équivalences directement à l’aide des

¬(A =⇒ B) ⇐⇒ ¬((¬A) ∨ B) par définition de l’implication

Voici la démonstration de la seconde équivalence.

et l’ensemble des entiers pairs :

Au travers de ce dictionnaire l’implication

• Complémentaires : soient A et B des parties d’un ensemble E. Alors :

Figure 1 – Diagrammes de Venn pour le complémentaire, l’intersection et la réunion.

Définition 2. Soient A et B deux ensembles. On appelle produit cartésien de A par

Le produit cartésien de A par lui-même se note A2 . On le généralise à plus de deux

An = { (a1 , . . . , an ) , (a1 ∈ A) ∧ . . . ∧ (an ∈ A) } .

Attention, dans un n-uplet, certaines coordonnées peuvent être identiques et l’ordre

que l’on pourrait aussi écrire

sera plutôt écrit :

La donnée de l’ensemble de départ, de l’ensemble d’arrivée et du graphe définit la

Elle se lit « fonction f de E vers F qui à x associe f (x) ».

Définition 3. Soient E et F deux ensembles et f une application de E dans F .

2. Soit B un sous-ensemble de F . On appelle image réciproque de B par f et on

Γ = { (0, 0), (1, 1), (2, 0), (3, 1) } .

Il est parfois commode de représenter un graphe par un ensemble de flèches entre

Définition 4. Soient E et F deux ensembles et f une application de E vers F . On dit

Figure 2 – Représentation graphique d’une application de {0, 1, 2, 3} vers {0, 1, 2}.

1. injective si tout élément de l’ensemble d’arrivée possède au plus un antécédent

2. surjective si tout élément de l’ensemble d’arrivée possède au moins un antécé-

3. bijective si tout élément de l’ensemble d’arrivée possède exactement un anté-

injection surjection bijection

Figure 3 – Représentations graphiques d’une injection, d’une surjection et d’une bi-

Voici comment les applications injectives, surjectives et bijectives se comportent

Proposition 4. Soient m et n des entiers. S’il existe une injection

Démonstration : On raisonne par récurrence sur m. Si m = 0, la conclusion est vérifiée.

une application injective. Comme f est injective, on a

∀i ∈ {1, . . . , m}, i 6= m ⇒ f (i) 6= f (m) .

On peut donc définir

L’application ainsi définie est injective. Donc, par hypothèse de récurrence, m − 1 6

Démonstration : Notons f une telle bijection. Alors f et f −1 sont injectives et on

Proposition 5. Soit E un ensemble fini et X une partie de E. Alors

Démonstration : Soit n le cardinal de E. Il existe donc une bijection Φ de E sur

f est bijective, donc Card({x ∈ E ; x 6= i}) = n − 1 et par hypothèse de récurrence X

Corollaire 3. Soient E et F des ensembles et f : E → F une application.

Démonstration : Si f est injective, on considère l’application

Donc il existe une application g : F → E telle que

La composée f ◦ g est l’application identique de F , donc g est injective. On applique

Si B ⊂ A, A \ B est appelé le complémentaire de B dans A.

Card(A) = Card(B) + Card(A \ B).

Démonstration : Par la proposition 5, on sait que B et A \ B sont finis. Notons p le

est bijective donc Card(A) = p + q.