Académique Documents
Professionnel Documents
Culture Documents
com Page 1
Les méthodes numériques sont une branche des mathématiques appliquées s’intéresse au
développement d’outils et des méthodes numériques pour le calcul d’approximations des
solutions des problèmes mathématique qu’il serait difficile, voire impossible, d’obtenir par des
moyens analytiques, Son objectif est notamment d’introduire des procédures calculatoires
détaillées susceptibles d’être mises en œuvre par des calculateurs (électroniques, mécaniques
ou humains) et d’analyser leurs caractéristiques et leurs performances.
Le but du cours de calcul numérique est d'étudier des méthodes numériques pour la résolution
des modèles mathématiques utilisés dans les sciences de l'ingénieur.
A la fin du cours, l'étudiant devrait être capable:
• de comprendre les notions de base d'analyse numérique
• de faire un bon choix de méthodes numériques pour résoudre un problème donné.
• de savoir calculer une solution approchée d'une équation et d'un système d'équations
non linéaires.
• de savoir calculer une solution approchée d'un système d'équations linéaires par les
méthodes directes et itératives.
• d'interpoler une suite de points du plan.
• d'approcher numériquement les dérivées d'une fonction donnée.
• d'approcher numériquement le calcul d'une intégrale définie.
Une méthode numérique présente des bénéfices aussi bien que des inconvénients par rapport à
une solution analytique.
• Les avantages tiennent au fait :
▪ qu’une solution numérique puisse être obtenue aussi lorsqu’aucune solution
analytique n’est disponible,
▪ que la décomposition d’une méthode numérique en une longue série
d’opérations arithmétiques élémentaires s’avère être facilement gérable par un
ordinateur,
▪ qu’une solution analytique, même si elle est disponible, requiert une évaluation
numérique, qui en pratique, revient à une reformulation du problème original,
cette fois sous forme explicite. Cette formule analytique peut bien être pire
conditionnée que la formulation originale, implicite.
A son détriment, il faut mentionner que l’analyse et l’étude d’une solution numérique sont
typiquement plus coûteuses.
Les méthodes numériques ne donnent pas la solution véritable du problème que l’on recherche
à résoudre. Des méthodes numériques mal employées peuvent conduire à des résultats
totalement faux, allant à l’encontre de la réalité physique (exemples typiques : concentrations
négatives, création ou disparition artificielle de la masse d’eau ou de soluté dans un modèle).
Il est indispensable pour un ingénieur de posséder des notions de base sur les méthodes
numériques, afin de pouvoir éviter les pièges et remédier les problèmes les plus courants qui
se posent lors de l’utilisation des modèles standards dans le cadre d’études et/ou de projet.
Chapitre Premier
Notions d’erreurs
Dans plusieurs domaines scientifiques notamment la physique, chimie, science…,etc., on
travaille continuellement avec des approximations dont les valeurs exactes ne sont pas
accessibles par l’expérience. Il s’agit d’une valeur inconnue pour l’expérimentateur, en effet,
une mesure n’´étant jamais parfaite et toujours entachée d’erreur, il est donc impossible
d’effectuer des mesures rigoureusement exactes. Pour prendre conscience du degré
d’approximation avec lequel on travaille, on fait l’estimation des erreurs qui peuvent avoir été
commises dans les différentes mesures et on calcule leurs conséquences dans les résultats
obtenus. Ce qui constitue le calcul d’erreur ou calcul d’incertitude. Dans ce chapitre, on va
apprendre quelques règles de base pour le calcul d’erreur qui permettent de mieux gérer les
erreurs et de bien présenter les résultats finaux des calculs. Une partie importante de l’analyse
numérique est donc, consiste à contenir les erreurs dont les causes sont multiples : matériel
employé, méthode utilisée, influence de l’environnement, l’intervention du manipulateur, les
caractéristiques de l’appareillage...,etc. Pour évaluer la précision d’un résultat, le numéricien
doit connaitre parfaitement les erreurs qui ont été commises. Donnons trois exemples : les
erreurs d’arrondi qui sont imposées par le calculateur (ordinateur), les erreurs de troncature et
les erreurs de la m´méthode qui se produisent lorsqu’une expression est mal équilibrée et
mélange des valeurs dont la différence est importante.
59
⏟ < 𝑥 = 59,4679 < 60
⏟
[𝑝𝑎𝑟 𝑑é𝑓𝑎𝑢𝑡] [𝑝𝑎𝑟 𝑒𝑥𝑐è𝑠]
Définition 1.1.2
On appelle erreur absolue, que l’on note 𝐸(𝑥), d’une valeur approchée 𝑥, la valeur absolue de
la différence entre la valeur exacte 𝑥 ∗ et 𝑥, i.e.,
𝐸(𝑥) = |𝑥 − 𝑥 ∗ | (1.1)
On appelle erreur relative d’une valeur approchée 𝑥, le quotidien 𝐸𝑟 (𝑥) défini par
𝐸(𝑥) |𝑥 − 𝑥 ∗ |
𝐸𝑟 (𝑥) = = (1.2)
|𝑥| |𝑥|
11
Exemple Soit 𝑥 ∗ = 3,666 une valeur approchée de la valeur exacte 𝑥 = , alors
3
11 11 − 10,998 0,002 2
𝐸(𝑥) = | − 3,666| = | |= = × 10−3
3 3 3 3
𝐸(𝑥) 2
𝐸𝑟 (𝑥) = = × 10−3
|𝑥| 11
Remarque 1.1.3
1. D’après la formule (1.1), la connaissance de la valeur exacte est indispensable pour
calculer l’erreur absolue
2. L’erreur relative s’exprime généralement en pourcentage, elle n’a pas d’unité de
1
mesure, de plus elle indique la qualité du résultat obtenu. Par exemple, si 𝑥 = 3 et 𝑥 =
0,333 alors
1
𝐸(𝑥) 3 − 0,333
𝐸𝑟 (𝑥) = = = 0,001 = 0,1 × 10−2 = 0,1%
|𝑥| 1
3
En pratique, il est difficile d’évaluer les erreurs absolues et relatives parce que généralement,
la valeur exacte est inconnue et on ne dispose que de la valeur expérimentale. Néanmoins, on
peut avoir une estimation (intervalle) sur l’erreur maximale que l’on peut commettre. Ces
estimations dépendent de la précision des instruments de mesure utilisés.
Définition 1.1.4 On appelle borne supérieure de l’erreur absolue d’une valeur approchée 𝑥
tout nombre ∆(𝑥) qui vérifie 𝐸(𝑥) = |𝑥 − 𝑥 ∗ | ≤ ∆(𝑥), ce qui permet d’encadrer 𝑥 comme suit
𝑥 ∗ − ∆(𝑥) ≤ 𝑥 ≤ 𝑥 ∗ + ∆(𝑥)
L’égalité (1.3) signifie que 𝑥 𝜖[𝑥 ∗ − ∆(𝑥), 𝑥 ∗ + ∆(𝑥)], elle s’interprète en disant que l’on a
estimé la valeur exacte 𝑥 à partir de 𝑥 avec une incertitude de ∆(𝑥) de part et d’autre. Il est
clair que, plus ∆(𝑥) est petite, plus 𝑥 est proche de la valeur exacte.
22
Exemple Soit 𝑥 = et soit 𝑥1 = 7,33 une valeur approchée de 𝑥, on veut calculer un ∆(𝑥1 ).
3
22
Il est clair que 7,33 < < 7,34, alors 𝐸(𝑥1 ) = |𝑥 − 𝑥 ∗ | < 0,01. Par conséquent, on peut
3
22
prendre ∆(𝑥1 ) = 0,01 et on écrit = 7,33 ± 0,01.
3
Si on considère la valeur approchée 𝑥2 = 7,333, alors 𝐸(𝑥2 ) = |𝑥2 − 𝑥 ∗ | < 0,001 avec
22 22
7,332 < < 7,334, ce qui donne un ∆(𝑥2 ) = 0,001, par conséquent = 7,333 ± 0,001. Il
3 3
est clair que 𝑥2 est une approximation plus précise de 𝑥1 . D’après cet exemple, on déduit que
∆(𝑥) n’est pas unique.
Définition 1.1.5 Une borne supérieure de l’erreur relative, que l’on note 𝛿(𝑥) d’une valeur
approchée 𝑥 est
∆(𝒙)
𝜹(𝒙) = |𝒙|
et on écrit 𝑥 ∗ = 𝑥 ± |𝑥|. 𝛿(𝑥) (1.4)
Remarque 1.1.6 La vraie définition de 𝛿(𝑥) se donne de façon similaire à celle de ∆(𝑥), c’est
𝐸(𝑥)
– à – dire, tout nombre réel 𝜀(𝑥) vérifie l’inégalité 𝐸𝑟 (𝑥) = |𝑥 ∗ |
≤ 𝜀(𝑥) s’appelle une borne
∆(𝑥)
supérieure de l’erreur relative, et comme 𝐸(𝑥) ≤ ∆(𝑥) alors, on peut prendre 𝜀(𝑥) = |𝑥|
. Dans
la pratique, la valeur exacte est inconnue, alors on utilise souvent une valeur approchée 𝑥 qui
remplace 𝑥 ∗ dans la dernière égalité.
meme unité de mesure
Exemple On se donne une longueur 𝑥 = ⏞ ∗
25𝑐𝑚 ± 2𝑐𝑚 alors
∆(𝑥) 2
𝑥 = 25𝑐𝑚 et ∆(𝑥) = 2𝑐𝑚 ⇒ 𝛿(𝑥) = |𝑥|
= = 0,08 = 8%
25
1.2.1 Les erreurs systématiques se produisent par exemple lorsqu'on emploie des unités mal
étalonnées (échelle fausse, chronomètre mal ajusté) ou lorsqu'on néglige certains
facteurs qui exercent une influence sur la marche de l'expérience (par ex. l'influence du
champ magnétique terrestre dans une mesure magnétique). Cela mène à un décalage
(biais) du résultat si l‘erreur commise est toujours la même. Les erreurs systématiques
influencent l’exactitude (ou justesse) de la mesure (voir Fig. 1). Dans la plupart des cas,
les erreurs systématiques, pour autant qu'on connaisse leur cause, peuvent être prises
en considération par une correction correspondante apportée au résultat de la mesure.
Pour les mesures effectuées dans le cadre de travaux pratiques de physique, elles n'ont
en général qu'une signification de second plan.
1.2.2 Les erreurs accidentelles en revanche ne peuvent en principe pas être évitées. Leur
cause se trouve dans l'expérimentateur lui‐même. La sûreté avec laquelle la main manie
un instrument (par ex. l’arrêt d'un chronomètre), l'exactitude avec laquelle l'œil observe
(par ex. la position d'une aiguille sur une échelle) ou l'acuité différentielle de l'oreille
(par ex. pour la détermination d'un minimum d'intensité sonore) sont limitées. C'est la
tâche de tout observateur d'être conscient des erreurs accidentelles de mesure, de les
maintenir aussi faibles que possible et d'estimer ou calculer leur influence sur le résultat
obtenu. Les erreurs accidentelles affectent la précision (ou fidélité) de la mesure (Fig.
1.)
Figure 1
1.2.3 La dispersion statistique apparaît lorsqu’on fait des mesures répétées de la même
grandeur. Si l’on mesure plusieurs fois le même phénomène avec un appareil de mesure
suffisamment précis, on obtiendra à chaque fois un résultat différent xi. Ceci est dû à
des phénomènes perturbateurs (par ex. bruit de fond électronique, sensibilité d’un
instrument aux variations de température) ou, pour des mesures extrêmement précises,
à la nature aléatoire du phénomène (chaos, incertitude quantique).
Figure 2
Définition 1.3.1 On définit un majorant de l’erreur absolue ∆𝑥 d’une valeur approchée 𝑥 ∗ par :
𝐸𝑎 (𝑥) = |𝑥 − 𝑥 ∗ | ≤ ∆𝑥 ⇔ 𝑥 ∗ − ∆𝑥 ≤ 𝑥 ≤ 𝑥 ∗ + ∆𝑥
tel que ∆𝑥 est un nombre réel positif.
Définition 1.3.2 On définit un majorant de l’erreur relative 𝛿𝑥 d’une valeur approchée 𝑥 ∗
par :
𝐸𝑎 (𝑥)
𝐸𝑟 (𝑥) = ≤ 𝛿𝑥 (1.5)
|𝑥|
tel que 𝛿𝑥 est un nombre réel positif.
Démonstration.
(a) D’après la définition de ∆(𝑥) et ∆(𝑦), on a
𝑥 − ∆(𝑥) ≤ 𝑥 ∗ ≤ 𝑥 + ∆(𝑥) et 𝑦 − ∆(𝑦) ≤ 𝑦 ∗ ≤ 𝑦 + ∆(𝑦)
⟹ (𝑥 + 𝑦) − (∆(𝑥) + ∆(𝑦)) ≤ 𝑥 ∗ + 𝑦 ∗ ≤ (𝑥 + 𝑦) + (∆(𝑥) + ∆(𝑦))
ce qui signifie que ∆(𝑥) + ∆(𝑦) est une borne supérieure de l’erreur absolue de 𝑥 + 𝑦, donc
∆(𝑥 + 𝑦) = ∆(𝑥) + ∆(𝑦). D’autre part, si on suppose que 𝑥, 𝑦 ∈ ℝ+ on obtient
𝑥 𝑦 𝑥 𝑥
= 𝛿(𝑥) + 𝛿(𝑦) ≤ max{𝛿(𝑥), 𝛿(𝑦)} + max{𝛿(𝑥), 𝛿(𝑦)}
𝑥+𝑦 𝑥+𝑦 𝑥+𝑦 𝑥+𝑦
= max{𝛿(𝑥), 𝛿(𝑦)}
(b) On a
𝑥 − ∆(𝑥) ≤ 𝑥 ∗ ≤ 𝑥 + ∆(𝑥) et −𝑦 − ∆(𝑦) ≤ −𝑦 ∗ ≤ −𝑦 + ∆(𝑦)
⟹ (𝑥 − 𝑦) − (∆(𝑥) + ∆(𝑦)) ≤ 𝑥 ∗ − 𝑦 ∗ ≤ (𝑥 − 𝑦) + (∆(𝑥) + ∆(𝑦))
⟹ ∆(𝑥 − 𝑦) = ∆(𝑥) + ∆(𝑦)
ainsi
∆(𝑥 − 𝑦) ∆(𝑥) + ∆(y) ∆(𝑥) |𝑥| ∆(𝑦) |𝑦|
𝛿(𝑥 − 𝑦) = = = +
|𝑥 − 𝑦| |𝑥 − 𝑦| |𝑥| |𝑥 − 𝑦| |𝑦| |𝑥 − 𝑦|
|𝑥| |𝑦| |𝑥| + |𝑦|
= 𝛿(𝑥) + 𝛿(𝑦) ≤ max{𝛿(𝑥), 𝛿(𝑦)}
|𝑥 − 𝑦| |𝑥 − 𝑦| |𝑥 − 𝑦|
Exemple 1.4.2
a) La longueur 𝑙 et la largeur 𝑟 d’une salle si=ont respectivement 𝑙 ∗ = 10,2 ± 0,1𝑚 et
𝑟 ∗ = 7,70 ± 0,08𝑚, calculer le perimètre de cette salle.
alors
∆(𝑥 − 𝑦) = ∆(𝑥) + ∆(𝑦) = 0,35
∆(𝑥 − 𝑦) 0,35
⟹ 𝛿(𝑥 − 𝑦) = = = 0,007 = 0,7%
|𝑥 − 𝑦| 50
il est clair que
|𝑥| + |𝑦| 350
max(𝛿(𝑥), 𝛿(𝑦)) = × 10−3 = 0,007 ≥ 𝛿(𝑥 − 𝑦)
|𝑥 − 𝑦| 50
Démonstration.
a) Supposons que les mesures 𝑥 et 𝑦 soient strictement positives, on a
𝑥 − ∆(𝑥) ≤ 𝑥 ∗ ≤ 𝑥 + ∆(𝑥) et 𝑦 − ∆(𝑦) ≤ 𝑦 ∗ ≤ 𝑦 + ∆(𝑦),
ce qui traduit l’égalité ∆(𝑥𝑦) = 𝑥∆(𝑦) + 𝑦∆(𝑥). D’autre part, en utilisant la récurrence sur 𝑛
on trouve que pour tout 𝑛 ≥ 1
∆(𝑥 𝑛 ) = ∆(𝑥 𝑛−1 . 𝑥) = |𝑥 𝑛−1 |∆(𝑥) + |𝑥|∆(𝑥 𝑛−1 ) = |𝑥|𝑛−1 ∆(𝑥) + (𝑛 − 1)|𝑥||𝑥|𝑛−2 ∆(𝑥)
= 𝑛|𝑥|𝑛−1 ∆(𝑥)
Exemple 1.4.3 Le volume d’un cylindre de hauteur 𝐻 ∗ = 5 ± 0,1 𝑐𝑚 et de rayon 𝑅 ∗ = 2,1 ±
0,2 𝑐𝑚 est 𝑉 = 𝜋𝐻𝑅 2 . Calculer le volume 𝑉 ∗ et donner sa précision. (les résultats avec 3
décimales).
∆(𝑉) 4,725
𝛿(𝑉) = = = 0,210
𝑉 22,491
𝜕𝑓 𝜕𝑓 𝜕𝑓
𝑑𝑓 = 𝑑𝑥 + 𝑑𝑦 + 𝑑𝑧
𝜕𝑥 𝜕𝑦 𝜕𝑧
Où les ∂ dénotent les dérivées partielles de f par rapport à chacune des variables x, y et z,
calculées en ces mêmes points.
Enfin, en remplaçant les éléments différentiels par les incertitudes sur les grandeurs
associées, on obtient :
𝜕𝑓 𝜕𝑓 𝜕𝑓
∆𝑓 = ∆𝑥 + ∆𝑦 + ∆𝑧
𝜕𝑥 𝜕𝑦 𝜕𝑧
𝑉 = 𝜋𝐻𝑅 2
𝑉 ≅ 3,14 × 2,1 × (5)2 ≅ 164,85 𝑐𝑚3
𝜕𝑉 𝜕𝑉
∆𝑉 = ∆𝐻 + ∆𝑅 = 𝜋[𝑅 2 ∆𝐻 + 2𝐻𝑅∆𝑅]
𝜕𝐻 𝜕𝑅
∆𝑉 ≅ 𝜋[(2,1)2 × 0,1 + 2 × 5 × 2,1 × 0,2]
∆𝑉 ≅ 14,573 𝑐𝑚3
Exemple 1.5.2
Un étudiant évalue l’accélération g de la gravité, en mesurant le temps de chute t d’une pierre
d’une hauteur h jusqu’au sol. Après plusieurs mesures, elle obtient :
𝑡 = (1,6 ± 0,1) 𝑠
1
Puisque h découle de la formule ℎ = 2 𝑔𝑡 2 , elle peut maintenant calculer g, soit :
2ℎ
𝑔= = 10,5(𝑚/𝑠 2 )
𝑡2
⇒ ln 𝑔 = ln 2 + ln ℎ − 2 ln 𝑡
𝑑𝑔 𝑑2 𝑑ℎ 𝑑𝑡
⇒ = + −2
𝑔 2 ℎ 𝑡
𝑑𝑔 𝑑ℎ 𝑑𝑡
⇒ = −2
𝑔 ℎ 𝑡
Enfin, on remplace les éléments différentiels par les incertitudes sur les grandeurs associées
et on transforme tous les signes négatifs en signes positifs. On obtient :
∆𝑔 ∆ℎ ∆𝑡
= +2
𝑔 ℎ 𝑡
∆ℎ 0,1 ∆𝑡 0,1
= = 0,7 % et = = 6,25 %
ℎ 13,5 𝑡 1,6
∆𝑔
= 0,7 + 2 × 6,25 = 13,2 % (incertitude relative)
𝑔
Donc incertitude absolue
13,2 13.2
∆𝑔 = 𝑔 × = 10,5 × = 1,4 𝑚/𝑠 2
100 100
1.6 Représentation décimale des nombres approchés
La base décimale 10 est la base naturelle avec laquelle on travaille et celle que l’on trouve
souvent sur les calculatrices. Dans cette bas, un nombre décimal ou à virgule 𝑥 ∈ ℝ se
représente via le développement (limité ou illimité) suivant
𝑥 = 𝛼𝑚 10𝑚 + 𝛼𝑚−1 10𝑚−1 + ⋯ + 𝛼𝑚−𝑛 10𝑚−𝑛 + ⋯ (1.6)
où 𝛼𝑖 ∈ {0,1, … ,9} sont les chiffres de 𝑥 et 𝑚 ∈ ℕ est le rang supérieur de 𝑥, c’est-à-dire, le plus
grand exposant. Dans la pratique, les nombres sont représentés par un développement limité.
Un nombre décimal a plusieurs écritures différentes en échangeant simplement la position de
la virgule. La partie à gauche de la virgule est la partie entière, celle à droite est la partie
décimale.
Exemple 1.6.1
⏟
3010 , 275
⏟
partie entière partie décimale
(1) : les zéros sont placés devant le premier c.s non nul, ils ne sont pas significatifs
(2) : les zéros sont significatifs parce qu’ils se trouvent entre deux c.s
(3) : les zéros sont des c.s parce qu’ils sont conservés (des zéros terminaux) et signifient
une précision de 6 chiffres après la virgule.
Remarque 1.6.5
(a) La notation usuelle des nombres donne une mauvaise information sur les chiffres
significatifs, par exemple, on ne peut pas juger combien de chiffres significatifs
comporte le nombre 68000 (il y a deux au minimum), pour cela, on l’écrit sous la
forme : 6,8 × 104 si on veut le représenter avec 3 c.s ou 6,800 × 104 si on veut 4 c.s.
(b) Si 𝑥 comporte 𝑚 c.s, 𝑚 ∈ ℕ alors, pour l’écrire avec 𝑛 c.s avec 𝑛 ≤ 𝑚, il faut d’abord
l’arrondir jusqu’au rang 𝑛. Par exemple, si on veut écrire 𝑥 = 800,74 (5 c.s) avec 3 c.s,
on obtient 𝑥 = 801.
ce qui implique
𝑚 − 𝑛 + 1 = −1
{ ⟹𝑛=3
𝑚=1
donc, 𝑥 est une approximation de 𝑥 ∗ avec 3 chiffres significatifs exacts sont, de gauche à droite,
3,6 et 0.
Remarque 1.6.8 Tous les chiffres situés devant (resp. après) un chiffre significatif exact (resp.
inexact) le sont aussi.
4 𝑐.𝑠 2 𝑐.𝑠
⏞
7,531 ×⏞
0,013 × 105
6
= 0,023
⏟ × 102
4,21 × 10
⏟ 2 𝑐.𝑠
3 𝑐.𝑠
Somme et Soustraction
La somme ou la soustraction de deux nombres ne doit pas avoir plus de décimales que le
nombre qu’en a le moins, c’est-à-dire, le résultat se donne avec une précision égale à celle de
la donnée la moins précise.
Exemple 1.6.10
220,2
⏟ + 968,184
⏟ − 12,51
⏟ = 1175,9
⏟ (après l' arrondissement)
1 décimale 3 décimales 2 décimales 1 décimale
Remarque 1.6.11 Le nombre de chiffres significatifs d’une somme ou d’une soustraction peut
être différent de ceux des valeurs initiales.
220,2
⏟ + 968,114
⏟ − 12,51
⏟ = 1175,8
⏟
4 𝑐.𝑠 6 𝑐.𝑠 4 𝑐.𝑠 5 𝑐.𝑠
Chapitre Deuxième
∑ 𝑎𝑖𝑗 𝑥𝑗 = 𝑏𝑖 , 𝑖 = 1, … , 𝑛 (2.1)
𝑗=1
ou encore
𝐴. 𝑥 = 𝑏 (2.2)
avec
Étape 1 :
▪ on transforme A en une matrice dont les termes sous diagonaux de la première colonne
sont nuls.
−𝑎
▪ pour éliminer le terme 𝑎21 on multiplie la ligne 𝑙1 par ( 𝑎 21 )
11
(1) −𝑎21
𝑙2 ← 𝑙2 + ( )𝑙
𝑎11 1
on obtient ainsi
(1) 𝑎21
𝑎2𝑗 = 𝑎2𝑗 − ( ) 𝑎1𝑗
𝑎11
(1) 𝑎21
𝑏2 = 𝑏2 − ( )𝑏
𝑎11 1
−𝑎
▪ pour éliminer le terme 𝑎31 on multiplie 𝑙1 par ( 𝑎 31 )
11
(1) −𝑎31
𝑙3 ← 𝑙3 + ( )𝑙
𝑎11 1
on obtient ainsi
(1) 𝑎31
𝑎3𝑗 = 𝑎3𝑗 − ( ) 𝑎1𝑗
𝑎11
(1) 𝑎31
𝑏3 = 𝑏3 − ( )𝑏
𝑎11 1
▪ d’une manière générale pour éliminer tous les termes 𝑎𝑖1 on utilise la transformation
(1) −𝑎𝑖1
𝑙𝑖 ← 𝑙𝑖 + ( )𝑙
𝑎11 1
(1) 𝑎𝑖1
𝑎𝑖𝑗 = 𝑎𝑖𝑗 − ( ) 𝑎𝑖𝑗
𝑎11
(1) 𝑎31
𝑏𝑖 = 𝑏𝑖 − ( )𝑏
𝑎11 1
▪ à la fin de la première étape le système d’équations aura la forme suivante :
𝑎11 𝑎12 𝑎13 … 𝑎1𝑛 𝑏1
(1) (1) (1) (1)
0 𝑎22 𝑎23 … 𝑎2𝑛 𝑏2
⋮ ⋮ ⋮ ⋱ ⋮ ⋮
(1) (1) (1) (1)
( 0 𝑎𝑛2 𝑎𝑛3 … 𝑎𝑛𝑛 𝑏𝑛 )
Etape 2 :
Nous éliminons ensuite les termes sous-diagonaux de la seconde colonne.
Comme à la première étape pour éliminer le terme 𝑎32 on doit utiliser la transformation
élémentaire
(1)
(2) (1) −𝑎32 (1)
𝑙3 ← 𝑙3 +( (1)
) 𝑙2
𝑎22
on obtient ainsi
(1)
(2) (1) 𝑎32(1)
𝑎32 = 𝑎32 −(
(1)
) 𝑎22 =0
𝑎22
(1) (1)
(2) (1) 𝑎32 (1) (2) (1) 𝑎32 (1)
𝑎33 = 𝑎33 − ( (1) ) 𝑎23 𝑎3𝑗 = 𝑎3𝑗 −( ) 𝑎2𝑗
𝑎22 (1)
𝑎22
……………………… ⇔
(1) (1)
(2) (1) 𝑎32 (1) (2) (1) 𝑎32 (1)
𝑎3𝑛 = 𝑎3𝑛 − ( (1) ) 𝑎2𝑛 𝑏3 = 𝑏3 − ( (1) ) 𝑏1
𝑎22 ( 𝑎22 )
(1)
(2) (1) 𝑎32 (1)
𝑏3 = 𝑏3 −( (1)
) 𝑏2
{ 𝑎22
Etape k :
A la kème étape, nous éliminons les termes sous-diagonaux de la kième colonne
(𝑘−1)
(𝑘) (𝑘−1) 𝑎𝑘+1,𝑘 (𝑘−1)
𝑙𝑘+1 ← 𝑙𝑘+1 −( (𝑘−1)
) 𝑙𝑘
𝑎𝑘𝑘
on obtient ainsi
(𝑘−1)
(𝑘) (𝑘−1) 𝑎𝑘+1,𝑘 (𝑘−1)
𝑎𝑘+1,𝑘 = 𝑎𝑘+1,𝑘 −( (𝑘−1)
) 𝑎𝑘𝑘 =0
𝑎𝑘𝑘
(𝑘−1)
(𝑘) (𝑘−1) 𝑎𝑘+1,𝑘 (𝑘−1)
(𝑘−1) 𝑎𝑘+1𝑗 = 𝑎𝑘+1,𝑗 −( (𝑘−1)
) 𝑎𝑘,𝑗
(𝑘) (𝑘−1) 𝑎𝑘+1,𝑘 (𝑘−1) 𝑎𝑘𝑘
𝑎𝑘+1,𝑘+1 = 𝑎𝑘+1,𝑘+1 − ( (𝑘−1) ) 𝑎𝑘,𝑘+1 ⟺ (𝑘−1)
𝑎𝑘𝑘 (𝑘) (𝑘−1) 𝑎𝑘+1,𝑘
𝑏𝑘+1 = 𝑏𝑘+1 − ( (𝑘−1) ) 𝑏1
𝑎𝑘𝑘
………………………
(𝑘−1)
(𝑘) (𝑘−1) 𝑎𝑘+1,𝑘 (𝑘−1)
𝑎𝑘+1,𝑛+1 = 𝑎𝑘+1,𝑗 −( (𝑘−1)
) 𝑎𝑘,𝑛+1
{ 𝑎𝑘𝑘
A la fin de la dernière étape on obtient alors le système triangulaire supérieur suivant :
(𝑘)
Remarque 2.2.1 Les opérations précédentes supposent que les termes 𝑎𝑘𝑘 appelés pivots sont
non nuls.
Exemple 2.2.1 Soit le système d’équations représenté par la matrice augmentée suivante :
2 1 2 10
[6 4 0 26]
8 5 1 35
6
𝑙2 ← 𝑙2 − ( ) 𝑙1
{ 2
8
𝑙3 ← 𝑙3 − ( ) 𝑙1
2
2 1 2 10
[0 1 −6 −4]
0 1 −7 −5
1
𝑙3 ← 𝑙3 − ( ) 𝑙2
1
2 1 2 10
[0 1 −6 −4]
0 0 −1 −1
𝑥3 = 1, 𝑥2 = 2, 𝑥1 = 3
Exemple 2.2.2
𝐿3 ←𝐿3 −2𝐿2
𝑥1 + 2𝑥2 + 3𝑥3 + 4𝑥4 = 1
𝐿4 ←𝐿4 −7𝐿2 − 𝑥2 − 2𝑥3 − 7𝑥4 = 0
→
− 4𝑥3 + 4𝑥4 = 0
{ 4𝑥3 + 36𝑥4 = 0
donc 𝑥4 = 0, 𝑥3 = 0, 𝑥2 = 0 et 𝑥1 = 1
Remarque 2.2.2
2𝑛3
▪ la méthode de Gauss nécessite opérations pour un système de taille 𝑛.
3
plus grandes que 1 et amplifierons les erreurs de troncature ; dans ce cas il peut y avoir
perte de précision, et on opte pour la modification de l’algorithme de Gauss, d’où les
méthodes du pivot.
b) Méthode du pivot
▪ b.1. Pivot partiel
Dans cette méthode, on intervertit les lignes à chaque étape de façon à placer en pivot
le terme de coefficient le plus élevé de la ligne. C’est la méthode du pivot partiel, à la
kième étape, le pivot est l’élément :
(𝑘) (𝑘)
𝑎𝑖,𝑘 = max |𝑎𝑝,𝑘 |
𝑝=𝑘,…,𝑛
Exemple 2.2.3
1 3 3 𝑥1 0
𝑥
𝐴 = (1 1 0 ) , 𝑥 = ( 2 ) , 𝑏 = ( 1 )
3 2 6 𝑥3 11
𝑘 = 1: max(1,1,3) = 3 on permute, par exemple, les lignes 1 et 3 on obtient
3 2 6 ⋮ 11
[3] 2 6 ⋮ 11 1 8
0 −2 ⋮ −
(1 1 0 ⋮ 1)→ 3 3
1 3 3 ⋮ 0 7 11
0 1 ⋮ −
( 3 3)
1 7 7
𝑘 = 2: max (3 , 3) = 3 on permute, par exemple, les lignes 2 et 3 on obtient
3 2 6 ⋮ 11 3 2 6 ⋮ 11
7 11 1 11
0 1 ⋮ − 0 1 ⋮ −
3 3 → 3 3
1 8 15 15
0 −2 ⋮ − 0 0 − ⋮ −
( 3 3) ( 7 7)
Il s’ensuit que :
𝑥3 = 1
3 11 𝑥3 = 1
𝑥2 = (− − 𝑥3 )
𝐴𝑥 = 𝑏 ⟺ 7 3 ⟺ { 𝑥2 = −2
1 𝑥1 = 3
𝑥1 = (11 − 2𝑥2 − 6𝑥3 )
{ 3
Exemple 2.2.4
Soit le système
𝑥1 + 3𝑥2 + 3𝑥3 = −2
{ 2𝑥1 + 2𝑥2 + 5𝑥3 = 7
3𝑥1 + 2𝑥2 + 6𝑥3 = 12
Posons :
1 3 3 ⋮ −2
(𝐴 ⋮ 𝑏) = ( 2 2 5 ⋮ 7 )
3 2 6 ⋮ 12
(1)
𝑘 = 1: max (|𝑎𝑖,𝑗 |, 𝑖 = 1,2,3 𝑗 = 1,2,3) = 6. La ligne du pivot sera alors 𝐿3 . En permutant
3 2 6 ⋮ 12
(2 2 5 ⋮ 7 )
1 3 3 ⋮ −2
La colonne du pivot total est la colonne 3, et on permute les colonnes 1 et 3 :
6 2 3 ⋮ 12
[6] 2 3 ⋮ 12 1 1
0 − ⋮ −3
( 5 2 2 ⋮ 7 )→ 3 2
3 3 1 ⋮ −2 1
0 2 − ⋮ −8
( 2 )
(1)
𝑘 = 2: max (|𝑎𝑖,𝑗 |, 𝑖 = 2,3 𝑗 = 2,3) = 2. La ligne du pivot total est alors 𝐿3 . Et donc on
6 2 3 ⋮ 12 6 2 3 ⋮ 12
1 1
0 [2] − ⋮ −8 0 2 − ⋮ −8
2 → 2
1 1 5 5
0 − ⋮ −3 0 0 − ⋮ −
( 3 2 ) ( 12 3)
Du fait de la permutation précédente des colonnes 1 et 3 on obtient le système équivalent
suivant :
6𝑥3 + 2𝑥2 + 3𝑥1 = 12
1 𝑥3 = 1
2𝑥2 − 𝑥1 = −8
2 ⟺ {𝑥2 = −3
5 5 𝑥1 = 4
{ − 𝑥1 = −
12 3
Remarque Notons bien à chaque permutation de colonnes les inconnues changent de places.
2.2.2 Méthodes itératives
Nous allons décrire ces méthodes brièvement sans passer par des calculs ou des démonstrations
mathématiques complexes, car cela nous éloignera des objectifs du cours.
a. Méthode de JACOBI (Carl Gustav Jacobi)
Soit le système suivant de 3 équations à 3 inconnues :
𝑎11 𝑥1 + 𝑎12 𝑥2 + 𝑎13 𝑥3 = 𝑦1
{𝑎21 𝑥1 + 𝑎22 𝑥2 + 𝑎23 𝑥3 = 𝑦2
𝑎31 𝑥1 + 𝑎32 𝑥2 + 𝑎33 𝑥3 = 𝑦3
On résout le système de la manière suivante :
𝑦1 − (𝑎12 𝑥2 + 𝑎13 𝑥3 )
𝑥1 =
𝑎11
𝑦2 − (𝑎21 𝑥1 + 𝑎23 𝑥3 )
𝑥2 =
𝑎22
𝑦3 − (𝑎31 𝑥1 + 𝑎32 𝑥2 )
𝑥3 =
{ 𝑎33
On donne aux inconnues les valeurs arbitraires initiales 𝑥1° , 𝑥2° , 𝑥3° .
Si ces valeurs sont portées au second membre de la solution précédente, on obtient :
𝑦1 − (𝑎12 𝑥2° + 𝑎13 𝑥3° )
𝑥11 =
𝑎11
𝑦2 − (𝑎21 𝑥1° + 𝑎23 𝑥3° )
𝑥21 =
𝑎22
1
𝑦3 − (𝑎31 𝑥1° + 𝑎32 𝑥2° )
𝑥 =
{ 3 𝑎33
Ce nouvel ensemble porté dans le second membre des équations précédentes donne un
𝑥12 , 𝑥22 , 𝑥32 autre ensemble et ainsi de suite.
Pour les systèmes où les matrices sont de rang élevé, il n’est pas commode de faire le test de
convergence sur chaque inconnue xj.
Dans ce cas, on fait le test soit seulement sur certaines inconnues que l'on choisit, soit sur les
quantités suivantes :
1/2
𝑛 𝑛
2
(𝑘+1) (𝑘) (𝑘+1) (𝑘)
∑|𝑥𝑗 − 𝑥𝑗 | 𝑜𝑢 (∑|𝑥𝑗 − 𝑥𝑗 | )
𝑗=1 𝑗=1
Ou
𝑛 (𝑘+1) (𝑘) (𝑘+1) (𝑘) 1/2
𝑥𝑗 − 𝑥𝑗 𝑥𝑗 − 𝑥𝑗
∑| (𝑘+1)
| 𝑜𝑢 ( (𝑘+1)
)
𝑗=1
𝑥𝑗 𝑥𝑗
La convergence du procédé ne dépend pas du choix des valeurs initiales xj, mais seulement des
valeurs des coefficients.
On montre que la convergence est assurée si on a, pour chaque valeur de i (c'est-à-dire pour
chaque ligne), la relation
𝑛
|𝑎𝑖𝑖 | ≥ ∑|𝑎𝑖𝑗 |
𝑗=1
𝑗=1
est vérifiée.
Autrement dit, il y a convergence si chaque élément diagonal est supérieur ou égal, en module,
à la somme des modules des autres éléments de sa ligne.
Exemple 2.2.5
Résoudre le système d’équations linéaires en utilisant la méthode de Jacobi avec une tolérance
de 𝜀 = 10−1.
+ 2𝑥1 − 𝑥2 = 1
{−𝑥1 + 2𝑥2 − 𝑥3 = 0
− 𝑥2 + 2𝑥3 = 1
Résolution
(𝑘) (𝑘) (𝑘) (𝑘) (𝑘)
(𝑘+1)
(𝑏1 − 𝑎12 𝑥2 − 𝑎13 𝑥3 ) (1 − (−1)𝑥2 − 0𝑥3 ) (1 + 𝑥2 )
𝑥1 = = =
𝑎11 2 2
(𝑘) (𝑘) (𝑘) (𝑘) (𝑘) (𝑘)
(𝑘+1)
(𝑏2 − 𝑎21 𝑥1 − 𝑎23 𝑥3 ) (0 − (−1)𝑥1 − (−1)𝑥3 ) (𝑥1 + 𝑥3 )
𝑥2 = = =
𝑎11 2 2
(𝑘) (𝑘) (𝑘) (𝑘) (𝑘)
(𝑘+1)
(𝑏3 − 𝑎31 𝑥1 − 𝑎32 𝑥2 ) (1 − 0𝑥1 − (−1)𝑥2 ) (1 + 𝑥2 )
𝑥3 = = =
𝑎11 2 2
Avec 𝑋 (0) = (0,0,0)
Pour
𝑘=0
(0)
(1)
(1 + 𝑥2 ) (1 + 0)
𝑥1 = = = 0,5
2 2
(0) (0)
(1)
(𝑥1 + 𝑥3 ) (0 + 0)
𝑥2 = = =0
2 2
(0)
(1)
(1 + 𝑥2 ) (1 + 0)
𝑥3 = = = 0,5
2 2
𝑘=1
(1)
(2)
(1 + 𝑥2 ) (1 + 0)
𝑥1 = = = 0,5
2 2
(1) (1)
(2)
(𝑥1 + 𝑥3 ) (0,5 + 0,5)
𝑥2 = = = 0,5
2 2
(1)
(2)
(1 + 𝑥2 ) (1 + 0)
𝑥3 = = = 0,5
2 2
𝑘=2
(2)
(3)
(1 + 𝑥2 ) (1 + 0,5)
𝑥1 = = = 0,75
2 2
(2) (2)
(3)
(𝑥1 + 𝑥3 ) (0,5 + 0,5)
𝑥2 = = = 0,5
2 2
(2)
(3)
(1 + 𝑥2 ) (1 + 0,5)
𝑥3 = = = 0,75
2 2
Ainsi on obtient le tableau ci-dessous:
𝑘 (𝑘+1) (𝑘+1) (𝑘+1)
𝑥1 𝑥2 𝑥3
0 0,5 0 0,5
1 0,5 0,5 0,5
2 0,75 0,5 0,75
3 0,75 0,75 0,75
4 0,875 0,75 0,875
5 0,875 0,875 0,875
6 0,9375 0,875 0,9375
Exemple 2.2.6
En utilisant la méthode de Gauss-Seidel résoudre ce système à quatre décimales exactes; soit
l’approximation initiale.
1,2
(0)
𝑋 =| 0 |
0
10𝑥1 + 𝑥2 + 𝑥3 = 12
{ 2𝑥1 + 10𝑥2 + 𝑥3 = 4
2𝑥1 + 2𝑥2 + 10𝑥3 = 7
(𝑘) (𝑘) (𝑘) (𝑘)
(𝑘+1)
(𝑏1 − 𝑎12 𝑥2 − 𝑎13 𝑥3 ) (12 − 𝑥2 − 𝑥3 )
𝑥1 = =
𝑎11 10
(𝑘+1) (𝑘) (𝑘+1) (𝑘)
(𝑘+1)
(𝑏2 − 𝑎21 𝑥1 − 𝑎23 𝑥3 ) (4 − 2𝑥1 − 𝑥3 )
𝑥2 = =
𝑎22 10
(𝑘+1) (𝑘+1) (𝑘+1) (𝑘+1)
(𝑘+1)
(𝑏3 − 𝑎31 𝑥1 − 𝑎32 𝑥2 ) (7 − 2𝑥1 − 2𝑥2 )
𝑥3 = =
𝑎33 10
𝑘=0
(0) (0)
(1)
(12 − 𝑥2 − 𝑥3 ) (12 − 0 − 0)
𝑥1 = = = 1,2
10 10
(1) (0)
(1)
(4 − 2𝑥1 − 𝑥3 ) (4 − 2 × 1,25 − 0)
𝑥2 = = = 0,15
10 10
(1) (1)
(1)
(7 − 2𝑥1 − 2𝑥2 ) (7 − 2 × 1,2 − 2 × 0,15)
𝑥3 = = = 0,43
10 10
𝑘=1
(1) (1)
(2)
(12 − 𝑥2 − 𝑥3 ) (12 − 0,15 − 0,43)
𝑥1 = = = 1,142
10 10
(2) (1)
(2)
(4 − 2𝑥1 − 𝑥3 ) (4 − 2 × 1,142 − 0,43)
𝑥2 = = = 0,1286
10 10
(2) (2)
(2)
(7 − 2𝑥1 − 2𝑥2 ) (7 − 2 × 1,142 − 2 × 0,1286)
𝑥3 = = = 0,4459
10 10
𝑘=2
(2) (2)
(3)
(12 − 𝑥2 − 𝑥3 ) (12 − 0,1286 − 0,4459)
𝑥1 = = = 1,1426
10 10
(3) (1)
(2)
(4 − 2𝑥1 − 𝑥3 ) (4 − 2 × 1,11426 − 0,4459)
𝑥2 = = = 0,1269
10 10
(3) (3)
(2)
(7 − 2𝑥1 − 2𝑥2 ) (7 − 2 × 1,1426 − 2 × 0,1269)
𝑥3 = = = 0,4461
10 10
Chapitre Troisième
f (x) =0 (3.1.1)
où la fonction f (x) est définie et continue dans un certain intervalle fini ou infini
a < x < b. Dans ce qui suit, nous allons également recourir à la dérivée première f '(x) et à la
dérivée seconde f '' (x) et pour cela nous supposons donc que f ' (x) et f ''(x) existent. Toute
valeur r qui annule la fonction f (x) c'est-à-dire telle que f (r) =0 s’appelle racine de l’équation
(3.1) ou zéro de la fonction f (x). Nous supposons également que l’équation f (x) = 0 n’admet
que des racines isolées c'est-à-dire que pour chaque racine de l’équation (3.1.1), il existe un
voisinage qui ne contient pas d’autres racines de cette équation. La recherche approchée des
racines réelles isolées de l’équation (3.1.1) se fait en général en deux étapes.
1ere Etape : Séparation des racines : qui consiste à établir des segments [α, β] les plus
serrés possible contenant une et seulement une racine de l’équation (3.1.1).
2eme Etape : Amélioration de la précision ou mise au point des racines approchées,
c’est-à-dire obtention de leur précision imposée.
Théorème 3.1.1
Si une fonction continue f (x) prend aux extrémités du segment [α,β] des valeurs de
signes contraires c'est-à-dire si f(α).f(β)< 0 ce segment contient au moins une racine
de l’équation 0 f (x) = c'est-à-dire il existe au moins un réel r appartenant à [α,β] tel
que f (r) =0. Si la dérivée première f ' (x) existe et garde le signe constant dans l’intervalle ]α,
β[ alors la racine r est unique, en effet, si f '(x)>0, pour tout x ∈ ]α,β[, alors f est croissante sur
]α,β[ et il n’existe donc qu’une seule valeur r de x sur ]α,β[ qui annule f (x) . De même si f '
(x)<0 ,∀ x ∈ ]α, β[ alors f est décroissante sur ]α, β[ et il n’existe donc qu’une seule valeur r de
x sur ]α, β[ qui annule f (x).
1. Déterminer les signes de la fonction f (x) aux deux extrémités du domaine de définition
de la fonction f (x) ,
2. Puis on détermine les signes de la fonction f (x) en quelques points
intermédiaires x = α1, α2, α3, …. αk dont le choix doit rendre compte des particularités
de la fonction. S’il se trouve que f(αk).f(αk+1)<0 alors dans l’intervalle ]αk ,αk+1[ ou
]αk+1, αk[ , l’équation f (x)=0 possède une racine. Il faut alors définir si cette racine est
unique ou pas.
Rappel
L’équation algébrique de degré n 𝑎0 𝑥 𝑛 + 𝑎1 𝑥 𝑛−1 + ⋯ + 𝑎𝑛−1 𝑥 + 𝑎𝑛 = 0 (Avec 𝑎0 ≠ 0)
admet au plus n racines réelles.
Ainsi donc, si pour une telle équation nous avons obtenu n +1 changements de signes,
toutes les racines sont alors séparées.
𝑓(1) = −3 𝑓(−2) = 6
𝑓(−1) = 7 𝑓(3) = 11
Nous observons 3 changements de signes et donc les trois racines r1, r2, et r3 sont réelles
et r1 ∈]- ,3 -2[ , r2 ∈] 1,0 [, r3 ∈ ] 3,2 [.
Nous allons nous intéresser maintenant aux racines des équations f (x)=0 au cas où
elles peuvent être calculées aisément. Dans ce cas-là le processus de séparation des racines de
l’équation (3.1.1) peut être ordonné. A cet effet, il suffit de compléter les signes de la fonction
f (x) aux points des zéros de sa dérivée et aux points frontières x = a et x = b du domaine de f.
𝑓(1) = 1 − 4 − 1 = − 4 < 0
Théorème 3.1.4
Soit 𝑟 une racine exacte et 𝑟̅ une racine approchée de l’équation 𝑓(𝑥) = 0 qui reposent toutes
sur le segment [𝛼, 𝛽] , de plus |𝑓′(𝑥)| ≥ 𝑚1 > 0 𝑝𝑜𝑢𝑟 𝛼 ≤ 𝑥 ≤ 𝛽.
|𝑓(𝑥̅ )|
|𝑟̅ − 𝑟| ≤ (3.1.2)
𝑚1
Démonstration
En appliquant le théorème de Lagrange (Théorème des accroissements finis) on a :
|𝑓(𝑟̅ )|
C’est-à-dire |𝑓(𝑟̅ )| ≥ |𝑟̅ − 𝑟|𝑚1 ou |𝑟̅ − 𝑟| ≤ 𝑚1
Exemple 3.1.5
Une racine approchée de l’équation 𝑓(𝑥) ≡ 𝑥 4 − 𝑥 − 1 = 0 est 𝑥̅ = 1,22
Evaluer l’erreur absolue de cette racine.
Solution :
𝑓(𝑥̅ ) = (1,22)4 − 1,22 − 1 = −0,0047
𝑥̿ = 1,23 } 𝑟 ∈ ]1,22; 1,23[ racine exacte
4
𝑓(𝑥̿ ) = (1,23) − 1,23 − 1 = 0,059
𝑓 ′ (𝑥) = 4𝑥 3 − 1
𝑓 ′′ (𝑥) = 12𝑥 2
|𝑓(𝑥̅ )| 0,00047
⟹ |𝑟̅ − 𝑟| ≤ = = 0,00075 ≈ 0,001 = 10−3
6,2634 6,2634
𝑓(𝑥) = 0 (3.2.1)
sur l’intervalle ]𝑎, 𝑏[ où 𝑓 est définie et continue et 𝑓(𝑎). 𝑓(𝑏) < 0
1. On choisit un réel p appelé pas.
2. On calcule 𝑓(𝑎 + 𝑝), 𝑓(𝑎 + 2𝑝), 𝑓(𝑟 + 3𝑝), 𝑓(𝑟 + 4𝑝), ….et on détermine l’entier k
tel que 𝑟 ∈ [𝑎 + 𝑘𝑝, 𝑎 + (𝑘 + 1)𝑝] c’est-à-dire k est l’entier tel que 𝑓(𝑎 +
𝑘𝑝)𝑒𝑡 𝑓[𝑎 + (𝑘 + 1)𝑝] sont de signes contraires.
3. On divise le pas par dix (par exemple) et on applique le même processus à partir de
𝑓(𝑎 + 𝑘𝑝).
1. 𝑎 = 0; 𝑏 = 3; 𝑝 = 1
𝑓(𝑎) = 𝑓(0) = −14 < 0
𝑓(𝑎 + 𝑝) = 𝑓(1) = 1 + 1 − 14 = −12 < 0
𝑓(𝑎 + 2𝑝) = 𝑓(2) = 2 + 2 − 14 = −4 < 0
} ⟹ 𝑟 ∈ [2,3]
𝑓(𝑎 + 3𝑝) = 𝑓(3) = 27 + 3 − 14 = 16 > 0
1
2. 𝑎 = 2; 𝑏 = 3; 𝑝 = 10 = 10−1 = 0,1
𝑎𝑛 𝑏𝑛 𝑓(𝑎𝑛 ) 𝑓(𝑏𝑛 )
0,0000 3,0000 -14,0000 16,00000
2,0000 3,0000 -4,0000 16,00000
2,2000 2,3000 -1,1520 0,4670
2,2700 2,2800 -0,0329 0,1325
2,2710 2,2720 -0,0164 0,000027
où la fonction f(x) est continue sur le segment [𝑎, 𝑏] avec 𝑓(𝑎). 𝑓(𝑏) < 0
pour chercher la racine de l’équation (2.3.1) qui appartient au segment [𝑎, 𝑏], divisons ce
𝑎+𝑏 𝑎+𝑏
segment en deux parties égales. Si 𝑓 ( ) = 0, 𝑟 = est une racine de l’équation.
2 2
𝑎+𝑏 𝑎+𝑏
Si 𝑓 ( ) ≠ 0, comparons 𝑓 ( ) à 𝑓(𝑎) 𝑒𝑡 𝑓(𝑏) en termes de signes.
2 2
𝑎+𝑏 𝑎+𝑏
Prenons celle des moitiés[𝑎, ] ou [ , 𝑏] aux extrémités de laquelle la fonction f(x) a des
2 2
signes opposés. Le nouveau segment raccourci [𝑎1 , 𝑏1 ] est encore partitionné en deux, après
on reprend le raisonnement ci – dessous. On obtient ainsi une certaine étape soit une racine
exacte de l’équation (2.3.1) soit une suite infinie de segment emboités [𝑎1 , 𝑏1 ] ⊃ [𝑎2 , 𝑏2 ] ⊃
[𝑎3 , 𝑏3 ] ⊃ ⋯ ⊃ [𝑎𝑛 , 𝑏𝑛 ] tels que
Et
1
𝑏𝑛 − 𝑎𝑛 = 2𝑛 (𝑏 − 𝑎) (𝑛 = 1,2,3, … ) (3.3.3)
Les extrémités gauches 𝑎1 , 𝑎2 , 𝑎3 , … , 𝑎𝑛 forment une suite non décroissante bornée et les
extrémités droites forment une suite non croissante bornée. L’égalité (2.3.3) donne lieu à une
limite commune.
1
En effet lim (𝑏𝑛 − 𝑎𝑛 ) = lim (𝑏 − 𝑎) = 0 ⟹ lim 𝑏𝑛 = lim 𝑎𝑛 = 𝑟
𝑛→∞ 𝑛→∞ 2𝑛 𝑛→∞ 𝑛→∞
En passant également à la limite dans l’inégalité (3.3.2) on a du fait que f est continue
Il s’en suit que [𝑓(𝑟)]2 = 0 ou 𝑓(𝑟) = 0, c’est-à-dire que 𝑟 est une racine de l’équation (3.3.1).
Remarques.
Critère d’arrêt
Le nombre d’itération dépend de la précision 𝜀 voulue ainsi que l’intervalle initial [𝑎, 𝑏] soit :
log(𝑏 − 𝑎) − log(2𝜀)
𝑁≥
log(2)
Exemple.
Solution
𝑓(0) = −1
} ⟹ ∃ 𝑟 ∈ [0,1]
𝑓(1) = 1 + 2 − 1 − 1 = 1 > 0
𝑛 𝑎𝑛 𝑏𝑛 𝑎𝑛 + 𝑏𝑛 𝑓(𝑎𝑛 ) 𝑓(𝑏𝑛 ) 𝑎𝑛 + 𝑏𝑛
𝑓( )
2 2
0 0 1 0,5 -1 1 -1,1875
1 0,5 1 0,75 -1,1875 1 -0,5898
2 0,75 1 0,875 -0,5898 1 -0,0510
3 0,75 0,875 0,8125 -05898 0,0510 -0,3039
4 0,8125 0,875 0,8437 -03039 0,0510 -0,1353
5 0,8438 0,875 0,8594 -0,1353 0,0510 -0,0445
𝑓(0,875) = 0,0510
} ⟹ 0,8594 < 𝑟 < 0,875
𝑓(0,8594) = −0,0445
0,8594+0,875
On peut poser : 𝑟 = = 0,8672 comme vérification
2
De plus 𝑓′(𝑥) et 𝑓′′(𝑥) sont continues et gardent des signes constants pour 𝑎 ≤ 𝑥 ≤ 𝑏.
Après le calcul d’une nième valeur approchée 𝑥𝑛 de la racine (𝑥𝑛 = 𝑟), nous pouvons
améliorer la précision de la valeur approchée de la manière suivante en recourant à la
Méthode de Newton.
Posons
𝑟 = 𝑥𝑛 + ℎ𝑛 (3.4.2)
𝑓(𝑥𝑛 )
0 = 𝑓(𝑟) = 𝑓(𝑥𝑛 + ℎ𝑛 ) ≈ 𝑓(𝑥𝑛 ) + ℎ𝑓 ′(𝑥𝑛) ⟹ ℎ𝑛 =
𝑓′(𝑥𝑛 )
𝑓(𝑥 )
Portons ℎ𝑛 = 𝑓′(𝑥𝑛 ) dans (2.4.2) nous trouvons l’approximation successive 𝑥𝑛+1 qui est :
𝑛
𝑓(𝑥 )
𝑥𝑛+1 = 𝑥𝑛 − 𝑓′(𝑥𝑛 ) (n=0,1,2,3…..) (3.4.3)
𝑛
les idées, posons que 𝑓′′(𝑥) > 0 pour 𝑎 ≤ 𝑥 ≤ 𝑏 et que 𝑓(𝑏) > 0. Choisissons par exemple
𝑥0 = 𝑏. Menons par le point 𝐵0 [𝑥0 , 𝑓(𝑥0 )] la tangente à la courbe 𝑦 = 𝑓(𝑥).
𝑦−𝑓(𝑥0 )
Equation de la tangente : = 𝑓′(𝑥0 )
𝑥−𝑥0
0−𝑓(𝑥0 )
Le point 𝑀1 (𝑥1 , 0) de la tangente vérifie cette équation i.e. : = 𝑓′(𝑥0 )
𝑥1 −𝑥0
𝑓(𝑥 )
où 𝑥1 = 𝑥0 − 𝑓′(𝑥0 )
0
𝑓(𝑥𝑛 )
𝑥𝑛+1 = 𝑥𝑛 − (n=0,1,2,3…..) (3.4.3)
𝑓′(𝑥𝑛 )
Critère d’arrêt
Le critère d’arrêt soit |𝑥𝑖+1 − 𝑥𝑖 | < 𝜀
Soit l’équation
𝑓(𝑥) = 0 (3.5.1)
où 𝑓(𝑥) est une fonction continue. Le problème consiste à déterminer ses racines réelles. Pour
ce faire, remplaçons l’équation (3.5.1) par une équation équivalente
𝑥 = 𝑔(𝑥) (3.5.2)
𝑥1 = 𝑔(𝑥0 ) (3.5.3)
Remplaçons maintenant dans le second membre de (3.5.3) 𝑥0 par 𝑥1. Nous obtenons un
nouveau nombre 𝑥2 = 𝑔(𝑥1 ). En reprenant cette procédure, on aboutit finalement à une suite
de nombre réels.
Si cette suite (𝑥𝑛 )𝑛 est convergente c’est-à-dire, s’il existe une limite 𝜉 = lim 𝑥𝑛 , alors en
𝑥→∞
passant à la limite dans (3.5.4) et en supposant que la fonction 𝑔 est continue, on tombe sur
Note : [𝜉 = 𝑔( 𝜉) ⟺ 𝑔( 𝜉) − 𝜉 = 0 ⟺ 𝑓(𝜉) = 0]
Ainsi, la limite 𝜉 est une racine de l’équation (3.5.2) qui se calcule d’après la formule (3.5.4)
avec la précision voulue.
Géométriquement cette méthode s’explique de la façon suivante : on construit dans le plan xOy
les courbes représentatives des fonctions 𝑦 = 𝑥 et 𝑦 = 𝑔(𝑥). Toute racine réelle 𝜉 de
l’équation (3.5.2) est l’abscisse d’un point d’intersection M de ces deux courbes (Ligne
polygonale en spirale).
En partant d’un certain point 𝐴0 (𝑥0 ,g(𝑥0 )), on construit la ligne polygonale
𝐴0 𝐵1 𝐴1 𝐵2 𝐴2 𝐵3 𝐴3 𝐵4…………… «échelonnée» dont les éléments sont parallèles
alternativement à l’axe OX et à l’axe OY. Les sommets 𝐴0 , 𝐴1 , … . . , 𝐴𝑛−1 , 𝐴𝑛 ,… reposent sur
la courbe 𝑦 = g(𝑥) et les sommets 𝐵1 , 𝐵2 , 𝐵3 , …. Se trouvant sur la droite 𝑦 = 𝑥.
La ligne polygonale 𝐴0 𝐵1 𝐴1 𝐵2 𝐴2 𝐵3 𝐴3 𝐵4 , … .. peut avoir soit une forme «en spirale» ou une
forme «échelonnée». Il est clair que la solution s’obtient sous forme d’une ligne «échelonnée»
si la dérivée g′(𝑥) est positive, et «en spirale» si g′(𝑥) est négative.
Sur la figure 2, la pente de la courbe 𝑦 = g(𝑥) est faible dans le voisinage de la racine, c’est-
à-dire |g′(𝑥)| < 1 et le processus itératif converge.
Toutefois, si l’on considère le cas où |g′(𝑥)| > 1, le processus itératif être divergent. Pour
rendre possible l’application des approximations successives il faut donc définir les
conditions suffisantes de convergence du processus itératif.
Théorème 3.5.1
Soit la fonction g :[a, b]→R définie et dérivable sur le segment [a, b] telle que toutes ses
valeurs g(𝑥) ∈ [𝑎, 𝑏]. S’il existe alors un nombre q tel |g′(𝑥)| ≤ 𝑞 ≤ 1 pour 𝑎 < 𝑥 < 𝑏
(3.5.6)
1. Le processus itératif
𝑥𝑛 = g(𝑥𝑛−1 ) (3.5.7)
2. La valeur limite
𝑟 = lim 𝑥𝑛 est l’unique racine de l’équation
𝑛→∞
𝑥 = g(𝑥) (3.5.8)
sur le segment [𝑎, 𝑏]
Démonstration
Considérons deux approximations successives 𝑥𝑛 = g(𝑥𝑛−1 ) et 𝑥𝑛+1 = g(𝑥𝑛 )
où 𝑥̅𝑛 ∈ (𝑥𝑛−1 , 𝑥𝑛 )
…………………………………………………………..
Considérons la série
telle que nos approximations successives 𝑥𝑛 soient les (n+1)-ièmes sommes partielles c’est-
à-dire,
𝑥𝑛 = 𝑆𝑛+1 𝑢0 = 𝑥0 𝑢1 = 𝑥1 − 𝑥0 , 𝑢2 = 𝑥2 − 𝑥1 , 𝑢3 = 𝑥3 − 𝑥2 , … , 𝑢𝑛 = 𝑥𝑛 − 𝑥𝑛−1
𝑆𝑛+1 = 𝑢0 + 𝑢1 + 𝑢2 + ⋯ + 𝑢𝑛 = 𝑥𝑛
1−𝑞 𝑛
≤ |𝑥0 | + (1 + 𝑞 + 𝑞 2 + 𝑞 3 + ⋯ + 𝑞 𝑛−1 )|𝑥1 − 𝑥0 | = |𝑥0 | + |𝑥1 − 𝑥0 |
1−𝑞
1−𝑞 𝑛
d’où |𝑥𝑛 | ≤ |𝑥0 | + |𝑥1 − 𝑥0 | avec 0 < 𝑞 < 1
1−𝑞
1−𝑞 𝑛
lim |𝑥𝑛 | ≤ |𝑥0 | + |𝑥1 − 𝑥0 |
𝑛→∞ 1−𝑞
D’où la série (2.5.11) converge et en plus elle converge d’une façon absolue. Par conséquent :
Critère d’arrêt
Le critère d’arrêt soit |𝑥1 − 𝑥0 | < 𝜀
Exemple 3.6.1
𝑥2 + 𝑦2 = 4
Soit le système de deux équations suivant : {
𝑒𝑥 + 𝑦 = 1
Pour ce système il est clair qu’il accepte deux solutions distinctes alors que pour d’autre
système une étude plus détaillé sera nécessaire pour déterminer le nombre de solutions. Un
système général de n équations à n inconnus x1, . . . , xn peut se mettre sous la forme
𝑓𝑖(𝑥1,𝑥2,..,𝑥𝑛)=0, i=1,..,n Avec f1,…,fn, sont des fonctions à n variables, ou sous la forme
vectorielles 𝐹(𝑋)=0 Le point de départ pour ce type de problème est la généralisation des
méthodes de résolution d’une équation non-linéaire (n=1) au système d’équations (n>1), mais
par exemple il est difficile ou impossible de généraliser toutes les techniques (méthode de
bissection et sécante), la méthode de Newton, par contre, admet bien la généralisation.
𝐹(𝑋) = 0
𝑓1 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 ) = 0
𝑓2 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 ) = 0
−−−−−−−−−−−
{𝑓𝑛 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 ) = 0
Par extraction d’une seule variable d’une des équations de façon à obtenir les schémas suivants :
𝑋 = 𝐹(𝑋)
𝑥1 = 𝐺1 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 )
𝑥2 = 𝐺2 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 )
−−−−−−−−−−−
{𝑥𝑛 = 𝐺𝑛 (𝑥1 , 𝑥2 , 𝑥3, … … 𝑥𝑛 )
Il faut noter qu’il n’est pas obligatoire d’extraire la première variable de la première équation
mais nous avons une multitude de combinaisons possibles. Le choix du schéma obtenu est régi
par la condition de convergence. Ensuite on passe au schéma de récurrence suivant :
𝑋 𝑘+1 = 𝐺(𝑋 𝑘 )
𝑥1𝑘+1 = 𝐺1 (𝑥1𝑘 , 𝑥2𝑘 , … , 𝑥𝑛𝑘 )
𝑥2𝑘+1 = 𝐺2 (𝑥1𝑘 , 𝑥2𝑘 , … , 𝑥𝑛𝑘 )
−−−−−−−−−−−
{𝑥𝑛𝑘+1 = 𝐺𝑛 (𝑥1𝑘 , 𝑥2𝑘 , … , 𝑥𝑛𝑘 )
Avec :
𝑥10
𝑋 0 ( … ) connu ou donné
𝑥𝑛0
Pour améliorer la convergence, on remarque qu’il est possible d’obtenir une autre configuration
basé sur l’utilisation des nouvelles valeurs de xi lorsqu’on calcule xj dans le cas ou j>i c’est-à-
dire :
Exemple 3.6.2.1
Utilisez la méthode d’itération pour trouver la solution du système d’équations non linéaire
suivant :
𝑥12 + 𝑥1 𝑥2 = 10
{
𝑥2 + 3𝑥1 𝑥22 = 57
Voici un réarrangement possible :
10 − 𝑥12
𝑥1 𝑥2
( )=( )
𝑥2 57 − 3𝑥1 𝑥22
L’utilisation d’une estimation initiale de 𝑥1 = 1,5 et 𝑥2 = 3,5 donne les résultats suivants :
10 − (1,5)2
𝑥1 = = 2,21429
3,5
10 − (1,5)2
𝑥1 = 2,21429
( )=( 3,5 )
𝑥2 57 − 3(2,21429)(3,5)2 = −24,37516
Pour l’itération suivante :
10 − (2,21429)2
𝑥1 = −0,20910
( ) = ( −24,37516 )
𝑥2 57 − 3(−0,20910)(−24,37516)2 = 429,709
𝑥1 √10 − 𝑥1 𝑥2
( ) = ( 57 − 𝑥 )
𝑥2 √ 2
3𝑥1
En utilisant les mêmes suppositions initiales, la première itération produit :
𝑓(𝑥0 + ℎ, 𝑦0 + 𝑘) = 0
{
𝑔(𝑥0 + ℎ, 𝑦0 + 𝑘) = 0
En développant au 1er ordre, il vient :
𝑓(𝑥0 , 𝑦0 ) = 𝑓(𝑥0 + ℎ, 𝑦0 + ℎ) = 𝑓(𝑥0 , 𝑦0 ) + ℎ𝑓𝑥 (𝑥0 , 𝑦0 ) + 𝑘𝑓𝑦 (𝑥0 , 𝑦0 ) = 0
{
𝑔(𝑥0 , 𝑦0 ) = 𝑔(𝑥0 + ℎ, 𝑦0 + ℎ) = 𝑔(𝑥0 , 𝑦0 ) + ℎ𝑔𝑥 (𝑥0 , 𝑦0 ) + 𝑘𝑔𝑦 (𝑥0 , 𝑦0 ) = 0
où l’on a posé :
𝜕𝑓(𝑥0 ,𝑦0 ) 𝜕𝑔(𝑥0 ,𝑦0 )
𝑓′(𝑥0 ) = 𝑔′(𝑥0 ) =
𝜕𝑥 𝜕𝑥
{ 𝜕𝑓(𝑥 ,𝑦 ) et { 𝜕𝑔(𝑥 ,𝑦 )
𝑓′(𝑦0 ) = 𝜕𝑦0 0 𝑔′(𝑦0 ) = 𝜕𝑦0 0
Le calcul est alors relancé jusqu’à ce que h et k deviennent inférieurs à une valeur ε que l’on
se donne (selon la précision voulue pour le calcul). Ainsi, l’algorithme correspondant est :
−𝑓(𝑥𝑖 , 𝑦𝑖 ) 𝑓𝑦 (𝑥𝑖 , 𝑦𝑖 )
𝑓(𝑥𝑖 , 𝑦𝑖 ) 𝑓𝑦 (𝑥𝑖 , 𝑦𝑖 )
| | | |
−𝑔(𝑥𝑖 , 𝑦𝑖 ) 𝑔𝑦 (𝑥𝑖 , 𝑦𝑖 )
𝑔(𝑥𝑖 , 𝑦𝑖 ) 𝑔𝑦 (𝑥𝑖 , 𝑦𝑖 )
𝑥𝑖+1 = 𝑥𝑖 + ℎ = 𝑥𝑖 + = 𝑥𝑖 −
∆ ∆
𝑓𝑥 (𝑥𝑖 , 𝑦𝑖 ) −𝑓(𝑥𝑖 , 𝑦𝑖 ) 𝑓𝑥 (𝑥𝑖 , 𝑦𝑖 ) 𝑓(𝑥𝑖 , 𝑦𝑖 )
| | | |
𝑔𝑥 (𝑥𝑖 , 𝑦𝑖 ) −𝑔(𝑥𝑖 , 𝑦𝑖 ) 𝑔𝑥 (𝑥𝑖 , 𝑦𝑖 ) 𝑔(𝑥𝑖 , 𝑦𝑖 )
{𝑦𝑖+1 = 𝑦𝑖 + ℎ = 𝑦𝑖 + ∆
= 𝑦𝑖 −
∆
𝑓𝑥 (𝑥𝑖 , 𝑦𝑖 ) 𝑓𝑦 (𝑥𝑖 , 𝑦𝑖 )
avec : ∆= | |
𝑔𝑥 (𝑥𝑖 , 𝑦𝑖 ) 𝑔𝑦 (𝑥𝑖 , 𝑦𝑖 )
Note : Cette méthode de peut être généralisée pour la résolution d’un système de n équations
non linéaires à n inconnues.
Exemple 3.6.2.2 Soit le système suivant dont les solutions sont représentées sur la figure ci -
dessous :
𝑥2 + 𝑦2 = 2
{ 2
𝑥 − 𝑦2 = 1
Chapitre Quatrième
𝑓(𝑥 + ℎ) − 𝑓(𝑥) ℎ ′′
𝑓 ′ (𝑥) = − 𝑓 (𝜉), 𝜉 ∈ ]𝑥, 𝑥 + ℎ[ (4.2)
ℎ 2
ainsi
𝑓(𝑥 + ℎ) − 𝑓(𝑥)
𝑓𝑑′ (𝑥) ≃ (4.3)
ℎ
est la formule de dérivée à droite d’ordre 1 avec une erreur est en 𝑜(ℎ).
𝑓(𝑥) − 𝑓(𝑥 − ℎ)
𝑓𝑔′ (𝑥) ≃ (4.4)
ℎ
′ (𝑥)
ℎ2 ′′ ℎ3 (3)
𝑓(𝑥 + ℎ) = 𝑓(𝑥) + ℎ𝑓 + 𝑓 (𝑥) + 𝑓 (𝜂1 ), 𝜂1 ∈ ]𝑥, 𝑥 + ℎ[
2 3!
et
′ (𝑥)
ℎ2 ′′ ℎ3 (3)
𝑓(𝑥 − ℎ) = 𝑓(𝑥) − ℎ𝑓 + 𝑓 (𝑥) − 𝑓 (𝜂1 ), 𝜂1 ∈ ]𝑥 − ℎ, 𝑥[
2 3!
d’où
ℎ3 (3)
𝑓(𝑥 + ℎ) − 𝑓(𝑥 − ℎ) = 2ℎ𝑓 ′ (𝑥)
+ [𝑓 (𝜂1 ) + 𝑓 (3) (𝜂2 )], 𝜂1 ∈ ]𝑥, 𝑥 + ℎ[, 𝜂2 ∈ ]𝑥 − ℎ, 𝑥[
3!
Ainsi
𝜉 ∈ ]𝑥 − ℎ, 𝑥 + ℎ[ tel que
′ (𝑥)
𝑓(𝑥 + ℎ) − 𝑓(𝑥 − ℎ) ℎ2 (3)
𝑓 = − 𝑓 (𝜉), 𝜉 ∈ ]𝑥 − ℎ, 𝑥 + ℎ[ (4.5)
2ℎ 6
𝑓(𝑥 + ℎ) − 𝑓(𝑥 − ℎ)
𝑓𝑐′ (𝑥) ≃ (4.6)
2ℎ
Dérivée seconde
On a
ℎ2 ′′ ℎ3 ℎ4
𝑓(𝑥 + ℎ) = 𝑓(𝑥) + ℎ𝑓 ′ (𝑥) + 𝑓 (𝑥) + 𝑓 (3) (𝑥) + 𝑓 (4) (𝜂1 ), 𝜂1 ∈ ]𝑥, 𝑥 + ℎ[
2 6 4!
et
′ (𝑥)
ℎ2 ′′ ℎ3 (3) ℎ4 (4)
𝑓(𝑥 − ℎ) = 𝑓(𝑥) − ℎ𝑓 + 𝑓 (𝑥) − 𝑓 (𝑥) + 𝑓 (𝜂2 ), 𝜂2 ∈ ]𝑥 − ℎ, 𝑥[
2 6 4!
Donc
ℎ4 (4)
𝑓(𝑥 + ℎ) + 𝑓(𝑥 − ℎ) = 2ℎ𝑓(𝑥) + ℎ 𝑓 2 ′′ (𝑥)
+ [𝑓 (𝜂1 ) + 𝑓 (4) (𝜂2 )],
4!
pour 𝜂1 ∈ ]𝑥, 𝑥 + ℎ[, 𝜂2 ∈ ]𝑥 − ℎ, 𝑥[. Ainsi
𝑓(𝑥 + ℎ) + 𝑓(𝑥 − ℎ) − 2𝑓(𝑥) ℎ2 (4) (4)
𝑓 ′′ (𝑥) = − 𝑓 [𝑓 (𝜂1 ) + 𝑓 (4) (𝜂2 )],
ℎ2 2.3!
avec 𝜂1 ∈ ]𝑥, 𝑥 + ℎ[, 𝜂2 ∈ ]𝑥 − ℎ, 𝑥[. Il s’en suit
𝑓(𝑥 + ℎ) − 2𝑓(𝑥) + 𝑓(𝑥 − ℎ) ℎ2 (4)
𝑓 ′′ (𝑥) = − 𝑓 (𝜉), 𝜉 ∈ ]𝑥 − ℎ, 𝑥 + ℎ[ (4.7)
ℎ2 2.3!
C’est une formule centrée d’ordre 2.
On peut établir la formule centrée d’ordre 4
−𝑓(𝑥 + 2ℎ) + 16𝑓(𝑥 + ℎ) − 30𝑓(𝑥) + 16𝑓(𝑥 − ℎ) − 𝑓(𝑥 − 2ℎ) ℎ4 (6)
𝑓 ′′ (𝑥) = + 𝑓 (𝜉)
12ℎ2 90
avec 𝜉 ∈ ]𝑥 − ℎ, 𝑥 + ℎ[.
4.2 Erreur
4.2.1 Dérivée du premier ordre
Théorème 4.2.1 Soient 𝑓: ℝ → ℝ de classe 𝒞 2 , 𝑥0 ∈ ℝ et ℎ > 0. Alors
ℎ
𝐸𝑑 = |𝑓 ′ (𝑥0 ) − 𝑓𝑑′ (𝑥0 )| ≤ max |𝑓′′(𝑥)|
2 𝑥∈[𝑥0,𝑥0+1]
Preuve. Soient 𝑓: ℝ → ℝ de classe 𝒞 2 , 𝑥0 ∈ ℝ et ℎ > 0 ; en utilisant le développement de
Taylor :
ℎ2
𝑓(𝑥0 + ℎ) = 𝑓(𝑥0 ) + ℎ𝑓 ′ (𝑥0 ) + 𝑓 ′′(𝜉) , 𝜉 ∈ [𝑥0 , 𝑥0 + ℎ]
2
alors
𝑓(𝑥0 + ℎ) − 𝑓(𝑥0 ) ℎ ℎ
|𝑓 ′ (𝑥0 ) − | = | 𝑓′′(𝑥)| ≤ max |𝑓′′(𝑥)|
ℎ 2 2 𝑥∈[𝑥0 ,𝑥0+1]
Alors, on obtient que :
ℎ
|𝑓 ′ (𝑥0 ) − 𝑓𝑑′ (𝑥0 )| ≤ max |𝑓′′(𝑥)|
2 𝑥∈[𝑥0 ,𝑥0+1]
Théorème 4.2.2 Soient : ℝ → ℝ de classe 𝒞 2 , 𝑥0 ∈ ℝ et ℎ > 0 . Alors
ℎ
𝐸𝑔 = |𝑓 ′ (𝑥0 ) − 𝑓𝑑′ (𝑥0 )| ≤ max |𝑓′′(𝑥)|
2 𝑥∈[𝑥0,𝑥0+1]
En appliquant la formule de Taylor d’ordre 3, on aura le théorème suivant :
Théorème 4.2.3 Soient : ℝ → ℝ de classe 𝒞 3 , 𝑥0 ∈ ℝ et ℎ > 0 . Alors
ℎ
𝐸𝑐 = |𝑓 ′ (𝑥0 ) − 𝑓𝑐′ (𝑥0 )| ≤ max |𝑓 (3) (𝑥)|
24 𝑥∈[𝑥0 −1,𝑥0+1]
2 2
D’où le résultat.
4.2.2 Dérivée du second ordre
En utilisant le même principe comme pour la première dérivée, il suffit dans ce cas de passer à
l’ordre 4 dans la formule de Taylor, on aura
𝑏 𝑛−1
∫ 𝑓(𝑥) 𝑑𝑥 = ∑ 𝑓(𝑥) 𝑑𝑥
𝑎 𝑖=0
Sur chaque [𝑥𝑖 , 𝑥𝑖 + 1], on applique une méthode d’intégration élémentaire en utilisant le
polynôme d’interpolation de Newton de 𝑓
𝑃𝑖 (𝑥) = 𝑓[𝑥𝑖 , 0] + 𝑓[𝑥𝑖 , 0, 𝑥𝑖,1 ](𝑥 − 𝑥𝑖 , 0) + ⋯ + 𝑓[𝑥𝑖 , 0, 𝑥𝑖,1 , … , 𝑥𝑖,𝑙 ](𝑥 − 𝑥𝑖,0 ) … (𝑥 − 𝑥𝑖,𝑙 )
en des points 𝑥𝑖,0 , … , 𝑥𝑖,𝑘 de l’intervalle [𝑎, 𝑏] (qui peuvent être ou non dans [𝑥𝑖 , 𝑥𝑖+1 ])
𝑏 𝑛−1
𝑏 𝑛−1 𝑥𝑖+1
𝑛−1
1
= ∑ (𝑥𝑖+1 − 𝑥𝑖 )(𝑓(𝑥𝑖+1 ) + 𝑓(𝑥𝑖 ))
2
𝑖=0
𝑛−1
ℎ𝑖+1 + ℎ𝑖 1
≃∑ 𝑓(𝑥𝑖 ) + (ℎ1 𝑓(𝑥0 ) + ℎ𝑛 𝑓(𝑥𝑛 ))
2 2
𝑖=0
𝑛−1
ℎ
≃ [𝑓(𝑎) + 𝑓(𝑏) + 2 ∑ 𝑓(𝑥𝑖 )]
2
𝑖=1
𝐼 = ∫ ln(𝑥) 𝑑𝑥
1
Donner une valeur approchée de l’intégrale 𝐼 en utilisant la méthode des trapèzes composite
1 3
avec 4 sous-intervalles. Cela revient à prendre ℎ = 2 et 𝑥0 = 𝑎 = 1 𝑥4 = 𝑏 = 3, 𝑥1 = 2 , 𝑥2 =
5
2 et 𝑥3 = 2
∫ 𝑓(𝑥) 𝑑𝑥 ≃ ∫ [𝑓(𝑥𝑖 ) + 𝑓[𝑥𝑖 , 𝑥𝑖+1 ](𝑥 − 𝑥𝑖 ) + 𝑓 [𝑥𝑖 , 𝑥𝑖−1 , 𝑥𝑖+1 ] (𝑥 − 𝑥𝑖 )(𝑥 − 𝑥𝑖+1 )] 𝑑𝑥
2
𝑥𝑖 𝑥𝑖
𝑥𝑖+1
1
= ℎ𝑖 𝑓(𝑥𝑖 ) + ℎ𝑖2 𝑓[𝑥𝑖 , 𝑥𝑖+1 ] + 𝑓 [𝑥𝑖 , 𝑥𝑖−1 , 𝑥𝑖+1 ] ∫ (𝑥 − 𝑥𝑖 )(𝑥 − 𝑥𝑖+1 ) 𝑑𝑥
2 2
𝑥𝑖
et
D’où
𝑏 𝑛−1
ℎ𝑖
∫ 𝑓(𝑥) 𝑑𝑥 = ∑ [𝑓(𝑥𝑖 ) + 4𝑓 (𝑥𝑖−1 ) + 𝑓(𝑥𝑖+1 )]
6 2
𝑎 𝑖=0
𝑏−𝑎
avec ℎ = 𝑛
𝐼 = ∫ 𝑥 3 𝑑𝑥
0
Pour 𝑛 = 2 on a ℎ = 3, d’où
ℎ
𝐼= (𝑓(0) + 𝑓(6) + 4𝑓(3)) = 324
3
3
Pour 𝑛 = 4 on a ℎ = 2, d’où
ℎ 3 9
𝐼= (𝑓(0) + 𝑓(6) + 2𝑓(3) + 4 (𝑓 ( ) + 𝑓 ( ))) = 324
3 2 2
On remarque que la méthode de Simpson est exacte pour le polynôme de degré inférieur ou
égal à 3.
4.3.4 Erreur de quadrature
Thème 4.3.4.1 Soit 𝑓 une fonction de classe 𝒞 𝑛+1 ([𝑎, 𝑏]) telle que 𝑓 (𝑛+1) existe sur ]𝑎, 𝑏[.
𝑏
Si les valeurs de 𝑓 aux points 𝑥0 , 𝑥1 , … , 𝑥𝑛 sont connues, et ∫𝑎 𝑃𝑖 (𝑥) 𝑑𝑥 est l’approximation
𝑏
d’ordre 𝑛 de ∫𝑎 𝑓(𝑥) 𝑑𝑥 où 𝑃𝑖 (𝑥) est le polynôme d’interpolation de Newton de la fonction 𝑓
alors :
𝑏 𝑏 𝑏 𝑛
𝑀𝑛+1
|∫ 𝑓(𝑥) 𝑑𝑥 − ∫ 𝑃𝑖 (𝑥) 𝑑𝑥| ≤ ∫ |∏(𝑥 − 𝑥𝑖 )| 𝑑𝑥
(𝑛 + 1)!
𝑎 𝑎 𝑎 𝑖=0
Pour la formule composée de la méthode des trapèzes, on en déduit que l’erreur est majorée
par
𝑏 𝑛−1
𝑏 − 𝑎 𝑓(𝑎) + 𝑓(𝑏) 𝑀2
|∫ 𝑓(𝑥) 𝑑𝑥 − ( + ∑ 𝑓(𝑥𝑖 ))| ≤ (𝑏 − 𝑎)3
2 2 12𝑛2
𝑎 𝑖=1
𝑀2 2
𝐸(𝑓) ≤ ℎ (𝑏 − 𝑎)
12
Erreur de la méthode de Simpson
Cette fois 𝑛 = 2 alors on a
𝑏 𝑏−𝑎 𝑎+𝑏 𝑀4 𝑏 𝑎+𝑏 2
|∫𝑎 𝑓(𝑥) 𝑑𝑥 − (𝑓(𝑎) + 𝑓(𝑏) + 4𝑓 ( ))| ≤ |∫ (𝑥 − 𝑎)(𝑥 − 𝑏) (𝑥 − ) | 𝑑𝑥
6 2 24 𝑎 2
𝑀4 𝑏 − 𝑎 5
≤ ( )
90 2
La formule composée correspondante avec pas constant ℎ donnera une erreur majorée par :
𝑛 𝑛
𝑏 −1 −1
2 2
𝑏−𝑎 𝑀4
|∫ 𝑓(𝑥) 𝑑𝑥 − [𝑓(𝑎) + 𝑓(𝑏) + 2 ∑ 𝑓(𝑥2𝑖 ) + 4 ∑ 𝑓(𝑥2𝑖+1 )]| ≤ (𝑏 − 𝑎)5
6 2880𝑛4
𝑎 𝑖=1 𝑖=0
Par ailleurs, la méthode de Simpson (bien que reposant sur une interpolant à trois points) est
exacte pour tout polynôme de degré inférieur ou égal à 3.
calculons l’erreur
2 2
𝑓 ′ (𝑥) = −2𝑥𝑒 −𝑥 , 𝑓 ′′ (𝑥) = 2(2𝑥 2 − 1)𝑒 −𝑥 ≤ 0 sur [0,1]
alors 𝑓′ est décroissante d’où 𝑀1 = |𝑓′(1)| = 0,735788 et
𝑀1 𝑀1
𝐸𝑟𝑒𝑐𝑡𝑎𝑛𝑔𝑙𝑒 (𝑓) ≤ (𝑏 − 𝑎)ℎ = = 0,367894
2 2
Méthode des trapèzes pour 𝑛 = 1
1
2 ℎ
∫ 𝑒 −𝑥 𝑑𝑥 = (𝑓(0) + 𝑓(1)) = 0,68394
2
0
Chapitre Cinquième
Ajustement linéaire
5.1 Contexte statistique
5.1.1 Point de départ
On souhaite prévoir et/ou expliquer les valeurs d’une variable numérique 𝑌 à partir des
valeurs d’une variable numérique 𝑋. Pour ce faire, on dispose de données qui sont 𝑛
valeurs du couple de variables (𝑋, 𝑌) notées (𝑥1 , 𝑦1 ); (𝑥2 , 𝑦2 ); … ; (𝑥𝑛 , 𝑦𝑛 ). Elles se
présentent généralement sous la forme d’un tableau :
𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑛
𝑦𝑖 𝑦1 𝑦2 … 𝑦𝑛
Ainsi, quand 𝑋 vaut 𝑥1 , on a mesuré la valeur 𝑦1 pour 𝑌, quand 𝑋 vaut 𝑥2 , on a mesuré la valeur
𝑦2 pour 𝑌…
5.1.2 Exemples
Exemple 1. Une étude a été menée auprès de 12 étudiants afin d’expliquer le score à un
examen de mathématiques à partir du temps consacré à la préparation de cet examen.
Pour chaque étudiant, on dispose :
▪ du temps de révision en heures (variable X)
▪ du score obtenu sur 800 points (variable Y)
𝑥𝑖 4 9 10 14 4 7 12 1 3 8 11 5
𝑦𝑖 390 580 650 730 410 530 600 350 400 590 640 450
Ainsi, avec une préparation de 4 heures, le premier étudiant a obtenu le score de 390 à
l’éxamen, avec une préparation de 9 heures, le deuxième étudiant a obtenu le score de 580 …
plus un terme d’erreur secondaire "de valeur moyenne nulle" et "indépendant de 𝑋 "
représentant une somme des petites variations aléatoires (erreurs de mesures, effets non
prévisibles…). Telle est la forme générique d’un modèle statistique connu : le modèle de
régression linéaire simple.
Pour toute valeur de 𝑥 de 𝑋, une valeur estimée 𝑦 de 𝑌 est donnée par :
𝑦 = 𝑎 + 𝑏𝑥
où 𝑎 désigne une valeur estimée de 𝛼 et 𝑏 désigne une valeur estimée de 𝛽, toutes les deux
calculées à l’aide des données.
Ainsi, à partir des valeurs 𝑥 de 𝑋, estimer avec précision les valeurs de 𝑌 correspondantes
revient à déterminer 𝑎 et 𝑏 de sorte que la droite d’équation 𝑦 = 𝑎 + 𝑏𝑥 ajuste au mieux le
nuage de points.
Exemples
Retour sur l’exemple 1 (§5.1.2)
Une étude a été menée auprès de 12 étudiants afin d’expliquer le score à un examen de
mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque étudiant,
on dispose du temps de révision en heures (variable X) et du score obtenu sur 800 points
(variable Y).
La silhouette du nuage de points est étirée dans une direction, une relation affine entre 𝑌 et 𝑋
est envisageable. Ainsi, à partir des valeurs 𝑥 de 𝑋, estimer avec précision les valeurs de 𝑌
correspondantes revient à déterminer 𝑎 et 𝑏 de sorte que la droite d’équation 𝑦 = 𝑎 + 𝑏𝑥 ajuste
au mieux le nuage de points.
Après plusieurs essais graphiques "à l’œil ", en utilisant la calculatrice (ou autre), on constate
que la droite suivante ajuste "pas trop mal" le nuage de points.
Ainsi, avec cette méthode "au jugé", on propose les coefficients 𝑎 = 300 et 𝑏 = 29,5, pour
une droite d’équation : 𝑦 = 𝑎 + 𝑏𝑥. Avec cette équation, on peut alors faire des prévisions. Par
exemple, une valeur estimée du score d’un étudiant ayant consacré 16 heures de préparation à
l’examen est :
𝑦 = 𝑎 + 𝑏𝑥 = 300 + 29,5 × 16 = 772
Commentaire : Ce score est en fait une valeur estimée de la moyenne de tous les scores des
étudiants ayant fait une préparation de 16 heures, valeur que l’on attribue à tous ces étudiants.
Aussi, avec cet ajustement, un étudiant peut espérer avoir la moyenne, donc un score de plus
de 400 sur 800, en ayant fait une préparation de plus de 𝑥 heures, avec 𝑥 vérifiant :
400 − 300
𝑦 ≥ 400 ⇔ 300 + 29,5 × 𝑥 ≥ 400 ⇔ 𝑥≥ = 3,389831
29,5
𝑥𝑖 1 2 3 4 5 6 7 8 9 10 11 12
𝑦𝑖 37 43 41 40 51 47 48 54 56 64 66 73
Le nuage de points associé est :
Par exemple, le quatrième point du nuage en partant de la gauche correspond au rang 4 Avril :
le point 𝑀4 correspondant est de coordonnées (4; 40).
La silhouette du nuage de points est étirée dans une direction, une relation affine entre 𝑌 et 𝑋
est envisageable. Ainsi, à partir des valeurs 𝑥 de 𝑋, estimer avec précision les valeurs de 𝑌
correspondantes revient à déterminer 𝑎 et 𝑏 de sorte que la droite d’équation 𝑦 = 𝑎 + 𝑏𝑥 ajuste
au mieux le nuage de points.
De nouveau, après plusieurs essais graphiques "à l’œil", en utilisant la calculatrice (ou autre),
on constate que la droite suivante ajuste "pas trop mal" le nuage de points :
Ainsi, avec cette méthode "au jugé", on propose les coefficients 𝑎 = 35 et 𝑏 = 2,5, pour une
droite d’équation : 𝑦 = 𝑎 + 𝑏𝑥. Avec cette équation, on peut alors faire des prévisions. Par
exemple, au rang 13 correspondant au mois de janvier 2017, une valeur estimée du nombre
d’inscriptions au jeu en milliers est :
𝑦 = 𝑎 + 𝑏𝑥 = 35 + 2,5 × 13 = 67,5
Aussi, avec cet ajustement, on peut espérer que le nombre d’inscriptions au jeu dépasse 80000
au rang 𝑥, avec 𝑥 vérifiant :
80 − 35
𝑦 ≥ 80 ⇔ 35 + 2,5 × 𝑥 ≥ 80 ⇔ 𝑥≥ = 18
2,5
Cette droite, que l’on suppose unique, est appelée droite de régression.
L’idée de cette méthode est de déterminer une droite qui minimise une mesure totale des écartes
entre les points du nuage et les points de mêmes abscisses se trouvant sur la droite. Ainsi, plus
cette mesure est petite, plus la droite est proche de tous les points du nuage, meilleur est
l’ajustement.
5.2.2 Illustration
Dans le graphique ci-dessous, chaque segment violet relie un point du nuage et le point de
même abscisse se trouvant sur la droite d’équation 𝑦 = 𝑎 + 𝑏𝑥
Ainsi, pour tout 𝑖 ∈ {1, … , 𝑛}, le 𝑖 − è𝑚𝑒 segment relie le point 𝑀𝑖 de coordonnées (𝑥𝑖 ; 𝑦𝑖 ) et
le point 𝑃𝑖 de coordonnées (𝑥𝑖 ; 𝑎 + 𝑏𝑥𝑖 ). La longueur de ce segment correspondant à la
distance 𝑑𝑖 = |𝑦𝑖 − (𝑎 + 𝑏𝑥𝑖 )|
∑ 𝑑𝑖2
𝑖=1
5.2.3 Notations
Dorénavant, on pose :
𝑛 𝑛
1 1
𝑥̅ = ∑ 𝑥𝑖 , 𝑦̅ = ∑ 𝑦𝑖
𝑛 𝑛
𝑖=1 𝑖=1
𝑛 𝑛
1 1
𝜎𝑥,𝑦 = ∑(𝑥𝑖 − 𝑥̅ )(𝑦𝑖 − 𝑦̅) = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ × 𝑦̅
𝑛 𝑛
𝑖=1 𝑖=1
𝑛 𝑛 𝑛 𝑛
1 1 1 1
𝜎𝑥 = √ ∑(𝑥𝑖 − 𝑥̅ )2 = √ ∑ 𝑥𝑖2 − 𝑥̅ 2 , 𝜎𝑦 = √ ∑(𝑦𝑖 − 𝑦̅)2 = √ ∑ 𝑦𝑖2 − 𝑦̅ 2
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
𝑛
1 2
|𝑟| = √1 − 2 ∑(𝑦𝑖 − (𝑎 + 𝑏𝑥𝑖 ))
𝑛𝜎𝑦
𝑖=1
Critères
Partant de 𝑟 2 , on adopte les critères numériques suivants :
Exemples
Retour sur l’exemple 1 (§5.1.2)
Une étude a été menée auprès de 12 étudiants afin d’expliquer le score à un examen de
mathématiques à partir du temps consacré à la préparation de cet examen. Pour chaque étudiant,
on dispose du temps de révision en heures (variable X) et du score obtenu sur 800 points
(variable Y)
Les résultats sont :
𝑥𝑖 4 9 10 14 4 7 12 1 3 8 11 5
𝑦𝑖 390 580 650 730 410 530 600 350 400 590 640 450
En utilisant les formules ci-haut données et après calaculs, on obtient :
𝑛 𝑛 𝑛 𝑛
1 1 1 1
𝑥̅ ∑ 𝑥𝑖2 𝑦̅ ∑ 𝑥𝑖 𝑦𝑖 𝜎𝑥2 = ∑ 𝑥𝑖2 − 𝑥̅ 2 𝜎𝑥,𝑦 = ∑ 𝑥𝑖 𝑦𝑖 − 𝑥̅ × 𝑦̅
𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1 𝑖=1
7,333333 68,5 526,6667 4300,833 14,72223 438,6107
𝜎𝑥,𝑦 438,6107
𝑏= = = 29,7924
𝜎𝑥2 14,72223
et