Vous êtes sur la page 1sur 9

AJUSTEMENTS

13

2. Ajustements
2.1.

Un peu d'histoire

Adrien-Marie Legendre
(Paris, 18/9/1752 Paris, 10/1/1833)
De Legendre, on ne connat que
cette caricature. On sait depuis
peu que le portrait
habituel cicontre est celui
d'un autre
Legendre.

2.2.

Le problme de l'ajustement d'un ensemble de points reprsents dans un systme d'axes


par une droite, ou plus gnralement par une courbe, est essentiel dans le
dveloppement de la statistique.
Au 18me sicle, Leonhard Euler et Tobias Mayer dveloppent, indpendamment l'un de
l'autre, la mthode des moyennes permettant d'ajuster des points par une droite.
Le premier texte paru faisant mention de la mthode des moindres carrs est d
Adrien-Marie Legendre dans un article sur ses nouvelles mthodes pour la
dtermination des orbites des comtes , publi en 1805. Un an plus tard, Gauss fait
aussi allusion cette mthode. C'est avec l'apparition de la loi normale que cette
mthode va trouver sa justification et va devenir pour longtemps la mthode
d'ajustement.
La paternit de la corrlation a donn lieu une littrature abondante. Signalons
simplement que Galton exprime le dsir de construire un coefficient de rversion qui se
mutera en rgression et qu'en 1888 il utilise les termes de partial co-relation
annonant dj la corrlation multiple. En 1896, Karl Pearson reprend les concepts de
Galton pour leur donner leur forme actuelle. Au 20me sicle, d'autres mesures
d'association allaient natre comme, en 1904, le coefficient de corrlation de rang avec
Spearman et la mme anne la statistique classique du chi-deux par Pearson.

Ajustement affine graphique


Soient les n points du nuage reprsentant, dans un repre cartsien, la srie des n valeurs
(xi, yi) des variables x et y. Ajuster une droite d ce nuage de points consiste
remplacer chaque point (xi, yi) par un point de mme abscisse et d'ordonne yi , les
points xi , y i tant aligns sur la droite d.
Une fois l'quation de la droite d dtermine, on pourra l'utiliser pour faire des
interpolations (calculs de valeurs intermdiaires) et des extrapolations (calculs de
valeurs futures).
La mthode graphique consiste tracer, l'il, l'aide d'une rgle transparente, une
droite y = mx + h s'ajustant le mieux possible sur le nuage de points.

Les points noirs reprsentent


les donnes.
Les points rouges A et B sont
les points choisis pour tracer la
droite. Ils peuvent tre choisis
parmi les points noirs (A) ou
pas (B).

Didier Mller - LCP - 2013

Cahier Statistiques

CHAPITRE 2

14
quation de la droite
d'ajustement

Une fois la droite trace, on choisit sur le dessin deux points A et B quelconques de la
droite pour en dterminer l'quation. Ces points ne doivent pas obligatoirement faire
partie du nuage de points.

Cette mthode est

Rappel : L'quation de la droite passant par les points A(xA, yA) et B(xB, yB) est donne
yB yA
x xB
par : y y B=
xB xA

couramment employe, en
raison de sa rapidit et de sa
simplicit. Elle est empirique,
mais donne de trs bons
rsultats.

Les points A et B choisis dans notre exemple ont comme coordonnes (3, 16.5) et (6,
18.5). La droite passant par ces deux points est :
y 18.5=

empirique : bas sur


l'exprience

2.3.

18.5 16.5
x 6
63

2
On obtient aprs simplification : y= x14.5 .
3

Droite de Mayer
Mthode On dcoupe le nuage de points en deux sous-ensembles de mme effectif. Pour chacun
des deux sous-ensembles, on calcule la moyenne des xi et la moyenne des yi. On obtient
ainsi deux points x1 , y1 et x 2 , y 2 , appels points moyens. Il reste tracer la droite
passant par ces deux points.

L'quation de cette droite s'obtient de la mme faon que pour un ajustement affine
graphique.

2.4.

Ajustement analytique par la mthode des moindres carrs

y i est la coordonne verticale

du point de la droite d'abscisse


xi. Donc y i=a xib .

L'ajustement linaire par la mthode des moindres carrs consiste dterminer la droite
(que l'on appelle aussi droite de rgression) telle que la somme des carrs des n valeurs
yi y i soit minimale (ce qui explique le nom de la mthode).

Sur le dessin, chaque trait


vertical rouge reprsente
la valeur yi y i

Cahier Statistiques

Didier Mller - LCP - 2013

AJUSTEMENTS

15

On veut donc minimiser la quantit q= y i a xi b .


2

Rappelons que la valeur minimale d'une fonction se calcule en posant sa drive gale
0. Pour trouver a et b, calculons cette drive.
Calculons d'abord la drive de q par rapport a.
dq
=2 yi a xi b xi =0
da

xi yi =a x2i b x i
Karl Pearson

(1)

Calculons maintenant la drive de q par rapport b.

(Londres, 27/3/1857 Coldharbour, 27/4/1936)

dq
= 2 yi a xi b=0
db

y i = a x i b
y i = a x i nb

Divisons le tout par n

y=a x b
b= y a x

(2)

Ce rsultat indique que la droite passe par le point moyen x ; y .


Introduisons le rsultat de (2) dans (1) pour trouver a :

xi yi =a x2i ya x x i

xi yi =a x2i y xi a x x i
a x i a x xi = xi yi y x i
2

x i yi y xi
a=

x 2i x x i
x i yi n x y
a=

1
xi y i x y
n

x 2i n x2

1
xi2 x2
n

xy
x2

La droite des moindres carrs y = ax + b a pour coefficients :

a=

Remarque

Didier Mller - LCP - 2013

1
xi yi x y
n
1
x2i x2
n

et

b= y a x

Certaines calculatrices ont des fonctions statistiques qui fournissent ces valeurs trs
rapidement. Consultez le mode d'emploi de votre machine !

Cahier Statistiques

CHAPITRE 2

16

Lors d'une exprience, on a relev les valeurs suivantes :

Exercice 2.1

x
y

1
1.1

2
3.1

3
4.7

4
7.3

5
9.2

6
11.1

7
12.9

8
15.4

9
17

10
18.8

Donnez l'quation d'une droite ajustant ces valeurs


a. l'il ;
b. par la mthode de Mayer ;
c. par la mthode des moindres carrs.
d. Dessinez les droites obtenues en b et c.
e. Interpolez la valeur de y pour x = 6.3 grce aux droites obtenues en b et c.
Le tableau ci-dessous montre l'volution des temps olympiques du 200 m plat, en
secondes, pour les hommes et pour les femmes.

Exercice 2.2

Londres 1948
Helsinki 1952
Melbourne 1956
Rome 1960
Tokyo 1964
Mexico 1968
Munich 1972
Montral 1976
Moscou 1980
Los Angeles 1984
Soul 1988
Barcelone 1992
Atlanta 1996
Sydney 2000
Athnes 2004
Pkin 2008
Londres 2012

Vous remarquerez que les


mesures au centime de
seconde apparaissent en 1968
pour les hommes et en 1972
pour les femmes.

200 m hommes
21.1
20.7
20.6
20.5
20.3
19.83
20.00
20.23
20.19
19.80
19.75
19.73
19.32
20.09
19.79
19.30
19.32

200 m femmes
24.4
23.7
23.4
24.0
23.0
22.5
22.40
22.37
22.03
21.81
21.34
21.72
22.12
21.84
22.05
21.74
21.88

Donnez l'quation des droites (celle des performances des hommes et celle des
performances des femmes) ajustant ces valeurs
a. l'il ;
b. par la mthode des moindres carrs.
c. Dessinez les droites obtenues en b.
d. Estimez les temps olympiques de 2016.
e. D'aprs les droites obtenues en b, en quelle anne les femmes courront-elles le 200
m plat aussi vite que les hommes ?
f. Ces ajustements affines sont-ils adquats ?

2.4.

Coefficient de corrlation linaire


Dfinition On nomme coefficient de corrlation linaire des variables x et y, le nombre rel :
r=
n

avec

Cahier Statistiques

xy=

1
x y x y
n i=1 i i

x=

xy
xy
n

1
x2 x2
n 1 i

y=

1
y2 y 2
n 1 i

Didier Mller - LCP - 2013

AJUSTEMENTS

17

Interprtation r est un nombre rel compris entre 1 et 1.


Quand | r | = 1, tous les points sont aligns.
Quand | r | est proche de 1, les variables x et y sont fortement corrles.
Quand r < 0, la droite de rgression a une pente ngative.
Quand r > 0, la droite de rgression a une pente positive.
Rendez chacun des nuages de points ci-dessous son coefficient de corrlation linaire :
0.98, 0.50, 0.53, 0.94.

Exercice 2.3

6
5

5
4

4
3

a.

b.
1

7
6

3
2

c.

d.
1

Exercice 2.4

Les criquets ont un organe spcial sur leurs ailes avant qui produit un son lorsqu'ils
frottent leurs ailes les unes contre les autres. En rgle gnrale, plus la temprature de
l'air est leve, plus ils frottent leurs ailes rapidement. La relation entre la temprature et
le nombre de pulsations par seconde est bien approche par une droite de rgression
(chaque espce a sa droite propre). On a relev les mesures suivantes :

Temprature (C) [x]


# de pulsations par sec. [y]

15
13.5

17
14.1

20
14.5

21
14.4

23
16.3

24
15.5

27
17.1

28
17.8

30
18.2

32
20.2

34
20.1

a. Donnez la droite des moindres carrs ajustant ce nuage de points.


b. Calculez le coefficient de corrlation linaire.
c. Si la temprature augmente de 3C, de combien augmentera le nombre de
pulsations ?

2.5.

Ajustements non linaires


Dans certains cas, l'ajustement une fonction linaire n'est pas adquat : un ajustement
des donnes une fonction non linaire doit tre envisag.
Les cas que nous considrerons sont ceux o on peut se ramener par une simple
transformation un ajustement affine.

Didier Mller - LCP - 2013

Cahier Statistiques

CHAPITRE 2

18

Les points (x ; y ) ne sont pas aligns, mais plutt proches d'une certaine hyperbole de

i
i
Ajustement par une
1
la forme y =
.
hyperbole
a xb

droite de rgression de z en x :
z est la valeur estimer et joue

1.
2.

le rle de l'ordonne, x joue le


rle de l'abscisse.

Exercice 2.5

3.

1
;
yi
dterminer l'quation de la droite de rgression de z en x avec la mthode des
moindres carrs ;
de l'quation obtenue z=a xb , on dduit immdiatement l'quation de
1
l'hyperbole y=
.
a xb
calculer z i =

Ajustez ce nuage de points par une hyperbole y=

1
.
a xb

10

1.1

0.43

0.19

0.15

0.08

0.05

0.06

0.05

0.04

0.04

0.03

Les points (x ; y ) sont proches d'une courbe de fonction puissance comme y=b xa . On

i i
Ajustement par une
remarque que ln(y) = aln(x) + ln(b).
fonction puissance

droite de rgression de v en u :

1.
2.

v est la valeur estimer et joue


le rle de l'ordonne, u joue le
rle de l'abscisse.

Exercice 2.6

Cahier Statistiques

3.

calculer ui =ln xi et v i =ln yi ;


dterminer l'quation de la droite de rgression de v en u avec la mthode des
moindres carrs ;
de l'quation obtenue v = Au + B, on dduit l'quation de la fonction puissance
a
y=b x , puisque a = A et b = eB.

Ajustez ce nuage de points par une fonction puissance y=b xa .


x

0.5

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

0.1

0.5

1.4

2.7

5.1

7.6

11.2 15.9 22.3 28.1

Didier Mller - LCP - 2013

AJUSTEMENTS

Exercice 2.7
En gomtrie, le grand axe

19

Dans le tableau ci-dessous, on a donn pour chaque plante du systme solaire le demigrand axe de l'orbite et la priode de rvolution. Le demi-grand axe est exprim en
units astronomiques (UA). On appelle unit astronomique le demi-grand axe de l'orbite
terrestre. Il vaut 149'600'000 km . La priode de rvolution est exprime en annes.

d'une ellipse est un paramtre


utilis pour dcrire la dimension

Plantes

de cette conique.

Mercure

0.38710

0.24084

Vnus

0.72333

0.61519

Terre

Mars

1.52369

1.88082

Jupiter

5.20280

11.8618

Saturne

9.53884

29.4567

Uranus

19.1819

84.0107

Neptune

30.0578

164.786

Le demi-grand axe est la moiti


du grand axe.

Hale-Bopp a probablement t
la comte la plus observe de
l'histoire. Trs brillante, elle a
t visible 18 mois, avec son
maximum d'clat en 1997.

Demi-grand axe (UA) Priode (annes)

a. Trouvez la relation qui existe entre la priode et le demi-grand axe l'aide de la


mthode des moindres carrs. Cette relation est la troisime loi de Kepler.
b. L'existence de cette relation est vidente lorsque l'on choisit une chelle
logarithmique. Utilisez le papier millimtr en fin de ce chapitre pour reporter les
priodes en fonction du demi-grand axe.
c. Il y a un trou sur le graphe entre Mars et Jupiter. Comment peut-on l'expliquer ?
d. La comte de Hale-Bopp a une priode de 2530 ans. Que vaut le demi-grand axe ?
Les points (x ; y ) sont proches d'une courbe d'une exponentielle de la forme y=b a x .

i
i
Ajustement par une
On remarque que ln(y) = xln(a) + ln(b).
exponentielle

1.
2.
3.

Exercice 2.8

Didier Mller - LCP - 2013

calculer z i =ln yi ;
dterminer l'quation de la droite de rgression de z en x avec la mthode des
moindres carrs ;
de l'quation obtenue z = Ax + B, on dduit l'quation de l'exponentielle
x
y=b a , puisque a = eA et b = eB.

Ajustez ce nuage de points par une exponentielle de la forme y=b a x .


x

1.0

1.5

2.0

2.5

3.0

3.5

4.0

4.5

5.0

0.2

0.3

0.5

0.6

0.7

1.1

1.6

2.4

3.3

Cahier Statistiques

CHAPITRE 2

20

Ajustement par une


fonction
logarithmique

Les points (xi ; yi) sont proches d'une courbe logarithmique de la forme y= a ln xb .
1.
2.

calculer z i =ln x i ;
dterminer l'quation de la droite de rgression de y en z avec la mthode des
moindres carrs ;
de l'quation obtenue y = az + b, on dduit l'quation de la fonction
logarithmique y= a ln xb .

3.

Exercice 2.9

Exercice 2.10

Ajustez ce nuage de points par une fonction logarithmique y= a ln xb .


x

10

1.1

2.9

4.4

5.1

5.8

6.5

6.8

7.3

7.7

7.8

tudions l'volution des records de l'preuve d'athltisme du 100 mtres masculin.


Pour cela, on cherche un ajustement des records pour en prvoir l'volution. On donne
dans le tableau suivant certains records, tablis depuis 1900.
Anne
Rang (xi)
Temps en sec. (yi)

1900

1912

1921

1930

1964

1983

1991

1999

12

21

30

64

83

91

99

10.80

10.60

10.40

10.30

10.06

9.93

9.86

9.79

1) tude d'un modle affine


a. Construisez le nuage de points M(xi ; yi), avec i compris entre 1 et 8, associ cette
srie statistique double. Vous prendrez comme unit graphique 1 cm pour dix ans en
abscisse et 1 cm pour un dixime de seconde en ordonnes.
On commencera les graduations au point de coordonnes (0 ; 9).
b. Peut-on envisager un ajustement affine court terme ? Cet ajustement permet-il des
prvisions pertinentes long terme sur les records futurs ?
2) tude d'un modle exponentiel
Aprs tude, on choisit de modliser la situation par une autre courbe. On effectue
les changements de variables suivants : X = e0.00924x et Y = ln y. On obtient :
X = e0.00924x

1.000

0.895

0.824

0.758

0.554

0.464

0.431 0.401

Y = ln(y)

2.380

2.361

2.342

2.332

2.309

2.296

2.288 2.281

a. Donnez une quation de la droite de rgression de Y en X obtenue par la mthode


des moindres carrs.
Cahier Statistiques

Didier Mller - LCP - 2013

AJUSTEMENTS

21

b. En dduire que l'on peut modliser une expression de y en fonction de x sous la


forme suivante :
y = exp(ae0.00924x + b) o a et b sont deux rels dterminer.
c. A l'aide de cet ajustement, quel record du 100 mtres peut-on prvoir en 2010 ?
d. Calculez la limite en + de la fonction f dfinie sur par l'expression suivante :
f (x) = exp(0.154 e0.00924x + 2.221)
e. Que peut-on en conclure, en utilisant ce modle, quant aux records du cent mtres
masculin, trs long terme ?

exp(x) = ex

Exercice 2.11

Le 14 octobre 2012, l'autrichien Flix Baumgartner effectuait le plus spectaculaire des


sauts en chute libre , emmen par un ballon stratosphrique l'altitude de 39'045 m.
Ce plongeon dura au total 549 secondes. Un appareil a enregistr la vitesse verticale Vz
en fonction du temps. La vitesse maximum de 373 m/s a t atteinte en t = 40 s. Le
prcdent record remontait 1960.
Le tableau 1 contient les mesures faites pendant les 35 premires secondes de chute.
Tableau 1
T (s)

12

20

26

30

35

Vz (m/s)

49

115

195

254

287

340

Le tableau 2 contient les mesures ralises entre 50 s et 260 s, une zone dans laquelle la
force de trane (force arodynamique de freinage) devient importante, jusqu'
compenser compltement le poids du sauteur.
Tableau 2
t (s)

50

70

100

130

180

230

260

t' = t50 (s)

20

50

80

130

180

210

352

254

158

102

69

51

51

Vz (m/s)

a. Reprsentez la fonction Vz(t). En particulier, extrapolez la fonction entre les temps


t = 35 s et t = 50 s.
b. Vrifiez que durant les 35 premires secondes la chute de F. Baumgartner est libre.
Donnez les quations du mouvement z(t), Vz(t) et az(t) correspondantes.
c. l'aide du graphique de point a, estimez la distance parcourue par F. Baumgartner
durant les 260 premires secondes du vol et sa vitesse limite Vlim avant l'ouverture
du parachute.
d. Reprsentez la fonction f(t') = ln(Vz(t')Vlim) pour t'>0. Dduisez-en l'quation de la
vitesse de F. Baumgartner en fonction de t'.
e. Sachant que F. Baumgartner a ouvert son parachute 1.6 km d'altitude, estimez la
date de cette ouverture, ainsi que la dure de la phase avec parachute.

2.6.

Ce qu'il faut absolument savoir

Faire un ajustement affine graphique


Faire un ajustement affine par la mthode de Mayer
Faire un ajustement affine par la mthode des moindres carrs
Estimer et interprter un coefficient de corrlation linaire
Faire un ajustement par une hyperbole
Faire un ajustement par une fonction puissance
Faire un ajustement par une exponentielle
Faire un ajustement par une fonction logarithmique

Didier Mller - LCP - 2013

ok
ok
ok
ok
ok
ok
ok
ok

Cahier Statistiques

Vous aimerez peut-être aussi