Vous êtes sur la page 1sur 2

OUTILS MATHMATIQUES

fiche 5

Rgression linaire

5.1 Position du problme.


Supposons quune certaine grandeur physique y varie avec une autre grandeur x selon une loi affine :
BCPST1 Fnelon
y = a xClatin
Nicolas + b 2009 (1)

On souhaite vrifier exprimentalement cette loi, et dterminer les valeurs exprimentales de a et b. Pour
cela, on mesure y pour diffrentes valeur de la grandeur x, ce qui revient obtenir un tableau de la forme :

x1 x2 ... xN
y1
e i = -1
y2 ... yN

On peut vrifier que y varie de faon affine avec x en reportant sur un graphique les couples de points
(x1 , y1 ); . . . ; (xN , yN ). Sur lexemple ci-dessous, on voit que les points sont raisonnablement bien aligns, les
carts tant dus aux incertitudes de mesures (imprcision du matriel et surtout de lexprimentateur).

certains droits rservs


ne peut pas tre vendu x

5.2 La rgression linaire.


Pour dterminer a et b, il faut tracer la droite qui passe par lensemble de ces points exprimentaux ;
or ils ne sont pas parfaitement aligns. La rgression linaire est un algorithme qui permet de trouver la
meilleure droite partir de ces points. En pratique, il suffit de rentrer dans sa calculatrice les couples de points
(x1 , y1 ); . . . ; (xN , yN ). Le programme (implant par dfaut dans toutes les machines modernes) donne trois
nombres :
le coefficient directeur a0 de la meilleure droite trouve,
lordonne lorigine b0 de la meilleure droite trouve,
le coefficient de corrlation R, ou son carr R2 .

Les valeurs de a0 et b0 constituent des valeurs exprimentales des paramtres a et b du modle (1). Il
appartient ensuite lexprimentateur de discuter de la validit de ces valeurs. Le coefficient de corrlation
donne une indication sur lalignement des points exprimentaux : plus |R| ou R2 sont proches de 1, mieux
les points sont aligns. Le coefficient de corrlation donne donc une indication sur la validit du modle (1) :
y varie-t-elle bien de faon affine avec x ? (Le signe de R na aucune importance, il est le mme que celui de a.)
Certains droits rservs: http://creativecommons.org/licenses/by-nc-sa/2.0/fr/
Disponible gratuitement: http://campus.claroline.com/claroline/course/index.php?cid=NC04

5.3 Les piges de la rgression linaire.


La rgression linaire est un algorithme purement mathmatique qui donne btement une rponse. Pour
toute collection de points, le programme dtermine une droite. Cest lexprimentateur dtre critique vis--vis
de la rponse. Un bon alignement des points correspond une valeur de |R| trs proche de 1, par
exemple 0, 99 ou plus.
Ainsi, les points suivants ne sont pas du tout aligns (a ressemble plutt une parabole). Nanmoins, la
rgression linaire dtermine une droite (en pointill) ; mais R = 0, 6, ce qui loin de 1.

BCPST1 Fnelon
Nicolas Clatin 2009

Un mauvais coefficient de corrlation ne signifie pas que les points ne soient pas bien aligns. Par exemple,
il arrive frquemment quil y ait un point abrrant (erreur de mesure, usuellement lexprimentateur avait la
tte en lair...). La machine donne au point abrrant le mme poids que les autres, ce qui fait diminuer R. Si
on met le point abrrant de ct, R est nettement meilleur.

point abrrant
y
e i = -1 y

x x

R = 0,98 R = 0,999

certains droits rservs


ne peut pas tre vendu
Dautre part, moins les points exprimentaux sont nombreux, moins significative est la rgression linaire.
Le cas extrme est celui de 3 points, dont un est abrrant ; on limpression que ce nest pas du tout align, et
on ne peut rien conclure car on ne sait gnralement pas quun point est aberrant (on ne fait gnralement pas
exprs de rater une mesure !).

Inversement, si |R| est trs proche de 1, il ne faut pas conclure que la loi affine soit vrifie. Ainsi dans
lexemple suivant, les points sont en fait distribus sur une parabole trs aplatie, ce qui fait que la droite trouve
par lalgorithme est effectivement trs proche de chaque point. Le cerveau de lexprimentateur est bien plus
performant que la calculatrice, et voit bien que y ne varie pas de faon affine avec x. La rgression linaire
na pas de validit si elle nest pas associe un graphique.

R = 0,98

BCPST1 Nicolas Clatin septembre 2009 Outils mathmatiques 5 page 2