Vous êtes sur la page 1sur 6

Statistiques deux variables

Ajustements affines
Christophe ROSSIGNOL
Anne scolaire 2009/2010

Table des matires


1 Srie statistique deux variables

1.1

Dfinition Nuage de points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2

Point moyen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.3

Ajustement dune srie statistique deux variables . . . . . . . . . . . . . . . . . . . . . . . . . .

2 Ajustement par la mthode des moindres carrs

2.1

Principe de la mthode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

2.2

Ajustement affine . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Table des figures


1

Nuage de points

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Mthode des moindres carrs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Droite de rgression de y en x . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Liste des tableaux


1

Part consacr au logement dans un foyer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Part consacr au logement dans un foyer (bis) . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Calcul de la covariance et de la variance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Ce

cours est plac sous licence Creative Commons BY-SA http://creativecommons.org/licenses/by-sa/2.0/fr/

SRIE STATISTIQUE DEUX VARIABLES

Rappels de premire : 1, 3 page 471 5 page 472 4 page 473 [Dclic]

Srie statistique deux variables

1.1

Dfinition Nuage de points

Dfinition : On appelle srie statistique deux variables (ou srie statistique doubles) une srie statistique
o deux caractres sont tudis simultanment.
Remarques :
1. Dans ce chapitre, on ntudiera que des sries statistiques doubles dont les deux caractres tudis
sont quantitatifs.
Si ,pour chacun des n individus de la population, on note xi et yi les valeurs prises par les deux
caractres, on peut alors prsenter la srie statistique sous la forme dun tableau :
Caractre x
Caractre y

x1
y1

x2
y2

...
...

xn
yn

2. Si lun des deux caractres tudis est une mesure de temps, on parle de srie chronologique.
Dfinition : Dans un repre orthogonal, lensemble des points Mi de coordonnes (xi ; yi ) constitue le nuage
de points associ la srie statistique deux variables.
Exemple : Le tableau 2 donne la part en % consacr au logement dans le budget dun foyer.
Anne (xi )
Part en % (yi )

1978
4,4

1984
5,2

1992
4,3

1994
3,2

2000
3,3

2004
2,8

Tab. 1 Part consacr au logement dans un foyer


Le nuage de points associ cette srie statistique est reprsent sur la figure 1.

Fig. 1 Nuage de points


1 Moyenne,

cart-type.
quartiles.
3 Utilisation des listes de la calculatrice.
2 Mdiane,

AJUSTEMENT PAR LA MTHODE DES MOINDRES CARRS

1.2

Point moyen

Remarque : On peut utiliser la calculatrice ou un tableur pour reprsenter un nuage de points. Voir la feuille
annexe.
Exercice : 11 page 48 et 18 page 494 [Dclic]

1.2

Point moyen

Dfinition : Le point moyen dun nuage de points est le point G de coordonnes (x ; y) o :


x reprsente la moyenne des xi :
n

x=

x1 + x2 + + xn
1X
=
xi
n
n i=1

y=

y1 + y2 + + yn
1X
=
yi
n
n i=1

y reprsente la moyenne des yi :


n

Exemple : On reprend les donnes de lexemple prcdent.


x=

1978 + 1984 + 1992 + 1994 + 2000 + 2004


= 1992
6
4, 4 + 5, 2 + 4, 3 + 3, 2 + 3, 3 + 2, 8
' 3, 87
y=
6

Le point moyen est donc G (1992 ; 3, 9).


Remarques :
1. On peut utiliser la calculatrice ou un tableur pour calculer les coordonnes du point moyen. Voir la
feuille annexe.
2. Changements dchelle :
Si on remplace les valeurs de xi par ti = xi 1978 (ce qui correspond au rang de lanne), on
obtiendra comme moyenne t = x 1978 = 14
Si on remplace les valeurs de yi par zi = 0, 01 yi (ce qui correspond aux pourcentages donns
sous forme dcimale), on obtiendra comme moyenne z = 0, 01 y ' 0, 0387.
Exercices : 9 page 485 13 page 48 et 14, 15, 16 page 496 17 page 497 [Dclic]

1.3

Ajustement dune srie statistique deux variables

Effectuer un ajustement de y en x dun nuage de points consiste trouver une fonction f telle que la courbe
dquation y = f (x) passe au plus prs des points du nuage (voir exercice 25 page 51[Dclic]).
Remarque : Dans la suite de ce chapitre, on sintressera aux ajustements affines, cest--dire le cas o la srie
statistique peut tre ajuste par une fonction affine (ce qui nest pas toujours le cas).

Ajustement par la mthode des moindres carrs

Activits : 1 page 398 et 2 page 399 [Dclic]


4 Nuage

de points, changement dorigine et dchelle.

5 Vrai-Faux.
6 Points

Moyens.
dun nuage de points.
8 Modliser par une fonction affine.
9 Choisir la meilleure droite.
7 Lecture

2.1

2.1

Principe de la mthode

AJUSTEMENT PAR LA MTHODE DES MOINDRES CARRS

Principe de la mthode

Effectuer un ajustement de y en x dun nuage de points par la mthode des moindres carrs consiste trouver
la fonction f du modle retenu qui minimise la somme des carrs des carts entre les valeurs yi observes et les
valeurs f (xi ) donnes par le modle.
Pn
2
La fonction f doit donc minimiser lexpression i=1 (yi f (xi )) .
Interprtation graphique : (voir figure 2)

Fig. 2 Mthode des moindres carrs


Cela revient minimiser la somme des carrs des distances verticales entre la courbe et les points du
nuage :
2

(M1 P1 ) + (M2 P2 ) + + (Mn Pn )


Remarques :

1. Pour une valeur x0 donne du caractre x, la fonction f permet donc de prvoir le rsultat correspondant de la variable y. On supposera que y0 = f (x0 ).
2. Si x0 appartient est compris entre x1 et xn , on parle dinterpolation.
3. Si x0 est en dehors de lintervalle dobservation du caractre x, on parle dextrapolation.

2.2

Ajustement affine par la mthode des moindres carrs

Dfinition : On appelle covariance de x et de y le nombre :


n

cov (x, y) =

1X
(xi x) (yi y)
n i=1

Rappel : la variance du caractre x est :


n

1X
2
V (x) =
(xi x)
n i=1
Elle est utilise pour le calcul de lcart type : (x) =
On eut remarquer que V (x) = cov (x, x).

V (x).

AJUSTEMENT PAR LA MTHODE DES MOINDRES CARRS

2.2

Ajustement affine

Thorme : (admis)
Lors dun ajustement affine par la mthode des moindres carrs, la droite d servant lajustement de y
en x :
a comme coefficient directeur :
cov (x, y)
a=
V (x)
passe par le point moyen du nuage G (x ; y).
Remarques :
1. Ces deux donnes sont suffisantes pour dterminer une quation de cette droite (voir exemple).
2. Cette droite est aussi appel droite de rgression de y en x.
Exemple : On reprend lexemple prcdent, mais en remplaant la variable x par t = x 1978 (ce qui revient
prendre le rang des annes, voir tableau 2)
Anne
Rang des annes (xi )
Part en % (yi )

1978
0
4,4

1984
6
5,2

1992
14
4,3

1994
16
3,2

2000
22
3,3

2004
26
2,8

Tab. 2 Part consacr au logement dans un foyer (bis)


On a dj vu que, dans ce cas, x = 14 et y ' 3, 87.
Pour calculer la variance et la covariance, on peut utiliser le mode Liste de la calculatrice ou un tableur
(voir tableau 3) :
Liste 1
0
6
14
16
22
26

Liste 2
4,4
5,2
4,3
3,2
3,3
2,8

Liste 3
-14
-8
0
2
8
12
Total

Liste 4
196
64
0
4
64
144
472

Liste 5
0,53
1,33
0,43
-0,67
-0,57
-1,07

Liste 6
-7,47
-10,67
0
-1,33
-4,53
-12,8
-36,8

Tab. 3 Calcul de la covariance et de la variance


La liste 1 (L1) contient les xi
La liste 2 (L2) contient les yi
La liste 3 (L3) contient xi x, cest--dire : L3 = L1 14
2
2
La liste 4 (L4) contient (xi x) , cest--dire : L4 = (L3)
La liste 5 (L5) contient yi y, cest-_dire L5 =L2 3, 87
La liste 6 (L6) contient (xi x) (yi y), cest--dire L6 = L3 L5
La covariance et la variance sobtiennent alors par la calcul suivant :
cov (x, y) =

Total de L6
36, 8
=
' 6, 13
6
6

et

V (x) =

Total de L4
472
=
' 68, 67
6
6

Le coefficient directeur de la droite de rgression est donc :


a=

cov (x, y)
6, 13
'
' 0, 08
V (x)
68, 67

La droite de rgression a donc une quation de la forme y = 0, 08x + b.


De plus, elle passe par G (14 ; 3, 87) donc :
0, 08 14 + b =

3, 87

1, 12 + b =

3, 87

b =

3, 87 + 1, 12 = 4, 99

RFRENCES

RFRENCES

Lquation de la droite de rgression est donc : y = 0, 08x + 4, 99.


On peut la tracer sur le nuage de points (voir figure 3).

Fig. 3 Droite de rgression de y en x


Remarques :
1. On peut utiliser la calculatrice ou un tableur pour dterminer lquation de la droite de rgression.
Voir feuille annexe.
Les rsultats obtenus peuvent tre un peu diffrents de ceux obtenus prcdemment cause des
approximation du calcul. laide dun tableur, lquation de la droite de rgression obtenu pour
lexemple prcdent est : y = 0, 08x + 4, 96.
2. On peut utiliser cette droite de rgression pour faire des prvisions (interpolations ou extrapolations,
les rsultats obtenus par extrapolation tant, bien sr moins fiables).
Exemple : On reprend lexemple prcdent en supposant que la droite de rgression admet comme quation
y = 0, 08x + 4, 96.
Lanne 2010 correspond x = 2010 1978 = 28.
Si la progression continue toujours suivant le mme schma, on peut prvoir que la part en % du budget
dun foyer consacr au logement en 2010 sera y = 0, 08 28 + 4, 96 = 2, 72, soit 2,72 %
Il sagit bien sr dune extrapolation. Ce rsultat nest fiable que si lvolution de la part continue aprs
2004 en suivant le mme principe quentre 1978 et 2004...
Exercices : 20, 21 page 50 et 37 page 5510 23 page 50 ; 29, 30, 31 page 52 et 38 page 5511 22 page 5012
28 page 51 et 39 page 5513 24 page 5314 [Dclic]

Rfrences
[Dclic] Dclic Term ES, Hachette ducation (dition 2006)
2, 3, 6
10 QCM

et Vrai-Faux.
de rgression.
12 Dautres types dajustements affines.
13 Changements de variables.
14 Exercice de synthse.
11 Droites