Vous êtes sur la page 1sur 10

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

Universit de Picardie Jules Verne


UFR des Sciences

2011-2012

Licence mention Mathmatiques et mention Informatique parcours MIAGE - Semestre 3


Statistique et Probabilits

Rgression - Droite des moindres carrs


Le chapitre prcdent traitait de la statistique descriptive univarie, cest--dire de la description dune
srie statistique selon un seul caractre (la taille par exemple). On veut maintenant tudier, visualiser et
mesurer (le cas chant) les liens existant entre deux variables : cest lobjet de la statistique descriptive
bivarie.
On considre une population sur laquelle on tudie deux variables (ou caractres) quantitatives X et Y. On
tudiera donc des sries statistiques deux variables ; autrement dit un couple de variables X, Y . On veut
savoir si les deux variables sont lis par une liaison fonctionnelle du type Y f X (cest--dire que lon peut
prvoir les valeurs de Y partir des valeurs de X), ou X f Y (cest--dire que lon peut prvoir les valeurs
de X partir des valeurs de Y).
Prcisons ds maintenant que lexistence dune telle liaison entre les deux variables X et Y ne signifie pas
obligatoirement un lien de cause effet entre elles.
Exemple fondamental : Y

aX

b (liaison fonctionnelle affine).

Sur un chantillon de n individus extrait de la population, on observe n couples x 1 , y 1 ,


x 2 , y 2 , , x n , y n de valeurs de X et Y.
Reprsentation graphique : nuage de points.
Ces observations peuvent tre reprsentes dans le plan. A chaque couple x i , y i , i 1, , n, on fait
correspondre un point M i . On obtient un nuage de point.
La forme du nuage obtenu peut indiquer le type de dpendance possible entre X et Y. Si les points sont
plutt aligns, on peut envisager une relation de type Y aX b (quation de droite). Si le nuage forme
une parabole, on peut envisager une relation de type Y aX 2 bX c.
On dit que lon cherche ajuster une courbe au nuage de points.

1. Droite des moindres carrs (ou de rgression) de y en x


On cherche ajuster une droite dquation y ax b au nuage de points.
Le critre dajustement est la distance totale entre les points du nuage M i x i , y i et les points
P i x i , ax i b correspondant sur la droite dajustement.
n

On cherche donc le couple a, b qui minimise f a, b

soit

2 yi

ax i

xi

i 1
n

soit

2 yi

ax i

i 1
n

b xi

0 et

yixi
i 1

x 2i

i 1

yi
i 1

xi

En divisant par n, on obtient : 1


n

Variances : s 2x

Stphane Ducay

1
n

xi
i 1

ax i

nb

0.

0,

0,

yi

i 1
n

xi
i 1

yixi
i 1

i 1

1
n

a1
n
1
n

xi, y
2

0,
n

0 et

1
n

ax i

i 1

Moments. Moyennes : x

f
a, b
b

0 et

i 1

yi

soit

0 et

b 2.

ax i

i 1

f
a, b
a

Conditions ncessaires de minimum :

yi

x 2i
i 1

x 2i
i 1

b1
n

xi
i 1

0 et 1
n

yi
i 1

a1
n

xi

0.

i 1

yi,
i 1

x 2 , s 2y

1
n

y 2i

i 1

S3 Maths et Info-MIAGE 2011-2012

Covariance : cov x, y

1
n

Statistique et Probabilits
n

xi

x yi

1
n

i 1

Rgression - Droite des moindres carrs

xiyi

xy.

i 1

x 2
bx 0 et y
On a alors : cov x, y xy a s 2x
De b y ax on dduit cov x, y xy a s 2x
x 2
cov x, y
soit cov x, y as 2x 0, soit a
.
s 2x
On admet que ce couple a, b minimise f a, b .

ax b 0.
y ax x 0,

La droite des moindres carrs (ou de rgression) de y en x a donc pour quation :


cov x, y
D y/x : y ax b, avec a
et b y ax.
s 2x
Exemple.
On considre la srie double statistique suivante :
xi 2 3

1 4

y i 4 9 11 3 8
Le nuage de points correspondant est reprsent sur le graphe ci-dessous.

12
10
8
6
4
2
0
0

Nuage de points
La droite de regression de y en x a pour quation : y
xi

y i x i y i x 2i

27

5
1
4

11
3
8

55
3
32

1
n

On a x

1
n

s 2x

1
5

xi
i 1

1
n

cov x, y

25
16

ax
15

xy

1
5

1
5

i 1

x 2i

i 1

1
n

3, y

xiyi

cov x, y
et b
s 2x

b, avec a
n

yi
i 1

125

55

35

7,

4,

cov x, y
4
2 et b y ax
2
s 2x
La droite de regression de y en x a donc pour quation : y

ax.

2.

On en dduit que a
15 35 125 55

1
5

7
2x

1.

1.

12
10
8
6
4
2
0
0

Nuage de points et droite de rgression de y

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

Remarque. Cette droite passe par deux des points du nuage : cest une concidence ! Cela ne se produit
pas en gnral.

2. Droite des moindres carrs de x en y.


On suit une dmarche analogue celle qui a donn la droite des moindres carrs de y en x :
cov x, y
et b y ax.
D y/x : y ax b, avec a
s 2x
On cherche ajuster une droite D x/y dquation x a y b au nuage de points.
On obtient la droite des moindres carrs de x en y :
cov x, y
D x/y : x a y b , avec a
et b
x a y.
s 2y
Remarque. Ces quations peuvent aussi scrire :
D y/x : y y

a x

D x/y : x x a y
Les droites D y/x et D x/y se coupent donc au point G x, y .

Exemple.
Reprenons lexemple prcdent. On a toujours x
n
1
1 291 7
On calcule s 2y
y 2i
y 2
n
5
i 1

3, y
2

7, cov x, y

9, 2, do a

La droite de regression de x en y a donc pour quation x

a y

4, s 2x
cov x, y
s 2x

2 et a
4
9, 2

y , soit x

cest--dire y 2, 3x 0, 1.
On retrouve galement une quation de la droite de rgression de y en x : y
y 7 2 x 3 , cest--dire y 2x 1.
Les droites D y/x et D x/y se coupent au point G x, y
G 3, 7 .

2.
1 .
2, 3

1 y
2, 3

a x

7 ,

x , soit

12
10
8
6
4
2
0
0

Droites de rgression de y en x et de x en y

3. Coefficient de corrlation linaire entre x et y


cov x, y
sxsy .

Le coefficient de corrlation linaire est donn par : r x,y


Qualit de lajustement.
On peut dmontrer que r 2x,y
n

yi

si

ax i

1 1
s 2y n

0, cest--dire y i

yi

ax i

1. On en dduit que r 2x,y

1 si et seulement

i 1

ax i

0, pour tout i

1,

, n, soit M i x i , y i

D y/x . Ainsi,

i 1

r 2x,y

1 si et seulement si les points M i sont aligns sur D y/x .


De faon gnrale, plus r 2x,y est proche de 1, meilleur est lajustement de la droite des moindres carrs au

Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

nuage de points. Le signe de r x,y (mme signe que celui de a) indique le sens de la liaison (croissante si
r x,y 0, dcroissante si r x,y 0) entre X et Y.
Signification de r x,y .
La question se pose de savoir si une forte valeur de r x,y (en valeur absolue) ou de r 2x,y prouve quil y a une
forte corrlation entre les deux caractres X et Y (par exemple lorsque lajustement est bon) ou si elle est due
au hasard de lchantillonage (par exemple lorsque n est petit). Pour obtenir une rponse, on peut utiliser des
tests statistiques (voir statistique infrentielle).
Formule de dcomposition.
La notion de liaison entre X et Y signifie quune variation de X entrane une variation de Y. La formule de
dcomposition permet de prciser la part de variation de Y explique par la variation de X :
n

yi

yi

i 1

yi

i 1

yi

, avec y i

ax i

b.

i 1

La dmonstration repose sur le fait que le double produit sannule :


n

yi

yi

yi

i 1

xi

x ei

0, avec e i

yi

y i (erreur observe), et grce aux quations

i 1

dfinissant a et b.

La somme des carrs totale :

yi

mesure la variation globale des y i autour de leur moyenne y.

i 1

La somme des carrs explique par la variable X :

yi

a2

i 1

xi

mesure la variation de

i 1

Y explique par la variable X. Ce terme nest dailleurs fonction que de la pente de la droite des moindres
carrs et des valeurs de X.
n

yi

La somme des carrs rsiduelle :

yi

e 2i mesure la variation de Y non explique par la

i 1

i 1

variable X.
Coefficient de dtermination.
Il est naturel de mesurer la force de la liaison entre les variables X et Y laide du coefficient de
dtermination :
n

R2

yi

yi

i 1
n

somme des carrs explique


somme des carrs totale

i 1

On peut vrifier que R 2

r 2x,y . Ce qui explique que r x,y mesure la force de la liaison entre X et Y.

Position relative de D y/x et D x/y .


Si r 2x,y

0, alors cov x, y

Si r 2x,y

0, alors a

0, et donc a

0 et a

0. Ainsi, D y/x : y

0. On a alors : D y/x : y

a x

y et D x/y : x
x et D x/y : y

x.
y

x .

cov x, y cov x, y
cov x, y
r 2x,y .
2
2
sxsy
sx
sy
1 et donc D a pour quation : y y
Si r 2x,y 1, alors a
x/y
a
de D y/x . Ainsi, D x/y D y/x .
On a : aa

Si 0

r 2x,y
- soit 0

1, alors 0
r x,y

1 x
a

a x

x , soit lquation

aa

1 et deux cas sont possibles :


1 ;
1 et alors a 0, a
0 et a
a

- soit 1

Stphane Ducay

r x,y

0 et alors a

0, a

0 et a

1 .
a

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

4. Point de vue gomtrique ; rprsentation vectorielle


4.1. Introduction
Considrons les points M x de coordonnes x i et M y de coordonnes y i dans une espace affine n
associ n , ou de manire quivalente les vecteurs M x de coordonnes x i et M y de coordonnes y i dans
lespace vectoriel n .
Pour comparer ces vecteurs et essayer dtablir dventuelles relations entre eux, on est amen utiliser la
distance euclidienne, ce qui revient privilgier les notions de moyenne arithmtique et dcart-type.
Notons U le vecteur dont toutes les coordonnes sont gales 1, et considrons les vecteurs xU et yU,
ainsi que les vecteurs V x M x xU et V y M y yU. Par proprit de la distance euclidienne, V x et V y sont
orthogonaux U, et donc xU et yU.

B
Vx

xU

Vy
Mx

Vx
O
Dfinition de Vx

Reprsentation de Vx et Vy

Dans la suite, on suppose n 0, V x 0 et V y 0, cest--dire X et Y non constantes. On reprsente alors


V x et V y , dans un mme plan, par des vecteurs OA et OB, avec OA segment horizontal avec A droite de O.
La longueur OA est proportionnelle
n

Vx

xi

n sx

yi

n sy

i 1

De mme, la longueur OB est proportionnelle


n

Vy
i 1

Lcart angulaire de OA et OB est implicitement dfini par


cos OA, OB

cos V x , V y

Vx. Vy
Vx

Vy

Vx. Vy
ns x s y

Pour liminer les effets dchelles ds des units diffrentes (pour une comparaison plus universelle des
Vy
V x et W
couples de variables quantitatives), on peut considrer les vecteurs norms W x
,
y
Vx
Vy
reprsents par des vecteurs OA et OB , de longueur gale lunit, colinaires OA et OB et de mme sens.
On a ainsi cos OA, OB
cos OA , OB
cos W x , W y
Wx. Wy.

4.2. Corrlation linaire


Le point de vue gomtrique introduit limportante notion de corrlation linaire. On sintresse alors la
colinarit ventuelles des vecteurs V x et V y .
Sil existe une liaison fonctionnelle affine entre Y et X du type Y aX b, avec a 0, alors y ax b.
Il en rsulte que M y yU a M x xU , soit V y aV x , ce qui signifie que les vecteurs V x et V y sont
colinaires. On dit que les caractres sont parfaitement corrls.
Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

Rciproquement, si les vecteurs V x et V y sont colinaires (non nuls), il existe un rel a non nul tel que, par
exemple, V y aV x , soit M y yU a M x xU . Ce qui signifie que pour tout entier i entre 1 et n,
y i y a x i x , soit y i ax i y ax. Autrement dit, il existe une liaison fonctionnelle affine entre Y et X
du type Y aX b, avec b y ax.
1 suivant que V x et V y sont dans le mme sens ou pas.
Dans ce cas, cos V x , V y
A contrario, si les vecteurs V x et V y sont orthogonaux (cosinus nul), on dit que les variables X et Y sont
non corrles. Dans ce cas, on a la double quivalence
n

Vx. Vy

Mx

xU

My

yU

xi

x yi

i 1

Entre ces deux situations extrmes, lcart angulaire des vecteurs V x et V y , ou plus prcisment son
cosinus, fournit une mesure du degr de corrlation linaire entre les deux variables X et Y tudies. On a
alors
cos V x , V y

r x,y

Partageant arbitrairement le plan en secteurs de 30, on obtient 5 zones permettant de dfinir une bonne,
3
1 , ce
mdiocre ou mauvaise corrlation entre X et Y. Sachant que cos 30
0, 866 et cos 60
2
2
critre graphique se traduit numriquement par :
3
- si
|r x,y | 1, il existe une bonne corrlation linaire entre X et Y ;
2
3
- si 1
, la corrlation linaire entre X et Y est mdiocre ;
|r x,y |
2
2
1 , la corrlation linaire entre X et Y est mauvaise.
- si 0 |r x,y |
2

4.3. Coefficients de rgression


Considrons les vecteurs M y de coordonnes y i ax i b , V y M y yU de coordonnes y i y ,
M e M y M y de coordonnes e i y i y i , V e V y V y de coordonnes e i e y i y y i y .
La mthode des moindres carrs (appliques aux carts verticaux) consiste dterminer les rels a et b de
2
soit minimale.
faon que M e
Il est clair que M e V e eU. Les vecteurs V y et V y tant orthogonaux U, il en est de mme pour V e .
n , il sensuit (thorme de Pythagore)
Puisque U
Me

Ve

ne 2

Cette somme de deux carrs indpendants est minimale lorsque chacun de ses termes est minimal.
Pour n 0, le terme ne 2 est minimal lorsque e 0, cest--dire y y : la variable Y et son modle affine
Y ont alors la mme moyenne. Or y ax b, donc y ax b, do b y ax.
Par ailleurs, pour tout entier i entre 1 et n, y i y ax i b ax b
a x i x , do V y aV x . Les
vecteurs V y et V x sont donc colinaires.
Notant OA V x , OB V y et OH V y , il en rsulte que les points O, H et A sont aligns.
B

Vy

Vx
O

V~y

Position du point H

Comme HB
Stphane Ducay

V e , on voit que

Ve

est minimale si et seulement si H appartient la droite OA et la


6

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

distance HB est minimale, cest--dire si et seulement si H est la projection orthogonale de B sur OA .


Les vecteurs V e et V x sont alors orthogonaux, ce qui donne les galits quivalentes suivantes :
Ve. Vx
et a

0, V y V y . V x 0, V y . V x V y . V x , ncov x, y
cov x, y
(puisque s x 0 et n 0).
s 2x

aV x . V x

a Vx

ans 2x

4.4. Dcomposition de la variance


On a la formule de dcomposition suivante : s 2y s 2y s 2e ,
cest dire Variance totale en Y Variance explique Variance rsiduelle.
2
2
2
Ceci rsulte des rsultats prcdents : OB 2 OH 2 HB 2 , cest--dire V y
Vy
V e , soit
encore ns 2y ns 2y ns 2e , do la formule annonce.
En utilisant cette formule de dcomposition, on peut mesurer la part de la variance explique par la
rgression de Y en X par rapport la variance totale. Plus cette part est grande, plus la variance rsiduelle est
petite (plus lerreur est faible), plus lajustement affine est justifi.
s 2y
On appelle coefficient de dtermination le rel d x,y dfini par d x,y
. On a alors
s 2y
2

Vy

d x,y

aV x

cov 2 x, y s 2x
s 4x
s 2y

a 2 s 2x
s 2y

cov 2 x, y
s 2x s 2y

r 2x,y .

Vy
Vy
On a toujours 0 d x,y r 2x,y 1. Reformulant le critre de corrlation linaire, on aura :
3 , il existe une forte corrlation linaire entre Y et X et lajustement affine est justifi ;
- si d x,y
4
- si d x,y 0, X et Y ne sont pas corrles.

5. Gnralisation
On considre une population sur laquelle on tudie deux caractres quantitatifs X et Y pouvant prendre
respectivement r et s valeurs distinctes.
On extrait de cette population un chantillon de taille n et on note n ij leffectif observ dindividus
prenant la i me valeur de X et la j me valeur de Y.
La reprsentation graphique dune telle srie statistique deux variables pourra se faire laide dun
strogramme (en 3 dimensions). On pourra aussi la reprsenter laide dune nuage de points (en 2
dimensions), en indiquant, entre parenthses cot de chaque point de coordonnes x i , y j , leffectif n ij
correspondant.
Les effectifs marginaux observs sont :
s

ni

n ij

n i1

n i2

n is et n

n ij

j 1

n 1j

n 2j

n rj .

i 1

X \ Y y1

y2

ys

ni

x1

n 11 n 12

n 1s n 1

x2

n 21 n 22

n 2s n 2

xr

n r1 n r2

n rs n r

On redfinit alors les moments.


r

Moyennes : x

1
n

1
n

ni xi, y
i 1
r

Variances :

s 2x

1
n

Stphane Ducay

ni xi
i 1

n jyj,
j 1

1
n

n i x 2i
i 1

x ,

s 2y

1
n

n j y 2j

j 1

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits
r

1
n

Covariance : cov x, y

Rgression - Droite des moindres carrs

n ij x i

x yi

1
n

n ij x i y j

i 1 j 1

xy.

i 1 j 1

On reporte ces nouvelles valeurs dans les quations des droites des moindres carrs et dans la formule du
coefficient de corrlation linaire.
Exemple.
Une statistique effectue sur 800 personnes donnent la rpartition suivante :
xi \ yj

ni

74

116

68

82

340

126 174

82

78

460

200 290 150 160 800

On prsente les calculs dans les tableaux suivant :


xi \ yj

ni

n i x i n i x 2i

74

116

68

82

340

340

340

126

174

82

78

460

200

290

150 160

800

340

340

n jyj

600

580

150

1330

n j y 2j

1800 1160 150

3110

xi \ yj

n ij x i y j

222 232 68 0
0

0
522

On a alors :
r
1
x
ni xi
n
i 1
s

1
n

n jyj
j 1
r

s 2x

1
n

1
800

340

1
800

1330

1
n

1
800

340

n j y 2j

1
800

3110

j 1
r

cov x, y

1, 663,

n i x 2i
i 1
s

s 2y

0, 425,

0, 425

1, 6625

0, 244,
2

1, 124,

1
n

n ij x i y j
i 1 j 1

xy

1
800

522

0, 425

1, 6625

0, 054.

On en dduit :
D y/x : y

ax

D x/y : x

ay

r x,y

cov x, y
sxsy

Stphane Ducay

cov x, y
0, 221 et b y ax 1, 757,
s 2x
cov x, y
b , avec a
0, 048 et b
x a y 0, 505,
s 2y
0, 054
0, 103
0, 494 1, 056

b, avec a

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

6. Exercices
Exercice 1.
Dans la srie statistique suivante, x reprsente le nombre de jours dexposition au soleil dune feuille et y
le nombre de stomates arifres au millimtre carr :
x 2

10 24 40 52

y 6 11 15 20 39 62 85
1) Dterminer une quation de la droite de regression de y en x.
2) Calculer le coefficient de corrlation linaire entre x et y. Commenter le rsultat.
3) Quel nombre de stomates peut-on prvoir aprs 30 jours dexposition au soleil ? aprs 60 jours ?
Exercice 2.
On a procd lajustement affine dun nuage de points. Les quations obtenues sont les suivantes :
- droite dajustement de y en x : D : y x 30
- droite dajustement de x en y : D : x 1/4y 60
1) Calculer le coefficient de corrlation linaire.
2) Calculer les moyennes arithmtiques de x et de y.
3) Calculer la covariance entre x et y et la variance de x, sachant que la variance de y est gale 40.
Exercice 3.
On slectionne 12 personnes inscrites un stage de formation. Avant le dbut de la formation, ces
stagiaires subissent une preuve A note de 0 20. A lissue du stage, une preuve B identique la premire
est aussi note de 0 20. Considrant les deux variables X note de A et Y note de B, on a obtenu les
rsultats suivants :
stagiaire 1 2

10 11 12

10

11 12 13 15

xi

3 4

yi

8 9 10 13 15 14 13 16 13 19

4
19

1) a) Reprsenter ces rsultats par un nuage de points.


b) Quelle courbe dajustement ce nuage vous suggre-t-il ?
2) A partir des rsulats obtenus, on a dtermin la droite de rgression de y en x, ainsi le coefficient de
corrlation linaire entre x et y. On a obtenu lquation y 0, 108 x 11, 990 et le coefficient r 0, 101.
A partir de ces rsultats, expliquer pourquoi lajustement nest pas bon.
3) On dcide dliminer les stagiaires 11 et 12, et donc de ne tenir compte que des stagiaires 1 10.
a) Dterminer une quation de la droite de rgression de y en x par la mthode des moindres carrs.
b) Calculer le coefficient de corrlation linaire entre x et y. Interprter le rsultat obtenu.
Exercice 4. (Daprs partiel de novembre 2007)
Le tableau ci-dessous donne une estimation du montant des achats en ligne des mnages franais :
Anne

1998 1999 2000 2001 2002 2003 2004

Rang de lanne : x i

Montant dachats en millions deuros : y i

75

260

820

1650 2300 4000 5300

1)

a) Prciser la population, la(es) variable(s) tudie(s) et la taille de lchantillon.


b) Donner une quation de la droite de rgression de y en x.
c) Donner le coefficient de corrlation linaire entre x et y. Interprter le rsultat obtenu.
d) Quelle prvision du montant dachats peut-on faire pour lanne 2005 ? Est-elle fiable ?
2) On considre la nouvelle variable z
y.
a) Dterminer une quation de la droite de rgression de z en x, ainsi que le coefficient de corrlation
linaire entre x et z. Interprter le rsultat obtenu.
b) En dduire une expression de y en fonction de x, puis une prvision du montant dachats pour
lanne 2005.
Stphane Ducay

S3 Maths et Info-MIAGE 2011-2012

Statistique et Probabilits

Rgression - Droite des moindres carrs

3) A partir du tableau de donnes, le logiciel Excel propose un ajustement polynomial par lquation
130x 2 100x 68.
a) Sagit-il du mme ajustement que celui obtenu dans le 2) ? Expliquer cette situation.
b) Dduire de cet ajustement une prvision du montant dachats pour lanne 2005.
4) Le montant des achats en ligne en 2005 a t de 7700 millions deuros. Lequel des trois ajustements
prcdents vous parait-il le plus conforme la ralit ? Jutifier votre rponse.

Exercice 5. (Daprs partiel de novembre 2004)


Une statistique publie en lan 2000 donne le nombre dabonns Internet dans le monde, la fin de
lanne indique :
Anne

1995 1996 1997 1998 1999 2000

Rang de lanne : x i

Nombre dabonns en millions : y i

26

55

101

150

248

407

1)
2)

Reprsenter graphiquement le nuage de points M i x i , y i , i 0, . . . , 5.


Une premire tude avait eu lieu en 1998.
a) Donner une quation de la droite de rgression de y en x obtenues par la mthode des moindres
carrs applique sur les annes 1995 1998. Construire cette droite sur le graphique du 1). Prciser les
coordonnes du point moyen G du nuage et placer le point G sur le graphique du 1).
b) Donner le coefficient de corrlation linaire entre x et y. Interprter le rsultat obtenu. Peut-on en
dduire des prvisions pour 1999, 2000 et 2001 ?
Dans la suite, on travaille sur les annes 1995 2000.
3) Dans cette question, on utilise la mthode dajustement dite de la droite de Mayer.
On dsigne par G 1 le point moyen des trois premiers points M 0 , M 1 et M 2 , et par G 2 le point moyen
des trois derniers points M 3 , M 4 et M 5 .
a) Dterminer les coordonnes des points G 1 et G 2 , et placer ces points sur la graphique du 1).
b) Dterminer une quation de la droite G 1 G 2 sous la forme y ax b.
c) Calculer alors une prvision du nombre dabonns pour lanne 2001.
4) a) On pose z ln y . Calculer alors les valeurs z i ln y i .
b) Donner une quation de la droite de rgression de z en x.
c) Donner le coefficient de corrlation linaire entre x et z. Interprter le rsultat obtenu.
d) En dduire une expresion de y en fonction de x et reprsenter la fonction obtenue sur le graphique.
e) Calculer alors la nouvelle prvision du nombre dabonns pour lanne 2001.
Exercice 6.
Une enqute porte sur lemploi du temps des lves de Licence mention mathmatiques de lUPJV. Aprs
leur avoir demand de noter durant une semaine le temps de leurs activits, on slectionne les trois questions
suivantes :
Q1 : pendant combien dheures (y compris denseignement) avez-vous travaill dans la semaine ?
Q2 : pendant combien dheures avez-vous regard la tlvision dans la semaine ?
Q3 : pendant combien dheures avez-vous lu dans la semaine ?
Afin de faciliter les calculs, on na retenu que 10 tudiants tirs au hasard. Leurs rponses (arrondies en
heures) figurent dans le tableau suivant :
Travail

45 40 47 48 39 43 47 43 40 38

Tlvision

12 13

14

Lecture

On dsigne respectivement par X, Y et Z les variables (ou caractres) nombres dheures hebdomadaires
passes au travail, la tlvision et la lecture.
1) Etudier successivement les trois couples X, Y , X, Z et Y, Z . Pour chacun des couples, tracer le
nuage des 10 points et calculer les indicateurs statistiques : moyennes, cart-types, coefficient de corrlation
linaire.
2) Pour le(s) couple(s) pour le(s)quel(s) cela se justifie, crire lquation de la droite de rgression
linaire.
3) Quelle conclusion peut-on suggrer sur lemploi du temps de ces tudiants ?
Stphane Ducay

10