Vous êtes sur la page 1sur 8

Exercices rcapitulatifs : mesures dassociation :corrigs

Exercices rcapitulatifs :Mesures dassociation : corrig

Le garage L. Harnack dispose du tableau suivant qui rsume ltat des


ventes de voitures lan dernier en fonction de leur prix de vente et de
leur cylindre.
Tableau : rpartition des ventes de voitures
(nombre de voitures vendues)
Prix (10)
]6, 10] ]10, 20] ]20, 30] Total
]9, 15] 35 10 5 50
(10 cm)
Cyl.

]15, 19] 10 60 20 90
]19, 21] 0 5 25 30
Total 45 75 50 170

On vous demande de :
1. Calculer toutes les mesures dassociation spcifiques aux
variables quantitatives.
Pour ce faire, il faut dabord disposer des centres de classe des deux
variables :
- pour le prix : 8, 15, 25 (10)
- pour la cylindre : 12, 17, 20 (10 cm)
On calcule alors les moyennes marginales des deux variables :
Le prix moyen sera calcul comme :
px = [(45*8)+(75*15)+(50*25)]/170 = 16,0882 16 10Euros
cyl = [(50*12)+(90*17)+(30*20)]/170 = 16,0588 16 10cm
donc le centre de gravit G = (16,16)
Ce qui permet de calculer les carts centrs (ec) et quadratiques (eq)
des centres de classe reports dans le tableau suivant :
(N.B. On prendra pour raisons pdagogiques les moyennes arrondies
plutt que celles calcules avec leurs dcimales, ceci facilite la
prsentation des carts. Il va de soi qu calcul professionnel DOIT
conserver les dcimales tout au long des calculs.)
Exercices rcapitulatifs : mesures dassociation :corrigs
Exercices rcapitulatifs : mesures dassociation :corrigs

Courbes de rgression entre la cylindre et le prix

24
Prix (1000 EUR)

19

Ccyl/px
Cpx/cyl
14

4
8 10 12 14 16 18 20 22
Cylindre (100 cm)

px = a + b.cyl

35

30

25

20
px (1000 EUR)

15
px
10

0
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
-5

-10

cyl (10cm)
Exercices rcapitulatifs : mesures dassociation :corrigs
Exercices rcapitulatifs : mesures dassociation :corrigs
Exercices rcapitulatifs : mesures dassociation :corrigs

Prix
eq 64 1 81
ec -8 -1 9
eq ec 8 15 25 Tot.
16 -4 12 35 10 5 50

Cyl.
1 1 17 10 60 20 90
16 4 20 0 5 25 30
Tot. 45 75 50 170

Il est donc possible de calculer la variance marginale de chaque


variable ainsi que la covariance entre elles :
= [(45*64)+(75*1)+(50*81)]/170 = 41,2059 Mio Euros
2
px

2
cyl = [( 50 *16 )+ (90 *1 ) + ( 30 *16 )] /170 = 8 ,0588 (10cm)
Donc les cart-types des deux variables sont calculs :
s px = 41 , 2059 = 6,4192 10 Euros
s cyl = 8,0588 = 2,8388 10 cm
et la covariance vaut :
s cyl, px = {[(-8.-4).35]+[(-1.-4).10]+[(9.-4).5] + [(-8.1).10]+ ... } = 11,1765
On peut donc conclure que la liaison est positive entre les deux
variables, mais nous ne savons encore rien de lintensit de la relation
entre elles.

Pour calculer lintensit de la liaison entre les variables, nous


disposons du coefficient de corrlation :

r = s cyl,px = 11,1765 = 11,1765 = 0,6133


s px.s cyl 6,4192. 2,8388 18,2228
Le coefficient de corrlation tant norm entre 1 et +1, cette valeur
de 0,6133 indique une liaison positive significative mais pas complte
entre les deux variables
Exercices rcapitulatifs : mesures dassociation :corrigs

2. A partir des valeurs calcules pour ces mesures dassociation de


rpondre aux deux questions suivantes :
a. La cylindre dune voiture vendue est-elle un bon prdicteur
du prix de cette mme voiture ?
b. Le prix dune voiture vendue est-il un bon prdicteur de la
cylindre de cette mme voiture ?

Nous cherchons des prdicteurs, cest--dire des variables qui, si nous


connaissons leur valeur, pourraient nous aider prvoir la valeur
dune autre variable. La rgression linaire peut nous aider.
Pour la rponse la question 2.a., on va supposer le modle linaire
suivant :
px = a + b cyl
et estimer les valeurs de a , lintercept de la droite de rgression et b,
la pente de cette mme droite.

b = s cyl,2 px = 11,1765 = 1,3869 et


cyl 8,0588
a = px - b . cyl = 16,088 - 1,3869 . 16,0588 = - 6,1838
ainsi que son coefficient de dtermination :
r = (0,6133) = 0,3761

Pour la rponse la question 2.b., on va supposer le modle linaire


suivant :
cyl = c + d px
et estimer les valeurs de c , lintercept de la droite de rgression et d,
la pente de cette mme droite.

d = s cyl,2 px = 11,1765 = 0,2712 et


px 41,2059
c = cyl - b . px = 16,0588 - 0,2712 . 16,088 = 11,6957
ainsi que son coefficient de dtermination :
r = (0,6133) = 0,3761
Exercices rcapitulatifs : mesures dassociation :corrigs

Le coefficient de dtermination nous indique quun peu plus du tiers


de la variance de la variable dpendante de chacune des rgression est
explique par la relation linaire la liant lautre variable, la
variable explicative .
Il existe donc dautres explications trouver dans la thorie
conomique, dans lobservation, etc.

La cylindre et le prix sont bien des prdicteurs de lautre variable


mais loins dtre parfaits.

Interprtation de a, b, c, d :
- a est lINTERCEPT de la rgression 2.a., il signifie que le prix
moyen dune voiture, indpendamment de sa cylindre est de
-6,1838 10,

- b, la PENTE de la rgression 2.a., reprsente leffet marginal de la


cylindre sur le prix dune voiture, sa valeur de 1,3869 par unit de
cylindre (10cm) nous dit quen moyenne, quand la cylindre
varie de 100 cm, le prix de la voiture varie dans le mme sens de
1,3869 10.

- c, INTERCEPT de la rgression 2.b., vaut 11,6957. Cette valeur


signifie quindpendamment du prix, la cylindre moyenne des
voitures vendues vaut 11,6957 10cm @ 1200 cm.

- d, la PENTE de la rgression 2.b., reprsente leffet marginal du


prix sur la cylindre dune voiture, sa valeur de 0,2712 par unit de
prix (10) nous dit quen moyenne, quand le prix varie de 1000 ,
la cylindre de la voiture varie dans le mme sens de 0,2712
10cm.