Vous êtes sur la page 1sur 21

STATISTIQUE À 2 VARIABLES 59

Thème 14: Statistique à 2 variables


14.1 Introduction et quelques définitions

Introduction : Dans le chapitre 10 de statistique, nous nous sommes intéressés


à des questions du type:
 Quelle est la taille moyenne de 50 professeurs du gymnase de
Morges ?
 Quel est l'écart type du salaire annuel des employés d'une
grande compagnie ?
 Lors d'une évaluation effectuée dans deux classes, laquelle
semble être la plus homogène ?
Dans toutes ces questions, nous étudions le comportement
statistique d'une seule variable: taille, salaire, note lors d'une
évaluation.
Il existe cependant toute une gamme de problèmes statistiques
où l'on s'intéresse à la relation entre plusieurs variables.
Par exemple:
• entre l'épaisseur d'un mur et sa résistance thermique;
• entre la consommation de carburant et la vitesse d'une voiture;
• entre le temps de fonctionnement d'un appareil et la fréquence
des pannes.
Pour étudier d'éventuelles corrélations1, on est amené à
s'intéresser simultanément à deux caractères X et Y d'une même
population.
On définit alors une série statistique à deux variables
statistiques X et Y prenant des valeurs:
x1, x2, …, xn et y1, y2, …, yn.

14.2 Nuage de points


Pour étudier les relations ou corrélations entre deux variables
statistiques, on peut associer au couple (xi ; yi) de la série
statistique double le point Mi de coordonnées (xi ; yi).
L'ensemble des points Mi ainsi obtenu est appelé nuage de points
représentant la série statistique.

1
En statistiques, étudier la corrélation entre deux ou plusieurs variables statistiques numériques, c’est étudier l'intensité de la
liaison qui peut exister entre ces variables.

3EC – JtJ 2021


60 THÈME 14

Modèle 1 : Étudions la relation entre le poids (en kg) et la taille (en cm)
dans un échantillon de 20 individus:
Taille 155 158 158 159 163 163 165 168 170 172
Poids 67,1 60,7 54,9 58,8 64,7 60,4 63 62,5 71,5 70,8

Taille 173 175 176 178 178 180 182 186 189 196
Poids 63,1 74,8 71,1 73,1 63,5 69,4 70 82 76,5 84,6

On représente alors le nuage de points:


poids [kg]
90

80

70

60

taille [cm]
50
150 160 170 180 190 200

Le nuage étant dessiné, on peut, par la pensée ou réellement,


tracer une droite (appelée droite d'ajustement) qui passe au
mieux par ces points, ou plutôt dans une position que l'on
qualifierait "d'au milieu du nuage de points".

3 cas de figure : • Si cette droite "monte", on dira qu'il y a corrélation positive


entre les deux variables.
• Si elle "descend", il s'agira d'une corrélation négative.
• Si elle est "horizontale", ou si on ne peut pas décider d'une
orientation, on dira qu'il y a une absence de corrélation.
y y

x x
Corrélation positive Corrélation négative
y y

x x
Absence de corrélation

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 61

Remarques : La qualité de la corrélation entre deux variables peut se mesurer


par la dispersion des points autour de la droite d'ajustement:
y y

x x
Corrélation parfaite Bonne corrélation
(corrélation forte)

x
Mauvaise corrélation
(corrélation faible)

Modèle 1 : Afin de comparer la taille des gymnasiens avec l'étendue de


leurs bras, on a effectué les mesures sur 32 élèves qui a permis
d'effectuer la représentation graphique du nuage de points
suivant:

taille [cm]
200

180

160

140

120

100
100 120 140 160 180 200
Étendue des bras [cm]

a) Représenter une droite d'ajustement "à la règle".


b) Proposer une équation de cette droite d'ajustement.
c) Proposer quelques constats.

3EC – JtJ 2021


62 THÈME 14

Exercice 14.1: Afin de faire un bilan sur la réussite des étudiants qui
s'inscrivent dans les établissements d'enseignement pour adultes,
les membres de la direction s'intéressent à la corrélation entre
l'absentéisme aux différents cours (en heures) et la moyenne
générale (en %) à la fin de l'année scolaire. Pour bien analyser le
tout, ils ont regroupé les données dans le nuage de points
suivant:

résultat final (%)


100

80

60

40

20

0 2 4 6 8
Nbre d’heures d’absence

a) Représenter une droite d'ajustement "à la règle".


b) Proposer une équation de cette droite d'ajustement.
c) Proposer quelques constats.

Exercice 14.2: À propos des élèves (garçons puis filles) de 4 classes de ECGC
d'un gymnase lausannois, on désire comparer une éventuelle
corrélation entre leur taille et leur poids. Utiliser les 2
représentations graphiques des nuages de points:

poids [kg]
poids [kg]
90 90

80 80

70 70

60 60

50 50
taille [cm] taille [cm]
40 40
150 160 170 180 190 200 150 160 170 180 190 200

Que pouvez-vous constater à propos de la corrélation


taille – poids pour les garçons (à gauche) et les filles (à droite) ?

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 63

14.2 Ajustements affines


3 démarches différentes vous seront proposées pour déterminer
au mieux une droite d'ajustement sur un nuage de points.

14.2.1 Ajustements à la règle

Ajustement à la règle : On commence par représenter le nuage de points, puis on trace


au jugé une droite d passant le plus près possible des points du
nuage. Pour ce faire, on utilise une règle transparente et on la
dispose suivant la direction constatée, en s'efforçant d'équilibrer
les nombres de points situés de part et d'autre suivant les
abscisses croissantes.
À l'aide des coordonnées de 2 points choisis sur cette droite, on
détermine alors une équation approximative de la droite
d'ajustement.
C'est cette démarche qui vous a été suggérée dans le paragraphe
précédent.

14.2.2 Méthode de Mayer

Point moyen : Lorsque l'on pense pouvoir réaliser un ajustement affine d'un
nuage, il peut sembler intéressant, avant de tracer la droite, de
placer le point dont l'abscisse est la moyenne des abscisses xi et
dont l'ordonnée est la moyenne des ordonnées yi.
On appelle point moyen d'un nuage de n points Mi(xi ; yi) le
point G de coordonnées:

1 n 1 n
 xG = x = ∑i
n i=1
x  et  yG = y = ∑ yi 
n i=1

Méthode de Mayer : On commence par trier les points selon leurs abscisses
croissantes, puis on détermine la médiane des xi afin de partager
le nuage en deux parties ayant le même nombre de points. On
détermine ensuite G1 et G2, les points moyens respectifs de
chacune de ces parties. La droite G1G2 est appelée droite de
Mayer de la série statistique.

G2

G1

Il est à noter que la droite de Mayer d'un nuage passe toujours


par le point moyen, de ce nuage.

3EC – JtJ 2021


64 THÈME 14

Modèle 2 : Le tableau suivant recense par clinique le nombre de postes du


personnel non médical yi en fonction du nombre de lits xi de la
clinique:

Clinique C1 C2 C3 C4 C5 C6 C7 C8 C9 C10
xi 122 177 77 135 109 88 185 128 120 146
yi 185 221 114 164 125 118 193 160 151 172

a) Représenter le nuage de points sur le système d'axes proposé.

200

150

80 90 100 110 120 130 140 150 160 170 180 190 200 x

b) L’ajustement affine vous parait-il justifié ?

c) Faire un ajustement affine du nombre de postes en fonction du


nombre de lits par la méthode de Mayer.

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 65

d) Vérifier que le point moyen est sur la droite d’ajustement.

e) Si une clinique contient 200 lits, estimer le nombre de postes


nécessaires pour le personnel non médical. 

3EC – JtJ 2021


66 THÈME 14

Exercice 14.3: Dans une maternité on a relevé le poids et le taille de 10


nouveau-nés. Les résultats sont consignés dans le tableau
suivant :
Enfant 1 2 3 4 5 6 7 8 9 10
Masse en kg 2,5 2,6 2,7 3 3,2 3,3 3,4 3,6 3,8 3,9
Taille en cm 45 46 48 50 51 52 53 54 54 57

On veut savoir si connaissant le poids d’un nouveau-né on peut


avoir une idée de sa taille.
a) Représenter le nuage de points sur un graphique.
b) L’ajustement affine vous parait-il justifié ? 
c) Faire un ajustement affine de la taille en fonction du poids
par la méthode de Mayer.
d) Vérifier que le point moyen est sur la droite d’ajustement.
e) Si un bébé pèse 4,2 kg quelle sera sa taille probable ? 

Exercice 14.4: On a relevé dans le tableau ci-dessous les poids (en kg)
respectifs de 12 pères xi et de leur fils aîné yi.
xi 65 63 66 64 68 62 70 68 67 69 70 72
yi 63 62 66 60 67 60 69 67 67 68 67 70

On veut savoir si connaissant le poids du père d'un enfant, on


pourrait tenter d'estimer le poids de son fils aîné.
a) Représenter le nuage de points sur un graphique.
b) Déterminer un ajustement affine par la méthode de Mayer.
c) Montrer que la droite passe bien par le point moyen.
d) Quel poids devrait avoir le fils aîné d’un homme qui
pèse 77 kg ? 

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 67

14.2.3 Méthode des moindres carrés

Méthode des moindres carrés : Il existe une méthode plus "rigoureuse" pour déterminer la
"meilleure" droite: c'est la méthode des moindres carrés.
Elle consiste, dans sa version la plus simple, à trouver la droite
qui minimise les carrés des écarts des points représentatifs à
cette droite.
y

d5

d3 d4
d1
d2

Trouver la droite telle que la somme des carrés des écarts


d1, d2, … , dn soit minimale:
n

∑d i
2
= minimum
i=1
Soit
y = mx + h
l'équation de la droite cherchée (droite de régression).

On calculera:

• sa pente m :

m=
( x1 − x ) ⋅ ( y1 − y ) + ( x2 − x ) ⋅ ( y2 − y ) +…+ ( xn − x ) ⋅ ( yn − y )
2 2 2
( x1 − x ) + ( x2 − x ) +…+ ( xn − x )

où sous sa forme plus compacte:

∑(x − x )⋅ (y − y )
i i
i=1
m = n

∑(x − x ) i
2

i=1

• son ordonnée à l'origine h:

h = y − m ⋅ x 

1 n 1 n
x = ∑ xi et y = ∑ yi
n i=1 n i=1

3EC – JtJ 2021


68 THÈME 14

Modèle 3 : On considère deux variables statistiques X et Y dont on donne le


tableau de valeurs et le nuage de points.
Déterminer l'équation de la droite de régression.
xi yi
10 25
20 30
30 41
x= y= Sommes
y

45

40

35

30

25

20
10 15 20 25 30 x

Exercice 14.5: Suite du modèle précédent :


On considère maintenant ces 3 nouvelles paires de valeurs:
xi yi    
10 28
20 24
30 44
x= y= Sommes

a) Déterminer l'équation de la droite de régression. 


b) Compléter le graphe du modèle précédent grâce à ces 3
nouvelles valeurs. Que constatez-vous?

Remarque : Le signe de la pente m donne le sens de corrélation, mais pas sa


qualité.
m>0 corrélation positive
m<0 corrélation négative
m=0 pas de corrélation
La qualité de la corrélation peut être mesurée par le coefficient
de corrélation r défini ci-dessous.

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 69

Définition : On définit le coefficient de corrélation r par:

∑(x − x )⋅ (y − y )
i i
i=1
r = 
n n

∑(x − x ) i
2
⋅ ∑(y − y )
i
2

i=1 i=1

Le coefficient de corrélation est compris entre −1 et +1. Plus il


s'éloigne de zéro, meilleure est la corrélation:
r = +1 corrélation positive parfaite
r = −1 corrélation négative parfaite
r=0 absence totale de corrélation

Exemples de corrélation :
y y

x x
r = 0,6 r=1
y y

x x
r = -0,8 r = -1
y y

x x
r=0 r=0

3EC – JtJ 2021


70 THÈME 14

Modèle 3 : Supposons un échantillon aléatoire de 4 firmes pharmaceutiques


présentant les dépenses de recherche xi et les profits yi suivants
(en milliers de CHF) proposés dans le tableau ci-dessous.
On demande de trouver la droite de régression, de compléter la
représentation graphique et de calculer le coefficient de
corrélation.

xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )


40 50
40 60
30 40
50 50
x= y= Sommes

60

50

40

30 40 50 60 x

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 71

Exercice 14.6: Le tableau ci-contre montre, pour quelques mammifères, la


durée de gestation en jours et la durée moyenne de vie en
années.
Le but de cet exercice est de vérifier si la durée de gestation a
une influence sur la durée de vie.

durée de a) Représenter graphiquement le nuage de points.


gestation
animal
en jours
vie en • 1/2 cm représente 10 jours en abscisses,
années  • 1 cm représente deux ans en ordonnées
âne 365 25 b) Un ajustement affine vous parait-il justifié ?
babouin 187 20 c) Faire un ajustement affine par la méthode de Mayer.
ours noir 219 18 d) Faites un ajustement affine par la méthode des moindres
ours gris 225 25 carrés.
ours blanc 240 20 e) Comparer les deux ajustements. Que constatez-vous ?
castor 105 5 f) Calculer et interpréter le coefficient de corrélation r.
bison 285 15
chameau 406 12
chat 63 12
chimpanzé 230 20
vache 284 15
chevreuil 201 8
éléphant 660 35
élan 250 15
renard 52 7
girafe 457 10
chèvre 151 8
gorille 258 20

Exercice 14.7: On considère le tableau suivant :


x 1 2 3 4 5 6 7 8 9
y 2 5 10 17 26 37 50 65 82

a) Tracer dans un repère le nuage de points. 


b) Déterminer par la méthode des moindres carrés une droite
d’ajustement affine puis tracer cette droite 
c) Interpréter le coefficient de corrélation r. 
d) Même si le coefficient de corrélation est proche de 1, n’y
aurait-il pas une courbe simple qui relie cet ensemble de
points ? 

3EC – JtJ 2021


72 THÈME 14

Exercice 14.8: On a mesuré le poids de naissance de 10 nouveau-nés.


L'hypothèse est qu'il existe une relation entre le poids de
naissance et l'exposition au tabac des mères pendant les deux
premiers mois de grossesse.
Le tableau ci-dessous donne pour chaque nouveau-né le poids xi
de naissance et le nombre de cigarettes yi fumées par jour par la
mère les deux premiers mois de grossesses. Pour vous faire
gagner du temps, les 7 premières lignes du tableau ont déjà été
complétées.

xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )


1447 15 -488,4 7,4 238534,56 54,76 -3614,16
1500 10 -435,4 2,4 189573,16 5,76 -1044,96
1701 5 -234,4 -2,6 54943,36 6,76 609,44
1712 8 -223,4 0,4 49907,56 0,16 -89,36
1857 9 -78,4 1,4 6146,56 1,96 -109,76
2031 7 95,6 -0,6 9139,36 0,36 -57,36
2145 11 209,6 3,4 43932,16 11,56 712,64
2214 6
2210 3
2537 2
x = 1935, 4 y = 7, 6 Sommes:

a) Compléter le tableau ci-dessus.


b) Quelle est la valeur du coefficient de corrélation r ?
c) Esquisser rapidement l'allure générale d'un nuage de points
correspondant.
d) Laquelle des deux phrases suivantes semble être la plus
vraisemblable:
• "plus les femmes fument des cigarettes durant leurs 2
premiers mois de grossesses, plus les nouveau-nés semblent
gros"
• "plus les femmes fument des cigarettes durant leurs 2
premiers mois de grossesses, plus les nouveau-nés semblent
petits"

Exercice 14.9: Le tableau suivant indique les notes données lors d'un examen
par deux examinateurs à chacune des 10 copies:
1 2 3 4 5 6 7 8 9 10
Examinateur 1 2 5 3 2 6 8 3 9 5 7
Examinateur 2 3 7 5 4 5 9 4 10 7 6

a) Déterminer le coefficient de corrélation des notes.


b) Le résultat obtenu vous parait-il "surprenant" ?

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 73

Exercice 14.10: Une étude de psychosociobiologie cherche à examiner s'il existe


une relation entre la taille des pieds des enfants et leur
intelligence. Partant d'un échantillon de 10 enfants, examiner s'il
existe une corrélation entre la pointure de leurs chaussures xi et
leur quotient intellectuel yi.
Les données de l'analyse sont rassemblées dans le tableau et
plusieurs cases ont déjà été complétées pour vous faire gagner
du temps.
xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )
31 50 -3,1 -26 9,61 676 80,6
31 55 -3,1 -21 9,61 441 65,1
32 52 -2,1 -24 4,41 576 50,4
33 56 -1,1 -20 1,21 400 22
34 63 -0,1 -13 0,01 169 1,3
34 65 -0,1 -11 0,01 121 1,1
35 69 0,9 -7 0,81 49 -6,3
36 90
37 110
38 150
x = 34,1 y = 76 Sommes:

a) Représenter le graphe du nuage de points


b) Déterminer la droite de régression et la représenter sur le
graphe
c) Calculer le coefficient de corrélation
d) Que pensez-vous de l'affirmation suivante:
"À l'aide de ce qui précède, on peut clairement constater
que plus les enfants ont de grands pieds, plus ils sont
intelligents"

3EC – JtJ 2021


74 THÈME 14

Mise en garde : Il ne faut pas confondre corrélation et relation causale.


Une bonne corrélation entre deux grandeurs peut révéler une
relation de cause à effet entre elles, mais pas nécessairement.
Exemples:
• Depuis une dizaine d'années, la taille de mon fils cadet, né
en 2001, est très bien corrélée avec la puissance de calcul
des ordinateurs personnels. Cette excellente corrélation ne
révèle bien évidemment aucune relation de cause à effet, ni
de cause commune.

• Dans un article de la revue Science et Avenir, une étude


statistique montrait une corrélation positive entre utilisation
de crème solaire et cancer de la peau. Des journalistes
pressés en avaient conclu un peu vite à la nocivité de la
crème solaire.
En fait, "Utilisation de crème solaire" et "cancer de la peau"
n'étaient que la conséquence d'une même cause: l'exposition
au soleil. Plus on s’expose au soleil plus on risque le cancer
de la peau, mais plus aussi on utilise de crème solaire.

• La taille moyenne des Japonais a augmenté de 15 cm depuis


la fin de la 2e guerre mondiale alors que la distance entre le
Japon et les États-Unis augmente de 2 ou 3 cm par an à
cause de la dérive des continents. Il y a corrélation parce que
les deux phénomènes augmentent avec le temps, mais il n'y a
pas bien évidemment la moindre causalité.

L'existence d'une corrélation, aussi bonne soit-elle, n'est


jamais la preuve d'une relation de cause à effet.

3EC – JtJ 2021


STATISTIQUE À 2 VARIABLES 75

La saviez-vous ? Pour vivre plus longtemps, consommez de la viande !


Regardons attentivement le graphique ci-dessous sur l’espérance de vie à la naissance et la
consommation de viande par habitant dans certains pays (2014).

Japon Suisse Canada Israël


Espérance de vie à la naissance [année]

Corée du Sud Australie


80 Union européenne Nouvelle-Zélande États Unis
Mexique Argentine
Chine Uruguay
Algérie Iran
Arabie
Malaisie Brésil
Thaïlande Colombie Paraguay
Bangladesh
Kasakhstan
70 Égypte Ukraine
Inde Fédération Russe
Indonésie
Philippines
Tanzanie Pakistan
Soudan
Éthiopie
Haïti
Ghana
60
Zambie

Afrique du Sud Coefficient de


Mozambique corrélation = 0,72
Nigéria
50
10 20 30 40 50 60 70 80 90 100
Consommation de viande [kg/habitant]

Sources : OECD-FAO Agricultural Outlook (Édition 2015) et


The World Bank, World Development Indicators.
D’après ce graphique, plus on mange de viande et plus l’espérance de vie est élevée
L’association est forte puisque le coefficient de corrélation vaut 0,72.
Comment interpréter cette association ?
Il y a une certitude que nous pouvons dire à ce propos: ce n’est pas parce que l’on mange plus
de viande que nous allongeons notre espérance de vie. Il s’agit d’une fausse corrélation. En
effet, la corrélation observée n’a rien à voir avec une relation de cause à effet. Pour des
raisons bien connues, l’espérance de vie est plus élevée dans les pays développés. Si on
regarde de plus près le graphique, on voit effectivement que les pays dont les habitants ont
une espérance de vie élevée sont des pays développés. Or, les pays développés sont riches et
de ce fait on y consomme beaucoup de viande. Ainsi, dans ce cas, consommation de viande et
espérance de vie sont liées à une cause commune : la richesse du pays.
C’est parce que le pays est riche qu’on y consomme plus de viande et que l’espérance de vie
est élevée.
Prudence à l’interprétation
Une corrélation peut-être induite par l’influence d’une ou plusieurs autres variables, comme
c’est le cas ici entre l’espérance de vie et la consommation de viande.
On peut également trouver une corrélation entre deux variables qui relève d’une pure
coïncidence.
Le site http://tylervigen.com/spurious-correlations (en anglais) regorge de ce type de
corrélations « absurdes ».
Pour conclure, il faut rester critique lors de l’interprétation d’une corrélation et retenir
qu’une corrélation ne constitue pas une preuve de relation de cause à effet (causalité). Le
danger de conclure à tort existe pour tout le monde, surtout s’il s’agit d’un résultat qui va
dans le sens espéré de celui qui l’interprète.

3EC – JtJ 2021


76 THÈME 14

3EC – JtJ 2021


QUELQUES RÉPONSES AUX EXERCICES QUELQUES RÉPONSES AUX EXERCICES

Quelques réponses : Thème 14 Exercice 14.4: a) Tableau ordonné et nuage de points:

xi 62 63 64 65 66 67 68 68 69 70 70 72
Exercice 14.1: a) yi 60 62 60 63 66 67 67 67 68 69 67 70
résultat final (%)
100
y
80
70
G2
60

40
65
G1

20
60

0 2 4 6 8
Nbre d’heures d’absence
65 70 x
b) On peut proposer par exemple: y = -4x + 90.
c) On constate une corrélation négative entre le nombre d'heures d'absence et G1 (64, 5; 63) ⎫⎪ 3
les résultats finaux. Peut-on alors conclure que: b) La droite de Mayer: ⎬ y = x −
G2 (69, 5; 68) ⎭⎪ 2
"plus les élèves ont été absents, plus leurs résultats ont été médiocres ?"

Exercice 14.2: • Pour les garçons, on observe une corrélation positive, mais faible. c) La droite de Mayer passe bien par le point moyen G(67 ; 65, 5)
• Pour les filles, il ne semble pas y avoir de corrélation. d) Le poids du fils estimé à 75, 5 kg.

4
Exercice 14.3: a) Nuage de points: Exercice 14.5: a) On obtient la même droite de régression: y = x +16
5
y b) La corrélation est moins forte que dans le modèle précédent.

y
55 G2
45

50 40
G1

35
45

30
40
2.5 3 3.5 4 x 25

b) Les points étant convenablement alignés, l'ajustement est justifié. 20


10 15 20 25 30 x
G1 (2,8; 48) ⎫⎪ 15
c) La droite de Mayer: ⎬  y = x + 27
G2 (3, 6; 54) ⎪⎭ 2

d) Le point moyen G(3, 2; 51) vérifie bien l'équation de la droite.


15
e) La taille = (4, 2) + 27 = 58, 5 cm (un beau bébé…)
2

3EC – JtJ 2021 3EC – JtJ 2021


QUELQUES RÉPONSES AUX EXERCICES QUELQUES RÉPONSES AUX EXERCICES

Exercice 14.6: a) Tableau ordonné et complété Exercice 14.7: a) Tableau complété

xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y ) xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )


52 7 -205,67 -9,11 42300,15 82,99 1873,65 1 2 -4 -30,67 16 940,65 122,68
63 12 -194,67 -4,11 37896,41 16,89 800,09
105 5 -152,67 -11,11 23308,13 123,43 1696,16
2 5 -3 -27,67 9 765,63 83,01
151 8 -106,67 -8,11 11378,49 65,77 865,09 3 10 -2 -22,67 4 513,93 45,34
187 20 -70,67 3,89 4994,25 15,13 -274,91 4 17 -1 -15,67 1 245,55 15,67
201 8 -56,67 -8,11 3211,49 65,77 459,59 5 26 0 -6,67 0 44,49 0
219 18 -38,67 1,89 1495,37 3,57 -73,09 6 37 1 4,33 1 18,75 4,33
225 25 -32,67 8,89 1067,33 79,03 -290,44
230 20 -27,67 3,89 765,63 15,13 -107,64
7 50 2 17,33 4 300,33 34,66
240 20 -17,67 3,89 312,23 15,13 -68,74 8 65 3 32,33 9 1045,23 96,99
250 15 -7,67 -1,11 58,83 1,23 8,51 9 82 4 49,33 16 2433,45 197,32
258 20 0,33 3,89 0,11 15,13 1,28 x =5 y = 32, 67 Sommes: 60 6308,01 600
284 15 26,33 -1,11 693,27 1,23 -29,23
285 15 27,33 -1,11 746,93 1,23 -30,34
365 25 107,33 8,89 11519,73 79,03 954,16
Nuage de points et droite d'ajustement:
406 12 148,33 -4,11 22001,79 16,89 -609,64
457 10 199,33 -6,11 39732,45 37,33 -1217,91 y
660 35 402,33 18,89 161869,43 356,83 7600,01 80
x = 257, 67 y = 16,1 Sommes: 363352,02 991,74 11556,6
70
60
Le nuage de points et les droites d'ajustement: 50
y 40
30
20
30 10

1 2 3 4 5 6 7 8 9 x
−10
20 −20
G
G1 G2
b) Équation de la droite d'ajustement: y = 10x −17, 33 .
10
c) r = 0,98. Il s'agit d'une corrélation positive forte.
d) On reconnaît le graphe de la fonction f définie par f (x) = x 2 +1.

100 200 300 400 500 600 700 x

b) Les points n'étant pas clairement alignés, les ajustements ne sont


probablement pas indiqués.
G1 (159, 22;13, 67) ⎫⎪
c) La droite de Mayer: ⎬  y = 0, 02x + 9, 71
G2 (356,11;18, 56) ⎪⎭
d) Moindre carré: y = 0, 03x + 7, 92
e) Les deux ajustements ne sont pas identiques, les droites d'ajustement se
coupent sur le point moyen G(257,67 ; 16,12).
f) r = 0,61. La corrélation est positive et faible.
La durée de vie de ces mammifères ne semble pas clairement influencée
par la durée de gestation.

3EC – JtJ 2021 3EC – JtJ 2021


QUELQUES RÉPONSES AUX EXERCICES QUELQUES RÉPONSES AUX EXERCICES

Exercice 14.8: a) Tableau complété Exercice 14.10: Tableau complété


xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )
xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y )
1447 15 -488,4 7,4 238534,56 54,76 -3614,16
31 50 -3,1 -26 9,61 676 80,6
1500 10 -435,4 2,4 189573,16 5,76 -1044,96
31 55 -3,1 -21 9,61 441 65,1
1701 5 -234,4 -2,6 54943,36 6,76 609,44
32 52 -2,1 -24 4,41 576 50,4
1712 8 -223,4 0,4 49907,56 0,16 -89,36
33 56 -1,1 -20 1,21 400 22
1857 9 -78,4 1,4 6146,56 1,96 -109,76
34 63 -0,1 -13 0,01 169 1,3
2031 7 95,6 -0,6 9139,36 0,36 -57,36
34 65 -0,1 -11 0,01 121 1,1
2145 11 209,6 3,4 43932,16 11,56 712,64
35 69 0,9 -7 0,81 49 -6,3
2214 6 278,6 -1,6 77617,96 2,56 -445,76
36 90 1,9 14 3,61 196 26,6
2210 3 274,6 -4,6 75405,16 21,16 -1263,16
37 110 2,9 34 8,41 1156 98,6
2537 2 601,6 -5,6 361922,56 31,36 -3368,96
38 150 3,9 74 15,21 5476 288,6
x = 1935, 4 y = 7, 6 Sommes: 1107122,4 136,4 -8671,4
x = 34,1 y = 76 Sommes: 52,9 9260 628
b) Il s'agit d'une corrélation négative moyenne: r = -0,7056
a) Le nuage de points et sa droite de régression:
c) Une esquisse doit ressembler à:
y
y
150

100

x
d) La phrase suivante semble être le plus adéquate: 50
"plus les femmes fument des cigarettes durant leurs 2 premiers mois de
grossesses, plus les nouveau-nés semblent petits"

Exercice 14.9: Tableau complété 26 28 30 32 34 36 38 40 x

xi yi xi − x yi − y (xi − x )2 (yi − y )2 (xi − x )⋅ (yi − y ) b) Droite de régression: y = 11,87x – 328,77


2 3 -3 -3 9 9 9 c) Coefficient de corrélation: r = 0,897.
5 7 0 1 0 1 0 Il s'agit d'une corrélation positive très forte.
3 5 -2 -1 4 1 2 d) L'affirmation proposée est évidemment fantaisiste !!
2 4 -3 -2 9 4 6 Il ne faut pas confondre corrélation et relation de cause à effet. Je vous
6 5 1 -1 1 1 -1 laisse lire le paragraphe qui suit la donnée de cet exercice.
8 9 3 3 9 9 9
3 4 -2 -2 4 4 4
9 10 4 4 16 16 16
5 7 0 1 0 1 0
7 6 2 0 4 0 0
x =5 y =6 Sommes: 56 46 45

a) Le coefficient r = 0,8866 indique une corrélation positive très forte


b) Le contraire aurait été très inquiétant… Non ?

3EC – JtJ 2021 3EC – JtJ 2021

Vous aimerez peut-être aussi