Académique Documents
Professionnel Documents
Culture Documents
Chapitre VI Ajustement Et Corrélation Linéaire
Chapitre VI Ajustement Et Corrélation Linéaire
I. Introduction
Pour passer aux variables continues, il suffit de remplacer les classes par leurs centres cí.
I. Ajustement
1) Notion d'ajustement
Dans les chapitres précédents, nous avons vu que les tableaux statistiques ont au moins deux
colonnes
Parfois, dans ces nuages, les points représentés semblent se repartir suivant une contiguration
assezrégulière:
une parabole,
ou hyperbole
ou une courbe exponentielle ou logarithmique
ou une droite, tout simplement.
2) Ajustement graphique
Lorsqu'on a, dans une représentation graphique, un nuage de points, un premier ajustement
conduit àtracer une courbe simple régulière qui compense à peu près les écarts positifs ou négatis
c'est-à-dire qui laisse à peu près le même nombre de points de part et d'autre.
Ainsi les deux figures précédentes conduisaient à des ajustements manuels qui se présenteraient
approximativement comme suit
;oul
Dans le cas où les points semblent se répartir de façon linéaire, plusieurs droites peuvent-être
candidates à ajuster ce nuage de points.
Mais, ces droites sont parallles régulièrement espacées de part et d'autre d'une droite centrale.
La droite d'ajustement est la droite centrale de l'ensemble des droites telle que les points à ajuster
se répartissent équitablement au-dessus et au-dessous de cette droite, et à l'intérieur du réseau
des parallèles.
2 7
4 10
13
8 5
9 20
13 28
1o 12
III. Corrélation
1) Notion de corrélation:
Parfois, on peut se trouver en face d'une population telle qu'on puisse étudier deux caractères
différents surune même unité statistique:
Xn Yn
Sur le tableau précédent, on pourra s'attacher à l'étude des variations simultanées (croissance ou
décroissance) des deux caractères X et Y.
Trois situations peuvent se présenter:
b) Les points peuvent se regrouper en un nuage deforme assez allongée, assez aplatie:
A une valeur fixée de l'une des deux variables correspondent des points qui présentent, pour
l'autre variable, des valeurs assez
rapprochées.
Les deux variables semblent alors être liées, c' est-à-dire corrélées soit positivement (croissent
ensembles). soit négativement (décroissement ensembles).
On peut alors dire que X et Y sont corrélées ou qu'il existe une corrélation entre X et Y.
2) Covariance de X etY
La variance mutuelle des deux variables X et Y est mesurées par la covariance de ces deux
E-,-7) 351,60
Coefficient de corrélation linéaire:r:
2,-XL0,-F} y314,90x492,40
Donc on a une corrélation positive, comme l'indique déjà la représentation graphique et assez
serrée, le coefficientr ayant une valeur absolue voisine de 1.
Il faut déterminer les différents paramètres d'une fonctiony f(x) qui ajuste à la façon la
=
plus
satisfaisante les observations faites, la fonction retenue devant cependant conduire à une courbe
(une droite) d'ajustement:
Y1
Observations
Supposons = f(x) est l'ajustement envisagé (on a sa forme, son type, mais pas ses paramètres!)
Graphiquement:
- - -
Méthode de calcul:
Pour déterminer la fonction d'ajustement la plus fiable, on essaie de minimiser les distances entre
les valeurs observées et leur approximation par la fonction d'ajustement:
- f ) b-f%)J*:.61)T:D. -fa,}
Alors, nous cherchons les paramètres qui donnent la fonction f qui rend la plus faible possible la
Autrement dit, on cherche la fonction f qui permettra de calculer les f(x) tels que
y =f (x)= a x +b .
-,-b i=l
22,-, -b)x(-x,) =0
da i=l
-,-b} = 0
20--b)=0
I=
db
-2 -a -bx,)=0 I=
-«x-bx, =0 i =l
+ax+6x, =+2*
=| I=
(2)>b - y -y#
- k
+ax, +bk = + » (2)
I=l
a= - -] =l
a
i=l
i=
Cov (X Y ))
Var(X)
_Cov (X Y)
Finalement
Var (X)
b = y -
2,-Fv. -7)
Remarque: On a une autre formule: a =
Z-7
i=l
à partir dex.
Exemple:
Cherchons I'équation de la droite d'ajustement ou de régression linéaire par la méthode des
moindres carrées, pour le tableau suivant:
10
13
8 15
9 20
13 28
On a:
x - - -09-
2 7 14 4 -8,5 42,5
4 10 40 16 -5,5 16,5 9
13 78 36 1 -2,5 2,5
8 15 120 64 +1 -0,5 -0,5
9 20 180 81 +2 +4,5 9 4
13 28 364 169 +6 +12,5 75 36
Donc F =7 et ==15,5
x-Fx
796-15,5x42 796-651 145
Alors, a 1,908
370-7x42 370-294 76
Et b 15,5-1,908x7=15,5-13,356=2,144
30
25
20
15
10
6 8 10 12 14
ainsi b =2,144.
Remarque:
Nous avons éerit dans la recherche du paramètre b 20,-a, -b)=0 C-à-d