Vous êtes sur la page 1sur 9

Visitez "eboik.com" pour + de cours...

Chapitre V: Ajustement et Corrélation Linéaire

Chapitre VI : Ajustement et Corrélation Linéaire

I. Introduction

Dans ce chapitre, les variables statistiques sont supposées « discrètes ».

Pour passer aux variables continues, il suffit de remplacer les classes par leurs centres cí.

I. Ajustement

1) Notion d'ajustement
Dans les chapitres précédents, nous avons vu que les tableaux statistiques ont au moins deux
colonnes

Une colonne pour les valeurs de la variable x


Une colonne pour les efectifs ni ou les fréquences f.

Nous avons aussi procédé à des représentations graphiques.


La représentation que l'on va utiliser dans ce chapitre est celle de

Figure 8: Nuage de points

Parfois, dans ces nuages, les points représentés semblent se repartir suivant une contiguration

assezrégulière:
une parabole,
ou hyperbole
ou une courbe exponentielle ou logarithmique
ou une droite, tout simplement.

FSIES -Tétouan 62 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI: Ajustement et Corrélation Linéaire

L'ajustement consiste en substituer aux effectifs ou fréquences effectivement observés des


effectifs ou fréquences calculés à l'aide de procédés que nous allons envisager.

On conçoit, en examinant ces représentations graphiques, qu'une opération d'ajustement consiste


en

ere étape : la recherche de la forme générale de la courbe d'ajustement,


2eme étape: la détermination de l'équation de la courbe d'ajustement, telle que: n, ouf = f(xD

avec fune fonction.

2) Ajustement graphique
Lorsqu'on a, dans une représentation graphique, un nuage de points, un premier ajustement
conduit àtracer une courbe simple régulière qui compense à peu près les écarts positifs ou négatis
c'est-à-dire qui laisse à peu près le même nombre de points de part et d'autre.

Ainsi les deux figures précédentes conduisaient à des ajustements manuels qui se présenteraient
approximativement comme suit

;oul

Dans le cas où les points semblent se répartir de façon linéaire, plusieurs droites peuvent-être
candidates à ajuster ce nuage de points.

Mais, ces droites sont parallles régulièrement espacées de part et d'autre d'une droite centrale.
La droite d'ajustement est la droite centrale de l'ensemble des droites telle que les points à ajuster
se répartissent équitablement au-dessus et au-dessous de cette droite, et à l'intérieur du réseau

des parallèles.

FSIES -Tétouan 63 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI:Ajustement et Corrélation Linéaire
Cet ajustement manuel, bien que sommaire, donne en pratique de bons résultats surtout si la
courbe d'ajustement cherchée est une courbe simple, une droite par exemple.

Exemples d'ajustements graphiques linéaires


On dispose de tableau suivant

2 7
4 10
13
8 5
9 20
13 28

La représentation graphique de cette série statistique est faite de six points.

1o 12

Un ajustement linéaire est le plus approprié,


Une droite d'ajustement a été construite manuellement et figure sur la représentation.

On détermine facilement l'équation n^ = y = ax + b de cette droite en écrivant qu'elle passe

par les points, M(4;10) et N(9;20).


10 4a+b
On peut écrire
20 9a+b
Sa =10 ~a =2,ainsi b = 10-8 2 (en replaçant a dans la

1ere ligne par sa valeur).


Alors, l'équation de la droite passant par M et N est: y = 2x +2.

III. Corrélation
1) Notion de corrélation:
Parfois, on peut se trouver en face d'une population telle qu'on puisse étudier deux caractères
différents surune même unité statistique:

Variable 1:X Variable 2:Y


1
y2

Xn Yn

FSIES -Tétouan 64 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI: Ajustement et Corrélation Linéaire
«n» étant le nombre d'unités statistiques observées.

Une unité présente à la fois la mesure x, de X et la mesure yi de Y, avec i = 1, ., n

Sur le tableau précédent, on pourra s'attacher à l'étude des variations simultanées (croissance ou
décroissance) des deux caractères X et Y.
Trois situations peuvent se présenter:

a) Aucun lien entre X et Y.


b) X et Y sont liés fonctionnellement.
c)Sans être liés fonctionnellement, X et Y sont en dépendance, plus ou moins marquée.

On dira alors que X et Y sont en corrélation (positive ou négative).


Exem
Le poids et la taille des enfants d'une école sont deux variables en corrélation positive.

Mise en évidence graphique de l'existence d'une corrélation entre deux variables

Sur un repère, on représente les points de coordonnées tirées du tableau précédent:

Les points formeront un nuage de points:

Ce nuage peut se présenter de diverses façons

a) Les points se dispersent au hasard dans le plan:


Comme dans la figure précédente. Alors X et Y peuvent être indépendantes Il'une de l'autre (car
le nuage ne présente pas une influence claire d'une variable sur l'autre).

b) Les points peuvent se regrouper en un nuage deforme assez allongée, assez aplatie:

FSIES Tétouan 65 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI: Ajustement et Corrélation Linéaire

A une valeur fixée de l'une des deux variables correspondent des points qui présentent, pour
l'autre variable, des valeurs assez
rapprochées.
Les deux variables semblent alors être liées, c' est-à-dire corrélées soit positivement (croissent
ensembles). soit négativement (décroissement ensembles).

On peut alors dire que X et Y sont corrélées ou qu'il existe une corrélation entre X et Y.

2) Covariance de X etY
La variance mutuelle des deux variables X et Y est mesurées par la covariance de ces deux

variables. On la note Cov(X;Y) et elle est donnée par :Cov(K,Y ) =2x,-F)(y,-Y)


i =

Dans le cas où X = Y, on retrouve la variance de X: Cov (X X ) = 2 x , -X) =Var(X)

3) Mesure de la corrélation: Coefficientde corrélation linéaire


La corrélation est mesurée par un coefficient appelé le coefficient de corrélation linéaire.

La formule de coefficient de corrélation linéaire est: r:


-F -)
-FE,-7)
Autres écritures de coefficient de corrélation linéaire:

-F), -f) 2-F,-F) Cov (X ,Y)

-Fo,- ,-FE,-r -FE0,-F


Cov (X.Y ) Cov (X Y)
a r (X )-Var (¥) o(X ) ol¥)

Alors, le coefficient de corrélation linière s'est écrit autrementpar la formule: r= Cov (X Y)


oX)o(Y)
Propriétés
Donc, d'après ceci, on voit que -1 Sr <1.

Sir =1, alors on a une forte corrélation positive.


Si r =-1, alors on a une forte corrélation négative.
Si r = 0, alors on n'a pas de corrélation.

FSIES Tétouan 66 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI: Ajustement et Corrélation Linéaire

Exemple de calcul du coefficient de corrélation linéaire entre deux variables X et Y:

- *| -F (x-X - (x -X) ( -F)


16 |20 10.1 104 102 01 108.16 -105.04

18 24 81 6.4 65.61 96 +51 84

23 28 -3.1 -2.4 9.61 5.76 7 44

24 22 -2.1 -8.4 4.41 70.56 17.64

28 32 +1.9 +1.6 3.61 256 3.04

29 28 +2.9 2.4 8.41 5.76 6.96

26 32 -0.1 +1.6 0.01 2.56 0.16

31 36 +4.9 +5.6 24.01 31.36 +27.44

32 41 +5.9 +10.6 34.81 112 36 +62.54

34 41 +7.9 +10.6 62 41 112.36 83.74

261304 314.90 492.40 351.60D

Moyenne arithmétique de X: X = =26,1


10
304
Moyenne arithmétique de Y:Y =*=30,4
10

E-,-7) 351,60
Coefficient de corrélation linéaire:r:
2,-XL0,-F} y314,90x492,40
Donc on a une corrélation positive, comme l'indique déjà la représentation graphique et assez
serrée, le coefficientr ayant une valeur absolue voisine de 1.

IV. Droite de régression linéaire, méthode de moindres carrées

Il faut déterminer les différents paramètres d'une fonctiony f(x) qui ajuste à la façon la
=
plus
satisfaisante les observations faites, la fonction retenue devant cependant conduire à une courbe
(une droite) d'ajustement:

Y1
Observations

Supposons = f(x) est l'ajustement envisagé (on a sa forme, son type, mais pas ses paramètres!)

FSIES Tétouan 67 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI: Ajustement et Corrélation Linéaire

Graphiquement:

- - -

Méthode de calcul:

Pour déterminer la fonction d'ajustement la plus fiable, on essaie de minimiser les distances entre
les valeurs observées et leur approximation par la fonction d'ajustement:

- f ) b-f%)J*:.61)T:D. -fa,}
Alors, nous cherchons les paramètres qui donnent la fonction f qui rend la plus faible possible la

somme des carrées,f , ) f (méthode desmoindres carrés).

Autrement dit, on cherche la fonction f qui permettra de calculer les f(x) tels que

2-f, soit minimum, avec y, valeurobservéeet f(x) approximation de y calculée.


On dispose d'une distribution à deux variables statistiques X et Y pour laquelle la représentation
graphique a montré que Y peut-être ajusté par rapport à X par une droite d'équation

y =f (x)= a x +b .

Alors, par la méthode des moindres carrées, il faut que:

On cherche min>y,-f , ) f c'est-à- dire min 2[y,-a, -b}

Cela consiste donc à déterminer les paramètres a et b.

connues et lues directement


Rappelons que les valeurs nunmériques de X,.., X et y1, ..,yk Sont
sur le tableau statistique.

-,-b i=l
22,-, -b)x(-x,) =0
da i=l

-,-b} = 0
20--b)=0
I=

db

FSIES Tétouan 68 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI:Ajustement et Corrélation Linéaire

-2 -a -bx,)=0 I=
-«x-bx, =0 i =l

0,-a, -b) =0 , - , -bk =0


I = i =

+ax+6x, =+2*
=| I=
(2)>b - y -y#
- k
+ax, +bk = + » (2)
I=l

Onremplace dans (1) a ( 7 - ) x =-x,

a= - -] =l
a
i=l

i=
Cov (X Y ))
Var(X)
_Cov (X Y)
Finalement
Var (X)
b = y -

2,-Fv. -7)
Remarque: On a une autre formule: a =

Z-7
i=l

Lorsque deux variables sont en corrélation linéaire, alors on a : y = ax + b est l'ajustement de y

à partir dex.

Cette droite s'appelle: « droite de régression », ou « droite d'estimation de y à partir de x ».

Le procédé de détermination de l'équation de la droite de régression est généralement fondé sur


le principe des moindres carrés.

Exemple:
Cherchons I'équation de la droite d'ajustement ou de régression linéaire par la méthode des
moindres carrées, pour le tableau suivant:

10
13
8 15
9 20
13 28

FSIES -Tétouan 69 Pr. Hamid EL AMRANI


Visitez "eboik.com" pour + de cours...
Chapitre VI1: Ajustement et Corrélation Linéaire

On a:

x - - -09-
2 7 14 4 -8,5 42,5
4 10 40 16 -5,5 16,5 9
13 78 36 1 -2,5 2,5
8 15 120 64 +1 -0,5 -0,5
9 20 180 81 +2 +4,5 9 4
13 28 364 169 +6 +12,5 75 36

42 93 796 370 0 0 145 76

Donc F =7 et ==15,5

Calcul des paramètres a et b en utilisant les formules: a: -


x,-F2 el b= ù -

x-Fx
796-15,5x42 796-651 145
Alors, a 1,908
370-7x42 370-294 76

Et b 15,5-1,908x7=15,5-13,356=2,144

Équation de la droite d'ajustement: =1,908x +2,144

30

25

20

15

10

6 8 10 12 14

,-)o, -F) 145


Calcul du coefficient a en utilisant la formule: a =- =1,908
-7 76

ainsi b =2,144.

Remarque:
Nous avons éerit dans la recherche du paramètre b 20,-a, -b)=0 C-à-d

2,-fa,)] =0 avec f(x) =


axi +b

FSIES -Tétouan 70 Pr. Hamid EL AMRANI

Vous aimerez peut-être aussi