Vous êtes sur la page 1sur 80

DISTRIBUTION STATISTIQUE UNE

VARIABLE Et DEUX VARIABLES : Corrlation


et Ajustement

A. DISTRIBUTION STATISTIQUE UNE VARIABLE

I. TABLEAUX STATISTIQUE ET GRAPHIQUES


.V.D

X
Effectifs

Effectifs

x1

n1

Total

Total
3

.V.C
Classes Effectifs
[; [
.
.
.
.

n1

Total
Classes

Total

Effectifs

n
4

Qualitative

Reprsentations graphiques
1. Caractres qualitatifs
1.1. Diagramme en barres (ou en tuyaux d'orgue) :

:Diagramme en btons. 1.2

1.3. Diagramme circulaire

Graphique figuratif :

Caractre

Figure possible

Population humaine
Dpenses, recettes

Etres humains
Pices de monnaie ou billets de
banque
Dessins du produit concern
Dessins du produit concern
etc

Consommations d'un produits


Importance d'une production
etc

Pouvoir d'achat du dollar canadien, 1980 2000

10

Consommation dun produit P par sexe et par tranche dges

fi

11

Caractres quantitatifs. 2
C. Discrets. 2.1
:Diagramme en btons

12

2.2. Caractres Continus

13

fi

14

Pb. les amplitudes varient d'une classe une autre !


Tailles (en cm)
[161;165[
[165;177[
[177;185[

amplitudes Nombre d'lves


4
3
12
13
8
9
Total

25

Soit u = PGCD(4; 12; 8) = 4

S1 3
h1
3
b1 1

S 2 13
1
h2 4
b2 3
3

S3 9
h3 4,5
b3 2
15

2.3. Courbe cumulative croissante et dcroissante (fct de


rpartition) :
VD

16

17

VC

18

19

Autres reprsentations graphiques. 2.4

2.4.1. Pyramides
La pyramide est un double histogramme horizontal.
L'exemple le plus connu est la pyramide des ges.

20

Exemple : Population active dans une socit X une date donne

21

:Graphiques coordonnes polaires. 2.4.2


Mois

Anne 2005

Janvier

60

Fvrier

80

Mars

100

Avril

150

Mai

200

Juin

180

Juillet

40

Aot

20

Septembre

80

Octobre

100

Novembre

110

Dcembre

130

22

23

Les graphiques polaires peuvent tre subdiviss en :


Quatre parts pour les trimestres ;
Douze parts pour les mois ;
Vingt-quatre parts pour les heures de la journe;
Cinquante-deux parts pour les semaines de lanne;
Etc

24

II. Paramtres de position et de dispersion


La reprsentations des sries dans des tableaux et des graphiques
permettent une vue densemble mais ne peuvent rsumer des tendances
moyennes ou encore des dispersions dans les sries.
La faon la plus commode de rsumer une srie se fait partir de :
la tendance centrale
et la dispersion de la srie

25

Paramtres de position. 1
1.1. Mode
Le mode d'un chantillon est la valeur qui se rpte le plus souvent,
autrement dit celle qui apparat avec la frquence la plus leve. C'est
pour cela qu'elle est parfois aussi appele dominante.
( :discrte )Exemple1. Srie discontinue
Le nombre de frres et surs des lves d'une classe est indiqu dans
le tableau suivant
Nbre de frres et surs

5 et plus

Nbre d'lves

25

Le mode dans cette srie est la valeur 1.


26

Exemple2. Dtermination du mode dans les sries statistiques continues :


Srie comportant des classes d'amplitude gale
Les salaris d'une entreprise ont t classs selon leur rmunration mensuelle dans le
tableau suivant :
Rmunrations
mensuelles

[5000;6000
[

[6000;7000
[

[7000;8000
[

[8000;9000
[

[9000;10000
[

[10000;11000[

Nombre de salaris

20

50

60

40

20

10

Le mode se trouve dans la classe [7000; 8000[. Pour connatre la valeur modale exacte,
on prend la VALEUR CENTRALE DE LA CLASSE, soit ici 7500.
[7000 ; 8000[ est la classe modale.
Srie comportant des classes d'amplitude ingale :
Dans ce cas cest le centre de la classe correspondant la densit relative )di( la plus
importante, avec

ni
di
ai

27

1.2. Mdiane
La mdiane est la valeur centrale, autrement dit celle qui partage la srie en deux
sous-sries deffectifs gaux.
Cas de variables discrtes :
Tout dabord, les valeurs de la variable doivent tre ranges par ordre croissant.
Ensuite
si le nombre dobservation est impaire [)2n+1(-observations], alors
Me = )n+1(ime observation
Exemple: soit lensemble des notes sur 20 obtenues par 9 tudiants :
E= {13 ; 14 ; 14 ; 15 ; 16 ; 18 ; 18 ; 19 ; 20}
Me = 16
si le nombre dobservation est paire )2n-observations(, alors

n ime obs. )n 1(ime obs.


Me
2

28

Cas de variables continues :


Soit les 50 notes attribues par un jury un examen,
La mdiane se trouve

[8 ;12[ (classe
mdiane)

Notes

ni ni

[0 ; 5[

10 10

[5 ; 8[

8 18

[8 ; 12[

12 30

[12 ; 15[ 11 41
[15 ; 20[ 9 50
50
On le dtermine par interpolation linaire :

29

0,5 - FMe 1
Me LMe
. aMe
f Me

avec
LMe: la limite infrieure de la classe contenant la mdiane,
FMe-1: la frquence relative cumule jusqu la classe mdiane )excluant
la frquence de cette classe(,
fMe: la frquence relative de la classe mdiane,
aMe : lamplitude de la classe mdiane,
30

:Exemple

Me 8 25 18

12 8 30 18
Me 8 7

4
12
28
Me 8 10.33
12

31

Graphiquement, la valeur mdiane est celle qui correspond au


croisement des courbes des frquences cumules croissantes et
dcroissante.
Classes en cm
Min

ni

fi

Fi

155

%0

%0

Fi

Max

155 160

155

160

%4

%4

% 100

160 165

160

165

% 24

% 28

% 96

165 170

165

170

% 24

% 52

% 72

170 175

170

175

% 20

% 72

% 48

175 180

175

180

%8

% 80

% 28

180 185

180

185

%8

% 88

% 20

185 190

185

190

% 12

% 100

% 12

190

%0
25 % 100

32

les deux
courbes se
croisent juste
avant 170

Me

33

1.3. Moyenne arithmtique :


Cest le point le plus proche tous les points de la srie statistique.
Soient n1, n2, n3, .........,np les effectifs correspondants aux modalits x1,
, x2, x3, .........,xp., si la srie est discrte
.ou les centres den chaque classe,
si la srie est continue
p

n1 x1 n2 x2 ... n p x p
1
1
x xi ni xi
n i 1
n 1
n1 n2 ... n p
N

Si on travaille sur toute la population on la note

x
i 1

i
34

Exemples :
Srie discrte
Srie continue

35

Proprits de la moyenne:

Si yi axi b alors y ax b
La moyenne de la srie S regroupant les deux sries S1 et S2 est :

x
.

nS1 x S1 nS2 x S2
nS1 nS2

cette proprit se gnralise par

nS1 x S1 nS2 x S2 ... nSk x Sk


nS1 nS2 ... nSk

36

1.4. Moyenne gomtrique :


Utilise dans
les calculs de certains indices statistiques ;
calcul de corrlation linaire;
la recherche de taux moyens de variation )croissance dune grandeur conomique(

MG

x 1 x 2 L x n

n1

x1 x 2

n2

L x p

np

Exemple : la production dun article A a t la suivante au cours du 1er trimestre : 1er


mois 200000 units, 2e mois 250000 units et au 3e mois 360000 units. Quel est le
? taux moyen mensuel de croissance
Soit Pi le nombre dunits la fin du ie mois et ti le taux daugmentation entre le mois i
et i+1. Donc on a

P3 )1 t 2 ( P2 )1 t 1 ()1 t 2 ( P1 )1 t m ( 2 P1

)1 t m ( 2 )1 t 1 ()1 t 2 ( 1 t m
tm

)1 t 1 ()1 t 2 ( 1 34.164%

)1 t 1 ()1 t 2 (
37

:Moyenne harmonique. 1.5


Utilise dans des cas particuliers : problme de vitesse, de changes
.montaires, certains indices )indices de Paasche( et problme de prix

MH

1
1
n

i 1 x i

Exemple1 : dans une entreprise de fabrication 3 ouvriers produisent des


pices. Louvrier A met 10 min par pice, B 15 min par pice et C 20 min
par pice.
Amenons la production 60 minutes
A produit 6 pices
:Le temps de production dune pice
B produit 4 pices
10 min 6 15min 4 20 min 3
C produit 3 pices
13.85min/ pice
13
-------------------------38
pices 13

:Avec la formule de MH

3
MH
13.85 min/ pice
1
1
1

10 15 20
Exemple2 : une voiture roule pendant une heure la vitesse de 80 km/h
et ensuite parcours un tronon de 60 km la vitesse de 120 km/h. Quelle
est la vitesse moyenne?
On sait que distance = vitesse x temps
dT= d1 + d2 = 80 + 60 = 140 et tT= 1.5 h
donc vm = 140/1.5 = 93.33 km/h.
Ou bien

80 60
MH
93.33km / h
80 60

80 120

39

Exemple3 : une socit marocaine doit rgler une dette auprs dun
fournisseur amricain. Elle dispose actuellement de 32000 $ quelle a
acquis au cours de 9.25 DH/$. La dette slve 78125$ ce qui ncessite
dacqurir 46125 $ pour complment dont la contrepartie globale est
440000 DH. A quel cours moyen les oprations de change ont-elles t
ralises ?
1er change : 32000 X 9.25 = 296000 DH
2e change : 46125 X i
78125 X im

= 440000 DH

i 9.54

= 736000 DH

donc im = 736000 / 78125 9.42 )cours moyen(


9.42 est la moyenne harmonique de 9.25 et 9.54 :

296000 +440000
MH
296000 440000

9.25
9.54

40

:Moyenne quadratique. 1.5

1
2
xi

n i 1

1
2
ni x i

n i 1

f
i 1

2
i

Remarque

MH MG x Q
41

2. Paramtres de dispersion
But: comparer des sries entre elles en tudiant les variations ou
dispersions des donnes par rapport la tendance centrale.
2.1. Ltendue de la srie )range ou intervalle de variation(
La diffrence entre les deux valeurs extrmes dune srie statistique. soit

E x max x min
Les quartiles. 2.2
Les quartiles dcoupent la srie des observations classes en ordre
.croissant en 4 tranche de mme effectif. On les note Q1, Q2, Q3 et Q4

42

Exemple : rpartition des salaires dans une entreprise


Classes
[3500,3700[
[3700,4100[
[4100,4300[
[4300,4700[
[4700,5300[

fi% ni Fi%

3600 21 10.5 21 10.5


3900 49 24.5 70 35
4200 100 50 170 85
4500 24 12 194 97
5000 6
3 200 100

50 21
3936.73
Q1 3700 )4100 3700(
70 21

Calcul de Q2 = Me
4100 Q 2 4300

70 100 170

ni

200 100

Calcul de Q1
3700 Q1 4100

21 50 70

xic

100 70
4160
Q 2 4100 )4300 4100(
170 70 43

Calcul de Q 3
4100 Q3 4300

35 75 85

75 35
4260
Q3 4100 )4300 4100(
85 35

Calcul de Q4
Valeur telle que 100% des observations lui sont infrieures. Donc il
correspond la modalit maximale soit Q4 = 5300
Etendue interquartile
EIQ = Q3 Q1
il contient 50% des observations
On peut effectuer une mme analyse par dciles. On les note D1, D2,
, D10
44

Quelques types de boites de dispersion

A : distribution symtrique
B : distribution symtrique peu disperse
C : distribution tale vers les valeurs leves
D : distribution tale vers les valeurs faibles
45

2.3. Ecart absolu moyen


est la moyenne arithmtique des carts par rapport la tendance
centrale, exprims en valeur absolue.

Ex

i 1

xi x

i 1

xi x

i 1

Variance et cart-type. 2.4


.Sont les principaux indicateurs de dispersion utiliss
Echantillon :

1
2
s x
n

x
n

i 1

Population : on la note V

n x
p

i 1

ou 2 x

x
i 1

2
i

46

V
Lcart-type estime la dispersion moyenne autour de la moyenne.
Coefficient de variation. 2.5
Le coefficient de variation est une mesure de la dispersion relative )cart
type par rapport la moyenne( dune srie. Il est donn par

s
Echantillon : CV 100%
x

Population : CV 100%

47

3. Quelques caractristiques de formes et de concentration


Peut on deviner lallure dune distribution ?
3.1. La forme dune distribution
3.1.1. La symtrie Deux moyens existent pour reprer la symtrie
(ou asymtrie) dune distribution :
3.1.1.1. Comparaison de tendances centrales traditionnelles
Si Mo = Me = Moyenne alors la distribution est symtrique
Si Mo > Me alors la distribution est tale vers la gauche
Si Mo < Me alors la distribution est tale vers la droite
Symtrie parfaite

Etalement gauche

Etalement droite

48

3.1.1.2. Calcul des coefficients dasymtrie


Le coefficient de Yule
bas sur les carts de quartiles :

)Q3 Me( ) Me Q1 (
s
Q3 Q1
Si s = 0, alors il y a symtrie;
Si s > 0 la mdiane est plus Q1, alors la courbe des frquences est
tale droite;
Si s < 0 la courbe est tale gauche
49

Le coefficient de Pearson
base sur les carts entre Moyennes et Modes :
Si p = 0 la srie est symtrique
Si p>0 la srie est tale droite
Si p<0 la srie est tale gauche

x Mo
p

3 x - Md
p
x
Si 0 <

srie
unimodale

srie plurimodale ou
nayant aucun mode

p < 1 lasymtrique est moyenne

Si p > 1 la courbe est fortement asymtrique


50

3.1.2. Mesure de laplatissement


3.1.2.1. Formes graphiques
Aplatie

Concentre

Normale

leptokurtique

platikurtique
msokurtique
3.1.2.2. Coefficients daplatissement

On utilise les statistiques de moments centrs dordre r


p

1
Echantillon : m r . n i x i x
n i 1
Population : on les note r

51

Coefficient de Pearson

m4
m

2
2

m4
s

Echantillon

4 4
2 2 4

Population

Coefficient de Fischer

2 = 2 3

Si 2 = 3 ou 2 = 0 alors la distribution est msokurtique


Si 2 > 3 ou 2 > 0 alors la distribution est leptokurtique
Si 2 < 3 ou 2 < 0 alors la distribution est platikurtique

52

Coefficient de Kurtosis

0.5 Q 3 Q 2
K
D 9 D1
Si K > 0.25 alors la distribution est leptokurtique
Si 0.25 < K < 0.25 alors la distribution est msokurtique
Si 0 < K < 0.15 alors la distribution est platikurtique

53

3.2. La Concentration dune distribution


Elle mesure sa rpartition observe par rapport une norme de
rpartition (la rpartition laquelle on sattend). Donc il sagit de
comparer deux sries de frquences cumules. Elle est souvent
utilise dans lanalyse des parts distributives des salaires, des
fortunes, des parts de march des entreprises, etc
Exemple :
si on observe une distribution des mnages ainsi quune distribution
de leurs revenus, on serait tent de comparer les deux distributions
pour voir si elles voluent, par quantile, de la mme manire :
Si 30% des mnages dtiendraient 30% du total des revenues alors
les revenus sont quitablement rparties, etc .
Par contre, si 30% des mnages dtiennent 80% des revenus alors
les revenus sont trs inquitablement rparties (ingalits).
54

Les indicateurs de concentration


largement utiliss dans la pratique;
sappliquent des donnes cumulatives.
la mdiale Mle :
elle partage en deux la masse totale (nixi) du caractre tudi.
Exemple
Classes
Centres xi ni Fi % masses nixi Fi %
[3500 ; 3700[
[3700 ; 4100[
[4100 ; 4300[
[4300 ; 4700[
[4700 ; 5300[

3600
3900
4200
4500
5000

21 10.5
49 35
100 85
24 97
6 100

75600
191100
420000
108000
30000

200

824700

9.17
32.34
83.27
96.36
100
55

824700 : total du salaire vers dans lentreprise


9.17 % reprsente la part du salaire vers des salaris touchant une
rmunration comprise entre 3500 et 3700
32.34 % du salaire total est vers des salaris dont la rmunration est
< 4100
Calcul de la Mle
Il est similaire celle de la mdiane Mle

L Mle

0.50 - F 'Mel 1

. aMle
f Mle

50 - 32.34
4100
. 200
50.93
4169.35

50 % du salaire total est vers des individus dont le salaire est <
4169.35

56

Courbe de concentration (Lorentz)


Elle permet de comparer une rpartition strictement galitaire, la
rpartition dune srie statistique donne.

Classes Centres Effectifs Fi % Masses F'i %


[0 ; 20[
10
4
1,43
40
0,20
[20 ; 40[
30
36
14,29 1080 5,71
[40 ; 60[
50
64
37,14 3200 22,04
[60 ; 80[
70
80
65,71 5600 50,61
[80 ; 100[
90
58
86,43 5220 77,24
[100 ;
120[

110

24

95,00

2640

90,71

[120 ;
140[

130

14

100

1820

100

57

Lign

itio
t
r
a
irp
u
q
d

58

Interprtation de la reprsentation
Reprsentation strictement galitaire :

25% des individus dtiennent 25% de la masse totale


50% des individus dtiennent 50% de la masse totale
etc
+ la courbe de concentration sloigne de cette bissectrice, plus la
srie des valeurs tudi est ingalitaire et montre une concentration
de plus en plus importante.
Remarque : lexemple montre une faible concentration.

59

Indice de concentration (coefficient de Gini)

Aire A
IG
A ire OX Z

O
Remarques :
0 IG 1
la concentration est forte lorsque IG 1
60

Calcul Pratique :
Laire sous la courbe est dcompos en triangle et trapzes.
Dans notre exemple on a 1 triangle et 6 trapzes.

1.43 0.21
Aire triangle
0.15015
2
0.21 5.71

er
Aire 1 trapze
)14.29 1.43( 38.0656
2
5.71 22.04

e
Aire 2 trapze
)37.14 14.29( 317.04375
2
22.04 50.61

e
Aire 3 trapze
)65.72 37.14( 1038.1685
2
50.61 22.61 77.24

e
Aire 4 trapze
)86.43 65.72( 1323.88675
2
Aire 5e trapze 719.66575
Aire 6e trapze 476.775

61

Donc

Aire du carr
Aire A
Aire B 5000 3913.7555 1086.2445
2

Et par suite

1086.2445
IG
0.22
5000
62

Hauteurs trapzes

Bases trapzes

Fi %

Fi%

)Fi-Fi-1(% )F'i+F'i-1(% )Fi-Fi-1()F'i+F'i-1(

1,43

0,20

14,29

5,71

12,86

5,92

76,09

37,14

22,04

22,86

27,76

634,40

65,71

50,61

28,57

72,65

2075,80

86,43

77,24

20,71

127,86

2648,47

95,00

90,71

8,57

167,96

1439,65

100,00 100,00

5,00

190,71

953,57

7827,99
7827,99
Aire A 5000
=1086.01
2
Aire A
IG =
0.22
5000

63

B. Distribution statistique deux Caractres :


Ajustement et Corrlation

64

I. Dfinitions

Soit X et Y deux variables statistiques quantitatives, discrtes ou continues. .


xi, i = 1, 2, , I : I modalits )observations(
yj, j = 1, 2, , J : J observations

1. Tableaux deux caractres

y1

y2

x1

n11

n12

x2

n21

yp

yJ

Tableau des effectifs

n1.
n2.

xq

nq.

xI
n.j

ni.

nI.
n.1

n.2

n.p

n.J

n..

65

nij : leffectif dindividus qui vrifient la ime modalit de X et la jme


modalit de Y.
ni.: le nombre dindividus pour lesquels X = xi
{)xi, ni.(/ 1 i I} est la distribution marginale de la variable X.
{)yj, n.j(/ 1 j J} est la distribution marginale de la variable Y.
Leffectif marginale ni. de la modalit xi , leffectif marginale n.j de la
modalit yj et leffectif total sont donns respectivement par
J

n i . n ij ,
j 1

n. j n ij
i 1

et

n.. n ij
j 1 i 1

66

Frquences marginales

y1

y2

x1

f11

f12

x2

f21

yp

yJ

Frquences marginales

Tableau des frquences

f1.
f2.

fij

ni j
n..

xq

fq.

xI
f.j

fi.

fI.
f.1

f.2

f.p

f.J

f..=1

67

Les effectifs par )sous(-population


Chaque caractristique correspond une )sous(-population

S-P
Y
X

y1

n12

x1
x2
S-P

y2 yp yJ ni.
n1.

n21

n2.

xq

nq.

xI

nI.

n.j

n.1 n.2

n.p

n.J n..

68

2. Frquences conditionnelles :
n ij
f j / X x i
: frquence conditionnelle de la valeur yj sachant xi.
ni .
f i / Y y j

n ij

: frquence conditionnelle de la valeur xi sachant yj.

n. j

Relation entre les frquences


Somme des frquences gal lunit :
: Frquences marginales

n. j
ni .
1
1
f

n. j 1
f i . ni . 1 . j
n.. j
j
j n..
n.. i
i
i n..
: Frquences conditionnelles

fi / j
i

nij 1
1

nij 1 f j / i nij 1
n. j i
i n. j
ni . j
j
j ni .
nij

Frquences partielles

nij

1
1
f ij n. j n.. 1
n.. j
n..
j i
i j n..

69

Le produit de la frquence marginale par la frquence conditionnelle est


gal la frquence partielle

i.

j /i

ij

3. Critres d'indpendance :
Pour que X et Y seront indpendantes, il faut et il suffit que l'on ait :

nij

ni.n. j
n..

, ou bien f ij f i. f. j , )i, j( [1, I] [1, J].

70

II. Tendances centrales et dispersions dans les sries deux variables

chaque variable peut varier indpendamment de lautre.


chaque variable dune srie x peut aussi dpendre dune
modalit de lautre srie y.

71

1. Lexpression de la moyenne et de la variance dans des tableaux


deux caractres
Moyennes (globales) :

1
Y . n. j y j
n.. j

1
X . n i .x i
n.. i
Variances (globales) :

1
V )X( . n i . x i X
n.. i

1
V )Y( . n. j y j Y
n.. j

72

Les caractristiques conditionnelles sont les moyenne et variance de x


selon chaque modalit de y (il sagit de moyenne et de variance locales
de x)
Moyennes conditionnelles (locales) :

1
X. j
n. j

1
Yi.
ni.

n x

ij i

ij

yj

Variances conditionnelles (locales) :

1
V )X. j (
n. j

n
i

ij

x X
i

.j

1
V )Yi . ( n ij ) y j Y i . ( 2
ni . j
73

2. Relation entre les moyennes


La moyenne marginale est la moyenne pondre des moyennes conditionnelles.

1
X
n..

.j

1
Y
n..

X. j

n Y
i.

i.

3. Relation entre les variances


La variance marginale est la somme de la moyenne pondre des
variances conditionnelles et de la variance pondre des moyennes
conditionnelles.
Dcomposition de la Variance globale :

1
V )X( .
n..
1
V )Y( .
n..

n V X

1
.
n..

j n. j X. j X

1
.
n..

i ni . Yi . Y

.j

.j

n V Y
i.

i.

74

4. La covariance
La covariance est une mesure de la variance lie de deux variables.

Cov)X, Y(

n ij )x i X() y i Y(

n..

n ij x i y i

n..

XY

Proprits.

Cov) aX b, cY d ( abCov) X , Y ( , ) a, b, c, d ( IR 4
Cov) X , X ( Var) X (
Remarque. Si X et Y sont indpendantes, leur covariance est nulle. La
rciproque est fausse.
75

III. Relations entre variables : rgressions et corrlations


Les courbes de rgressions sont un moyen graphique de synthtiser la
liaison existante entre deux variables )ou le nuage de points form par
ces deux variables(.
S'il existe une relation fonctionnelle entre les variables X et Y de X vers
Y et si f est un modle de cette relation ) Y = f ) X ( ( on dit que X est la
variable explicative et Y la variable explique.

76

1. La mthode des moindres carrs (ou encore la rgression linaire)


La mthode des moindres carrs rsume un nuage de points par deux
droites possibles qui lient Y X, tel que la distance entre le nuage de
points et chaque droite est minimale.

Y volue en fonction
dune variable X

X volue en fonction
dune variable Y

D y y a.x b
x

D x x a '.x b '
y

77

i b D y / x tel que:
Objectif: choix de y i ax

y i

Objectif: choix de x i a ' y i b ' D x / y tel que: x i x i

est un mimimum
est un mimimum

Calcul des coefficients. 1.1

Cov )X,Y(
V ar )Y(

avec

Cov )X,Y(

b Y aX

et

. y i X.Y
n

De mme

a '

Cov )X,Y(
Var )Y(

et

b ' X a 'Y
78

1.2. Coefficient de corrlation et pentes

r a.a '

1/ 2

Cov )X, Y(

[1,1]
X . Y

Le taux de corrlation r dtermine lintensit de la corrlation )co-dpendance(


.entre la variable X et la variable Y

1.3. Le coefficient de dtermination R


est le carr du coefficient de corrlation r. Il mesure le part de la
variabilit totale de Y explique par X )ou encore par la droite de
rgression( :
Si r2 tend vers 1, alors lvolution de X dcrit bien celle de Y.
Si r2 tend vers 0, alors lvolution de X semble tre indpendante de
celle de Y.
79

Remarque.
Si 0,5 < r2 < 1 on peut dire que l'ajustement du modle y = f(x) est
satisfaisant )plus r2 est proche de 1, meilleur est l'ajustement(.
Si r2 < 0,5 l'ajustement n'est pas parfait. Le modle ne s'ajuste pas au
nuage de points.

80