Vous êtes sur la page 1sur 16

INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1

L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

CHAPITRE 1 LES RAPPELS SUR LA STATISTIQUE DESCRIPTIVE


1-INTRODUCTION
La statistique est la méthode scientifique du traitement des données
quantitatives. Etymologiquement, la statistique c’est la science de l’état. Elle
s’applique à la plupart des disciplines : agronomie, biologie, démographie, économie,
sociologie, linguistique, psychologie et d’autres.
En statistique on s’intéresse à des unités statistiques ou unités d’observation :
des individus, des entreprises, des modules d’enseignement. En sciences, on
s’intéresse dans la plupart des cas à un nombre fini d’unités. Sur ces dernières, on
mesure un caractère ou une variable, le chiffre d’affaires de l’entreprise, l’âge de la
personne. On suppose que la variable prend toujours une seule valeur sur chaque
unité. Les variables sont désignées par une lettre (X, Y, Z) et leurs valeurs sont des
modalités. Le domaine de la variable est l’ensemble des valeurs possibles ou des
modalités.
Une série statistique est la suite des valeurs prises par une variable X sur les

unites d’observation. Le nombre d’unités d’observation est noté n.


Les valeurs de la variable X sont notées :

x1, . . ., xi, . . ., xn.


Le premier objet de la méthode statistique est de réunir les informations avant de les
traiter.
Voici quelques généralités :
- Objectif de l’information. Enquête : Il importe, dès le départ, de bien définir le ou les
objectif(s) avant de réaliser l’enquête.
- Quantité d’information : Il ne doit pas y avoir de lacunes dans l’information mais il
ne doit pas y avoir trop d’informations,
- Collecte de données : Les données sont recueillies soit par observation directe, soit
indirectement.
- observation directe : enquête menée par les statisticiens à l’aide de questionnaires
qui sont ensuite dépouillés.
- Observation indirecte statistiques de la production d’un verger ou d’un poulailler

1
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

2-LES CARACTERES STATISTIQUES


2.1- Les caractères qualitatifs
La variable est dite qualitative quand les modalités sont des catégories, grand ou
petit ; noir, rouge, bleu ou jaune ; plein ou vide.
2.2-Les caractères quantitatifs
Une variable est dite quantitative si toutes ses valeurs possibles sont numériques.
2.2.1- Les caractères quantitatifs discrets.
Une variable est dite discrète, si l’ensemble des valeurs possibles est dénombrable.
Les modalités de la variable nombre d’enfants par famille sont 0, 1, 2, 3, 4, 5, .C’est
une variable quantitative discrète. Aussi, la variable nombre de module (2, 4, 8 ou
12) et la variable nombre d’étudiants (3, 12, 56 ou 200) sont des variables
quantitatives discrètes.
Exemple1 : Un verger est composé de 100 arbres, la variable Y correspond au
nombre de fruits par arbre. Les valeurs de la variable sont

50 50 50 50 75 75 75 75 75 75

92 92 92 111 111 111 111 120 120 120

3.3.2- Les caractères quantitatifs continus


Une variable est dite continue, si l’ensemble des valeurs possibles est continu
Exemple2 : Un verger est composé de 100 arbres, la variable Y correspond au
poids des fruits en gramme par arbre. Les valeurs de la variable sont :

19,50 19,50 19,50 19,60 19,90 20,40 20,90 21,00

25,00 25,50 25,60 25,80 25,90 26,50 26,80 27,20

3- LA REPRESENTATION DES DONNEES


3.1- les séries statistiques descriptives à une dimension
3.1.1- les tableaux statistiques
Exemple1 : Un verger est composé de 100 arbres, la variable Y correspond au
nombre de fruits par arbre. Les valeurs de la variable sont

50 50 50 50 75 75 75 75

92 92 92 111 111 111 111 120

150 150 155 155 155 155 180 181

195 195 195 196 199 204 209 210

250 255 256 258 259 265 268 272

298 310 311 312 312 312 316 316

319 320 322 328 370 380 390 391

394 396 398 399 410 415 425 425

2
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

Exemple2 : Un verger est composé de 100 arbres, la variable Y correspond au


poids des fruits en kilogramme par arbre. Les valeurs de la variable sont

5,00 5,00 5,00 5,00 7,50 7,50 7,50 7,50

920 920 920 11,10 11,10 11,10 1,110 12,00

15,00 15,00 15,50 15,50 15,50 15,50 18,00 18,10

19,50 19,50 19,50 19,60 19,90 20,40 20,90 21,00

25,00 25,50 25,60 25,80 25,90 26,50 26,80 27,20

29,80 31,00 31,10 31,20 31,20 31,20 31,60 31,60

31,90 32,00 32, 0 32, 0 37,00 37,00 39,00 39,00

39, 39, 39, 39,90 41,00 41,50 42,50 42,50

3.1.2- les fréquences absolues, relatives et cumulées


A-variable quantitative discrète.
En considérant le tableau 1 (En rouge) on détermine les différentes fréquences (la
fréquence absolue d‘une valeur est le nombre de fois la présence de cette valeur
dans les mesures obtenues, dans la série statistique). Ainsi, les fréquences pour le
nombre de fruits par arbre sont mentionnées sur le tableau 1.
Tableau 1 les différentes fréquences.
Nº Nbre Fréquences Fréquences Fréquences Fréquences
de fruits absolues Relatives Relatives en % cumulées
1 50 4 0,125 12,5 0,125
2 75 4 0,125 12,5 0,25
3 92 3 0,094 9,4 0,344
4 111 4 0,125 12,5 0,479
5 120 1 0,031 3,1 0,510
6 150 2 0,062 6,2 0,572
7 155 4 0,125 12,5 0,593
8 180 1 0,031 3,1 0,697
9 181 1 0,031 3,1 0,718
12 195 3 0,094 9,4 0,812
13 196 1 0,031 3,1 0,843
14 199 1 0,031 3,1 0,874
15 204 1 0,031 3,1 0,905
16 209 1 0,031 3,1 0,936
17 210 1 0,031 3,1 1
32 1 100

Les fréquences absolues


C’est le nombre de fois qu’apparait une valeur de la série.
Les fréquences relatives.
Cette fréquence est le rapport de cet effectif absolu à l’effectif total de la population,
elle est exprimée en pourcentage.

f i = (ni /n )*100

3
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

Les fréquences cumulées.


On appelle fréquences cumulées ou fréquences relatives cumulées en xi, le nombre

fi cum tel que :


fi cum = f1+f2+….+fi

B-variable quantitative continue


En considérant le tableau 2 (En rouge) on détermine les différentes fréquences (la
fréquence absolue d‘une valeur est le nombre de fois la présence de cette valeur dans les mesures
obtenues, dans la série statistique) de la variable quantitative contnue. Ainsi, les

fréquences pour le poids des fruits par arbre sont tableau 2.


Tableau 2 les différentes fréquences.
Nº Poids des Fréquences Fréquences Fréquences Fréquences
fruits / arbre absolues Relatives Relatives cumulées
en %
1 29,9 1 0,0417 4,17 0,04171
2 31 1 0,0417 4,17 0,08342
3 31.10 1 0,0417 4,17 0,12512
4 31.20 3 0,125 12,5 0,25012
5 31.6 2 0,0833 8,33 0,33342
6 31.9 1 0,025 2,5 0,35842
7 32.0 3 0,125 12,5 0,48342
8 37.0 2 0,0833 8,33 0,56700
9 39 5 0,208 20,8 0,77472
10 39,90 1 0,0417 4,17 0,81642
11 41 1 0,0417 4,17 0,85812
12 41,5 1 0,0417 4,17 0,89982
13 42,5 2 0,0833 8,33 0.98312
14 24 1 100

3.1.3 Les classes.


Lorsque les données sont trop nombreuses on doit les réduire en classes.
L’effectif d’une classe est le nombre d’éléments de la population observés dans cette
classe. La différence entre les deux extrémités d’une classe est appelé amplitude de
la classe.
L’amplitude de classe est alors donnée par :
(Valeur max - valeur min) / nb de classes
.On peut fixer le nombre de classes selon l’une des deux formules suivantes :
i) Règle de Sturge : nb de classes = 1+ (3.3 log n)

ii) Règle de Yule : nb de classes 2.5 *


4
√n
Avec n = effectif de l’échantillon.

4
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

3.1.4 Les graphes


Variable quantitative discrète Variable quantitative continue
en histogramme
16
en radar
frequences relatives
14 % du nombre de fruits par arbre
12 frequences relatives du 31.9
poids des fruits par arbre en %
50.5 15 32
10 12.5
50.1 37
8 10
43.9 7.5 39
6
5
4 43.8 2.5 39.9
2 0
43.6 41
0
50
75
92
111
120
150
155
180
181
182
183
195
196
199
204
209
210
43.5 41.5
nombre de fruits par arbre 43 42.5
42.8 42.6
42.7

en courbe en bâtonnets

25
Fréquences cumulées
1
0.9 20

frequences relatives
0.8
0.7 15
0.6
0.5 10
0.4
0.3
5
0.2
0.1
0
0

32
37

39

41

43
31.9

39.9

41.5

42.5

42.6
42.7

42.8

43.5
43.6

43.8
43.9
50.1
50.5
50
75
92
111
120
150
155
180
181
182
183
195
196
199
204
209
210

poids des fruits par arbre Kg


nombre de fruits par arbre

5
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

3.1.5- Les indicateurs de positions


Un tableau statistique, un graphique sont long à consulter, ils ne permettent pas
d’avoir une idée précise de la distribution statistique observée. On cherche alors à
caractériser l’ensemble par la moyenne arithmétique, la médiane ou le mode
3.1.5.1 la moyenne arithmétique
La moyenne ne peut être définie que sur une variable quantitative.
La moyenne est la somme des valeurs observées divisée par leur nombre, elle
est notée :

La moyenne peut être calculée à partir des valeurs distinctes et des effectifs

3.1.5.2- la médiane Me
La médiane d’une série statistique est une valeur de la variable telle qu’il y ait autant
d’observations ayant une valeur supérieure à la médiane que d’observations ayant
une valeur inférieure à la médiane.
La médiane: La médiane, Me, est la valeur du caractère pour laquelle la fréquence
cumulée est égale à 0,5 ou 50%. Elle correspond donc au centre de la série
statistique classée par ordre croissant, ou à la valeur pour laquelle 50% des valeurs
observées sont supérieures et 50% sont inférieures. Dans le cas où les valeurs
prises par le caractère étudié ne sont pas regroupées en classe,

• si n est impair, alors la médiane est la valeur du milieu Me = xm+1.

• si n est pair, alors la médiane est une valeur quelconque entre xm et xm+1.
3.1.5.3- le mode Mo
Le mode, Mo d’une série statistique est la valeur du caractère la plus fréquente ou
dominante dans l'échantillon. Le mode correspond à la classe de fréquence
maximale dans la distribution des fréquences. Une répartition peut être unimodale ou
plurimodale (bimodale, trimodale;), si deux ou plusieurs valeurs de la variable
considérée émergent également..

6
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

3.1.6.- indicateurs de dispersion


3.1.6.1-la variance et l’écart type
La caractéristique de dispersion la plus usuelle est en effet l’écart-type. Puisque la
moyenne arithmétique des écarts à la moyenne est nulle, on a recours à la moyenne
quadratique de ces écarts. On définit, la variance d’une série comme la moyenne
arithmétique des carrés des écarts à la moyenne :

L’écart type d’une série : c’est la moyenne quadratique des écarts à la moyenne,
autrement dit, c’est la racine carrée de la variance.

NB : Il existe une autre quantité représentante de la dispersion d’une série, c’est


l’étendue :
Étendue = valeur maximale – valeur minimale.
4.1.6.2-le coefficient de variation.
L’étendue, la variance et l’écart type sont des paramètres de dispersion absolue qui
mesurent la variation absolue des données. Il existe un indice de dispersion relative
appelé coefficient de variation, CV est exprimé en pour cent(%):

Le CV permet d'apprécier la représentativité de la moyenne par rapport à l'ensemble


des observations. Il donne une bonne idée du degré d'homogénéité d'une série. Il
faut qu'il soit le plus faible possible (< 15% en pratique)

Les Caractéristiques de position : quartiles, déciles, centiles


Les quartiles, déciles et centiles sont des caractéristiques qui correspondent au
même genre de préoccupation que la médiane. Il s’agit des valeurs de la variable qui
correspondent à la médiane aux effectifs cumulés :

7
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

n/4 = Q1= premier quartile, 2n/4= Q2 = deuxième quartile = la mediane, 3n/4 = Q3 =


troisième quartile
n/10, 2n/10,…9n/10 pour les déciles ; le 5ème décile est la médiane,
n/100, 2n/100,…99n/100 pour les centiles ; le 50ème centile est la médiane.
On les appelle caractéristiques de position, puisqu’elles permettent de placer les
valeurs de la variable.

3.1.7.- indicateurs de forme


Un paramètre de forme est un paramètre d'une loi de probabilité qui n'est ni un
paramètre de position ni un paramètre d'échelle. Un tel paramètre régit uniquement
la forme de la distribution. Quand on connait les valeurs de la série statistique, on
peut définir les moments centrés.
Le moment centré d'ordre p est :

8
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

Nous connaissons le moment centré d'ordre 1

Nous connaissons aussi le moment centré d'ordre 2 :

C’est la variance
4.1.7.1-paramètre d’asymétrie (skewness)

Pour quantifier l'asymétrie, nous utiliserons le moment centré d'ordre 3 :

Le moment centré d'ordre 3 est nul si la distribution est symétrique.


- Si le moment centré d'ordre 3 est positif alors la distribution est
asymétrique à gauche,
- Si le moment centré d'ordre 3 est négatif alors la distribution est
asymétrique à droite.
Le signe du moment centré d'ordre 3 indique donc le sens de l'asymétrie. Pour
quantifier l'asymétrie Il faudrait trouver un nombre sans dimension (sans unité) pour
la quantifier, Celui-ci est obtenu par le rapport des quantités de même dimension tels
que les coefficients de fisher (le plus utilisé), ceux empiriques de Pearson et celui
Yule et kendall permettent cela.
a-Le coefficient d'asymétrie de Fischer
Il permet de déterminer le sens de l'asymétrie et de quantifier sa valeur.

"1" est le quotient du moment centré d'ordre 3 par le cube de l'écart type. Le signe

de "1" " est donc égal à celui du moment centré d'ordre 3 car l'écart -type est positif.

Numérateur et dénominateur s'expriment avec une unité. Le quotient est donc sans
unité. Ainsi,

9
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

1 = 0 la distribution est symétrique.


1 > 0 la distribution est asymétrique à gauche.
1 < 0 la distribution est asymétrique à droite.

Lorsque 1 augmente en valeur absolue la distribution devient de plus en plus asymétrique.

b-Le coefficient empirique de Pearson


C'est le nombre sans unité

Il possède les mêmes propriétés que le coefficient d'asymétrie de Fischer :


Sk = 0 la distribution est symétrique.
Sk > 0 la distribution est asymétrique à gauche.
Sk < 0 la distribution est asymétrique à droite.
Le signe de Sk indique donc le sens de l'asymétrie.
c-Le coefficient empirique de Yule et kendall
Le coefficient de Yule sert à mesurer l'asymétrie de la distribution en tenant compte
des positions relatives des quartiles par rapport à la médiane. C'est le nombre sans
unité :

me est la médiane Q1 et Q3 sont le premier et le troisième quartile de la distribution de


la série. Ce coefficient possède les mêmes propriétés que le coefficient d'asymétrie
de Fischer :
Yk = 0 la distribution est symétrique.
Yk > 0 la distribution est asymétrique à gauche.
Yk < 0 la distribution est asymétrique à droite.
Le signe de Yk indique donc le sens de l'asymétrie. Yk est compris entre -1 et 1.
4.1.7.2- paramètre d’aplatissement (Kurtosis)
Le Coefficient d'aplatissement (ou excès) mesure l'étalement de la distribution. La
forme de la courbe de distribution est comparée à celle de la loi normale. Un
coefficient négatif est révélateur d'une courbe aplatie alors qu'un coefficient positif
signalera une concentration des observations.
a-Le coefficient d'aplatissement de Fischer
Pour une loi Normale, le coefficient d'aplatissement de Pearson est égal à 3.
On définit alors le coefficient d'aplatissement de Fischer :

10
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

avec m4 le moment centré d'ordre 4 de la distribution égal à

Le coefficient de Fischer permet de situer l'aplatissement par rapport à une loi


Normale.
b-Le coefficient d'aplatissement de Pearson
C'est le nombre sans dimension égal à :

Si le coefficient d'aplatissement de Pearson est "grand", la courbe est "pointue".


4.1.7.3 les courbes
a-Asymétrie des coures (coefficient de fisher)

b-Aplatissement des courbes

11
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

4.2- SERIES STATISTIQUES DESCRIPTIVES A DEUX DIMENSIONS


Dans les chapitres précédents on étudiait une population selon un seul caractère.
Cependant il est souvent utile de considérer à la fois plusieurs caractères de la
même population : la taille, l’âge, le poids d’un groupe d’étudiants ; température et
pression d’un milieu à différentes heures, le nombre et le poids des fruits des arbres
d’un verger. Nous nous limiterons ici à l’étude simultanée de deux caractères.
4.2.1- tableaux statistiques
On considère l’étude de la production d’un verger de pommiers. On détermine le
nombre de fruits par arbre qui sera la variable X et le poids des fruits par arbre qui
sera la variable Y. Donc pour chaque arbre on aura un couple de mesures des
variables (X, Y) Ainsi, pour représenter de la distribution jointe du couple (X, Y) : on
utilise un tableau à double entrée appelé tableau de contingence.
Tableau 3 production d’un verger de pommier.
(X = nombre de fruits/arbre et Y= le poids des fruits/arbre, en kg)
Y 5 5 8 10 10 10 11 12 22 22 Totaux
X
20 2 3 5 4 3 8 4 8 6 4 47
22 5 4 3 0 0 0 0 0 0 0 12
25 0 3 8 4 8 4 8 0 0 0 35
25 3 5 4 3 8 4 3 0 0 0 30
28 5 4 3 8 4 8 6 4 0 42
30 3 8 4 8 3 5 4 3 8 0 46
35 8 4 8 3 5 4 3 8 0 0 43
35 9 8 7 5 8 3 5 7 0 0 52
36 0 0 0 0 7 5 8 3 5 7 35
36 7 5 10 8 7 11 8 9 0 65
36 7 5 10 8 7 11 9 9 0 0 66
Totaux 37 52 58 48 65 55 63 52 32 11 407

Dans ce tableau pour chaque couple de valeurs (x, y) correspond un nombre


d’arbres. Ainsi, Pour le couple (20, 5) nous avons 5 arbres qui ont produit la même
chose à savoir 20 fruits par arbre et le poids de ces fruits pèse 5kg. Avec Le couple
(30, 10) nous avons 3 arbres qui ont produit la même chose à savoir 30 fruits par
arbre et le poids de ces fruits pèse 10kg.

12
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

De ce fait d’une manière générale, le tableau de contingence est comme suit :


Tableau 4 tableau de contingence en général.
Y y1 y2 .. yj … yp Totaux=
Effectifs
fréquences
marginales
X marginaux des
fxi des xi
xi
x1 n 11 n12 n1j n1p n1• n1• /N
x2 n21 n22 n2j n2p n2• n2• /N
….
xi ni1 ni2 nij nip ni• ni• /N
….
xq nq1 nq2 nqj nqp nq• nq• /N
Totaux = 1
Effectifs marginaux n•1 n•2 n•j n•p N=n••
des yj
Fréquences marginales 1
fyj des yj n•1 /N n•2 /N n•j /N n•p/N

 En marge à droite (totaux en ligne) : la distribution de X : pour chaque

indice i, l’effectif ni• est le nombre total d’observations de la modalité xi de


X quelle que soit la modalité de Y. C’est-`a-dire

 En marge en bas (totaux en colonne) : la distribution de Y : pour chaque

indice j, l’éffectif n•j est le nombre total d’observations de la modalité yj de


Y quelle que soit la modalité de X. C’est-`a-dire

4.2.2-les fréquences (proportions) du couple (xi, yj)

La fréquence (absolue) du couple (xi, yj) est :


pij = nij / N

13
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

Les fréquences marginales de X

fxi indique la fréquence observée d'une valeur xi de X indépendamment des valeurs


observées de Y :

Les fréquences marginales de Y


fyj indique la fréquence observée d'une valeur yj de Y indépendamment des valeurs
observées de X :

Les fréquences conditionnelles

La fréquence conditionnelle de xi relativement à yj, ou bien sachant yj :

La fréquence conditionnelle de yj relativement à xi, ou bien sachant xi

4.2.4-indicateurs

Dans l’étude de deux variables quantitatives :

- Si X et Y sont des variables quantitatives discrètes : xi et yj sont les valeurs prises.

-Si X et Y sont des variables quantitatives continues : : xi et yj désignent les centres


des classes.

14
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

4.2.4.1 Moyennes des distributions marginales :

Moyenne de X :

Moyenne de Y :

4.2.4.2- Variances des distributions marginales


:
Variance et écart-type de X :

Variance et écart-type de Y :

4.2.5.3 Moyennes et variances des distributions


conditionnelles :

Moyenne de X sachant Y = yj

Variance de X sachant Y = yj

Celles de Y sachant X se déduisent de même.

15
INSTITUT DES SCIENCES VETERINAIRES ET SCIENCES AGRONOMIQUES UINVERSITE BATNA 1
L2 -AGRONOMIE. MODULE BIO STATISTIQUES. 2019 2020

4.2.6 La dépendance linéaire entre X et Y


.
La Covariance et la Corrélation sont des outils pour mesurer la dépendance linéaire
entre deux caractères quantitatifs X et Y.
4.2.6.1- La covariance
La covariance, COV (X,Y), est donnée par la formule pratique de calcul :

4.2.6.2-le coefficient de variation


Le coefficient de corrélation linéaire est le rapport entre la COV(X,Y) et le produit des
écarts types de X et Y.

Les propriétés du coefficient de corrélation : corr.(X,Y) = r ∈ [−1, 1], c’est un


coefficient sans dimension. Il mesure la présence et l’intensité de la liaison linéaire
entre X et Y.

Références bibliographiques :

http://public.iutenligne.net/mathematiques/statistiques-et-
probabilites/paronneau/resume-serie-stat

http://serge.mehl.free.fr/anx/stat_deux.html

Élément 424b, Introduction à la statistique descriptive, Prof. Marie-Hélène de Sède-


Marceau.

Statistique Descriptive _El_ementaire (version de mai 2010), Alain Baccini, Institut


de Math_ematiques de Toulouse | UMR CNRS 5219, Universit_e Paul Sabatier |
31062 { Toulouse cedex 9

16

Vous aimerez peut-être aussi