Vous êtes sur la page 1sur 109

STATISTIQUES DESCRIPTIVES

Naima SOUKHER
Plan

1 Chapitre introductif

2 -Les séries statistiques à une dimension

3 -Les séries statistiques à deux dimensions

4 -Outils d’analyse

01/12/2023 N. SOUKHER (EST) 2


Chapitre Introductif
Introduction

Définition

La statistique est la discipline qui étudie des phénomènes à travers la collecte


de données, leur traitement, leur analyse, l'interprétation des résultats et
leur présentation afin de rendre ces données compréhensibles par tous. C'est à la
fois une branche des mathématiques appliquées, une méthode et un ensemble
de techniques.

01/12/2023 N. SOUKHER (EST) 3


Chapitre Introductif
Introduction

Remarque
Ne pas confondre « La statistique » et « les statistiques »
 La statistique: Cf. définition.
 Les statistiques: données chiffrées ou les résultat numériques
de la statistique.

01/12/2023 N. SOUKHER (EST) 4


Chapitre Introductif
I. Notion de Base

1.1. Unités statistiques, population, échantillons

 Un ensemble d’objets ou de personnes d’une étude statistique est appelé population.

 Un élément de cette population est appelé individu ou unité statistique.

01/12/2023 N. SOUKHER (EST) 5


Chapitre Introductif
I. Notion de Base

1.1. Unités statistiques, population, échantillons

Exemple

Lorsque la population est trop importante pour être connue entièrement on


prélève un échantillon.

01/12/2023 N. SOUKHER (EST) 6


Chapitre Introductif
I. Notion de Base

1.2. Caractère statistique ou variable statistique:


Un caractère est une variable qui caractérise les individus de cette population.

Exemple: étudiants d’un amphithéâtre

Démographie : l’âge des étudiants

Économique: revenus des étudiants

Sociologique: loisirs des étudiants

... etc

Dans chaque exemple cité, c’est un caractère différent qui est étudié: âge, revenus,
loisirs.

01/12/2023 N. SOUKHER (EST) 7


Chapitre Introductif
I. Notion de Base

1.2. Caractère statistique ou variable statistique:

Un caractère peut varier d’un individu à l’autre. On dit que ce caractère présente
différentes modalités.

Population Caractère modalités


Des étudiants d’un âge 18 ans, 19 ans, 20
amphithéâtre ans, etc

Voitures couleur bleu, vert, blanc,


etc.

On emploie également le terme de variable statistique pour désigner un caractère, les


modalités du caractère étant les valeurs prises par cette variable.

01/12/2023 N. SOUKHER (EST) 8


Chapitre Introductif
I. Notion de Base

1.2. Caractère statistique ou variable statistique:

Variable

Variable quantitative : Variable qualitative:


Ex: couleur.
Ex: l’âge, le poids, la taille.  Ne sont pas quantifiables, car on ne peut
 Effectuer des calculs numériques sur ses pas effectuer de calculs dessus.
 On peut connaître l’effectif masculin et
critères: poids moyen, taille maximale, taille
l’effectif féminin d’une population, mais la
minimale, etc. notion de «couleur des yeux moyen» n’a pas
de sens.

01/12/2023 N. SOUKHER (EST) 9


Chapitre Introductif
I. Notion de Base

Classification des variables statistiques:

Variable quantitative Variable qualitative


Discrète Continue Ordinale Nominale
Définition Possède des Peut prendre Une relation Aucune relation
valeurs finies. une infinité de d’ordre existe d’ordre ne peut
Il est possible valeurs, formant entre les être établie sur
de les un ensemble différentes l’ensemble des
énumérer continu modalités des modalités.
(1,2,3…) variables.
Exemple Nombre de Le temps de Niveau de Sexe, couleur des
personnes réalisation d’un satisfaction (pas yeux, unité
dans une salle travail, la taille, du tout satisfait, d’emploi…
le poids, l’âge satisfait, très
d’une satisfait...)
personne …

01/12/2023 N. SOUKHER (EST) 10


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences

Définition
L’effectif total est le nombre d’individus appartenant à la population statistique
étudiée. L’effectif total sera noté 𝑁.

Exemple
Considérons un groupe comprenant trente étudiants et observons l’âge des
étudiants dans cette population.
L’effectif total de la population statistique étudiée est trente (𝑁 = 30).

01/12/2023 N. SOUKHER (EST) 11


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences


Définition et notation
L’effectif d’une modalité 𝑥𝑖 d’un caractère 𝑥 est le nombre d’individus présentant
cette modalité.
L’effectif correspondant à la ième modalité du caractère 𝑥 est noté 𝑛𝑖 .

Exemple
Considérons de nouveau le groupe de trente étudiants et construisons un tableau
pour regrouper les différentes informations que l’on a sur leur âge.
La première information que l’on va noter dans ce tableau est l’effectif de chaque
âge observé.

01/12/2023 N. SOUKHER (EST) 12


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences


Exemple

Âge Effectif 𝒏𝒊
18 2
19 4
20 10
21 11
22 3
Total 30

01/12/2023 N. SOUKHER (EST) 13


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences


Propriété et notation

De façon générale, l’effectif total 𝑁 est égal à la somme des effectifs de


chaque modalité du caractère, ce que l’on peut écrire:
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑁
Pour une variable qui a 𝑘 modalités.
Pour simplifier l’écriture, on note cette somme

𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = ෍ 𝑛𝑖
𝑖=1
Cette notation se lit somme des 𝑛𝑖 pour 𝑖 variant de 1 à 𝑘.

01/12/2023 N. SOUKHER (EST) 14


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences

01/12/2023 N. SOUKHER (EST) 15


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences

Définition

La fréquence d’une modalité est la proportion d’individus de la


population totale qui représentent cette modalité: elle est obtenue en
divisant l’effectif de cette modalité du caractère par l’effectif total et
notée 𝑓𝑖 , soit:
𝑛𝑖
𝑓𝑖 =
𝑁

01/12/2023 N. SOUKHER (EST) 16


Chapitre Introductif
I. Notion de Base

1.3. Effectifs et fréquences


Exemple
Considérons l’exemple du groupe de trente étudiants. On a regroupé les fréquences
correspondant à l’âge des étudiants dans le tableau suivant:

Âge Effectif 𝒏𝒊 Féquence 𝒇𝒊


18 2 2
= 0,067
30
19 4 4
= 0,133
30
20 10 10
= 0,333
30
21 11 11
= 0,367
30
22 3 3
= 0,100
30
Total 30 30
01/12/2023 N. SOUKHER (EST) =1 17
30
Statistique Descriptive Univariée

01/12/2023 N. SOUKHER (EST) 18


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Qualitative nominale

Noms Couleur des yeux Modalités Effectifs Fréquences %


M. Alberro Vert Bleu 60 0,200 20,0
M. Hondarrague Noir Noir 160 0,533 53,3
Mme Claverotte Noir Noisette 40 0,133 13,3
Melle Lopez Noisette Vert 40 0,133 13,3
M. Paulien Bleu Total : 300 1 100
M. Guillou Noir
M. Lahitette Noisette Modalités Effectifs Fréquences %
Mme Vigouroux Noir modalité 1 n1 f1= n1/n f1×100
Melle Maleig Bleu … … …
M. Duclos Vert modalité i ni fi= ni/n f i ×100
M. Carricaburu Bleu … … …
Mme Vidal Noir modalité k nk fk= nk/n f k ×100
…. …. Total :  n i = n  fi =1 100

01/12/2023 N. SOUKHER (EST) 19


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Qualitative nominale

Modalités Effectifs Fréquences %


Bleu 60 0.200 20,0
Noir 160 0,533 53,3
Noisette 40 0,133 13,3
Vert 40 0,133 13,3
Total : 300 1 100

Diagramme circulaire ou camembert


Diagramme en barres
Vert
Bleu
13% 180
20% 160
160
Noisette 140
13%
120
100

80
60
60
40 40
40
Noir
54% 20

0
Bleu Noir Noisette Vert

01/12/2023 N. SOUKHER (EST) 20


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Qualitative ordinale

130 personnes ont été interrogées sur leur addiction au


chocolat
Modalités Effectifs = Nombre de personnes
Les Pas du tout (A) 10
modalités Un peu (B) 25
sont Beaucoup (C) 40
présentées Passionnément (D) 32
dans l’ordre A la folie (E) 23
45
40
40

35 32

30
25
25 23

20

15
10
10

0
A B C D E

01/12/2023 N. SOUKHER (EST) 21


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative discrète

Clients Nombre de produits


financiers
Nombre de Nombre de clients
Bredat 2 produits financiers
Gauguet 3 0 103
Leremboure 0 1 115
Coustere 0 2 95
Lalisou 1 3 35
Aussagne 0 4 10
Vittorello 1 5 2
Diaz 0
Etcheverry 2 Valeurs de Effectifs Fréquences %
Bernadet 4 la variable
Miramon 1 x1 n1 f1= n1/n f1×100
Jaime 3 … … …
Dartus 2 xi ni fi= ni/n f i ×100
Domege 0
Train 0 … … …
Piquemal 1 xk nk fk= nk/n f k ×100
Laffargue 2 Total :  n i = n  fi =1 100
…… …….

01/12/2023 N. SOUKHER (EST) 22


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative discret

Nbre de produits financiers Effectif Fréquence


xi ni fi
0 103 0,286
1 115 0,319
2 95 0,264
3 35 0,097
4 10 0,028
5 2 0,006

Diagramme en bâtons
140

120

100

80

60

40

20

0
0 1 2 3 4 5 6

01/12/2023 N. SOUKHER (EST) 23


Statistiques Descriptive Univariée
I- Tableaux et Graphiques

Quantitative discrète

Nbre Nombre de Effectifs cumulés Effectifs cumulés


produits Clients croissants décroissants
financiers
0 103 103 360
Effectifs cumulés croissants: 1 115 218 257
Nombre d'individus pour lesquels la 2 95 313 142
variable est inférieure ou égale à xi. 3 35 348 47
4 10 358 12
Résultat de l'addition, de proche en 5 2 360 2
proche, des effectifs d'une distribution Total : 360
observée en commençant par le 1er.

Valeurs de la Effectif Effectifs cumulés Effectifs cumulés


variable croissants décroissants
Effectifs cumulés décroissants: xi ni Ni N’i
Nombre d'individus pour lesquels la x1 n1 N1= n1 N’1= nk+ ….+ n1= n
variable est supérieure ou égale à xi. x2 n2 N2= n1+ n2 N’2= nk+ ….+ n2
Résultat de l'addition, de proche en x3 n3 N3= n1+ n2+ n3 N’3= nk+ ….+ n3
proche, des effectifs d'une distribution … … …. ….
observée en commençant par le dernier. xk-1 nk-1 Nk-1= n1+ ….+ nk-1 N’k-1= nk+ nk-1
xk nk Nk= n1+ ….+ nk= n N’k= nk
Total : n

01/12/2023 N. SOUKHER (EST) 24


Statistiques Descriptive Univariée
I- Tableaux et Graphiques

Quantitative discrète

Nombre de Nombre de Effectifs Effectifs Fréquences Fréquences Fréquences


produits clients cumulés cumulés cumulées cumulées
financiers croissants décroissants croissantes décroissantes
xi ni Ni N’i fi Fi F’i
0 103 103 360 0,2861 0,2861 1
1 115 218 257 0,3194 0,6055 0,7139
2 95 313 142 0,2639 0,8694 0,3945
3 35 348 47 0,0972 0,9666 0,1306
4 10 358 12 0,0278 0,9944 0,0334
5 2 360 2 0,0056 1 0,0056
Total : 360 1

Il y a 313 clients possédant un nombre de produits financiers inférieur ou égal à 2


Il y a 47 clients possédant un nombre de pro. fin. supérieur ou égal à 3
La proportion de clients possédant un nombre de pro. fin. inférieur ou égal à 4 est de 99,44%
La proportion de clients possédant un nombre de pro. fin. supérieur ou égal à 1 est de
71,39%

01/12/2023 N. SOUKHER (EST) 25


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

Variable observée: augmentation moyenne mensuelle du salaire, en €, des employés


d’une multinationale au cours de l’année 2005. Augmentation Effectif
(€)
0 257
1 318
2 255
3 307
4 308
18 38 10 35 0 4 5 159
4 11 27 2 41 16 6 140
2 25 43 22 26 11 7 84
34 34 1 28 5 5 8 72
21 0 2 30 1 8
9 37 22 39 11 0 9 55
36 16 6 42 42 1 10 22
8 33 31 33 4 4 11 13
9 19 15 2 21 0 12 9
12 18 …. …. …. ….
13 7
14 8
15 21
16 6
17 2
….. ….
Total 2125

01/12/2023 N. SOUKHER (EST) 26


Statistiques Descriptive Univariée
I- Tableaux et Graphiques

Quantitative continue

Remarque1: Une variable continue ne prend pas des valeurs isolées, mais des valeurs
appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs,
on définira des effectifs par intervalles, appelés classes.

Remarque2 : Une variable discrète comportant trop de valeurs est aussi traitée comme
une variable continue.

01/12/2023 N. SOUKHER (EST) 27


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

Augmentation (€) Effectifs


[0 – 3[ 830 Classes Effectifs
[3 – 5[ 615 [e1 – e2[ n1
[5 – 10[ 510 [e2 – e3[ n2
…. ….
[10 – 20[ 92
[ek – ek+1[ nk
[20 – 30[ 63
[30 – 50[ 15

Remarque 1: Il faut préciser la « borne inférieure » et la « borne supérieure »


des classes.
Il faut préciser sans ambiguïté si les valeurs des extrémités sont inclues ou non
dans les classes.

01/12/2023 N. SOUKHER (EST) 28


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

Classes Effectifs Amplitude


ni ai
[0 – 3[ 830 3
[3 – 5[ 615 2
[5 – 10[ 510 5
[10 – 20 [ 92 10
[20 – 30[ 63 10
[30 – 50[ 15 20

Remarque 2: Il est préférable de prendre des classes d’amplitudes égales.


Remarque 4: Le choix et le nombre de classes influent sur les représentations
graphiques.

01/12/2023 N. SOUKHER (EST) 29


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

Classes Effectifs centre


ni ci
[0 – 3[ 830 1,5
[3 – 5[ 615 2,5
[5 – 10[ 510 7,5
[10 – 20 [ 92 15
[20 – 30[ 63 25
[30 – 50[ 15 40

Chaque classe est caractérisée par:


 Borne inférieure
 Borne supérieure
 Amplitude (ai)
 Centre (Ci).

01/12/2023 N. SOUKHER (EST) 30


Statistiques Descriptive Univariée
I- Tableaux et Graphiques

Quantitative continue

REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

effectif
900
800
Classes Effectifs
700
[0 – 3[ 830
600
[3 – 5[ 615 500
[5 – 10[ 510 400
[10 – 20 [ 92 300
[20 – 30[ 63 200
[30 – 50[ 15 100
0
0
3

30

50
01/12/2023 N. SOUKHER (EST) 31
Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

350
Effectif rectifié
Classes Effectifs Amplitude Effectifs 300

ni ai rectifiés 250
ni /ai HISTOGRAMME
[0 – 3[ 830 3 276,7 200

[3 – 5[ 615 2 307,5 150


[5 – 10[ 510 5 102,0
100
[10 – 20 [ 92 10 9,2
[20 – 30[ 63 10 6,3 50

[30 – 50[ 15 20 0,75 0 0


3

30

50
01/12/2023 N. SOUKHER (EST) 32
Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Classes Effectifs Amplitude Effectifs 350


Effectif rectifié
ni ai rectifiés 300
ni /ai
250
[0 – 3[ 830 3 276,7 HISTOGRAMME
[3 – 5[ 615 2 307,5 200

[5 – 10[ 510 5 102,0 150


[10 – 20[ 92 10 9,2
[20 – 30[ 63 10 6,3 100

[30 – 50[ 15 20 0,75 50

0
3

30

50
La surface = ai ×(ni/ai) est de 830 unités

La surface = ai × (ni/ai) est de 615 unités

01/12/2023 N. SOUKHER (EST) 33


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

REPRESENTATION GRAPHIQUE DES EFFECTIFS ET FREQUENCES

Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles

Remarque: Le tracé de l’histogramme des fréquences est identique. Il suffit de porter


en ordonnées la fréquence rectifiée di = fi/ai, appelée densité.

01/12/2023 N. SOUKHER (EST) 34


Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue

EFFECTIFS ET FREQUENCES CUMULES


Classes Effectifs Effectifs Effectifs Fréquences Fréquences
cumulés cumulés cumulées cumulées
croissants décroissants croissantes décroissantes
[ei – ei+1[ ni Ni N’i Fi F’i
Variable observée: [0 – 3[ 830 830 2125 0,391 1,000
augmentation moyenne [3-5[ 615 1445 1295 0,680 0,609
mensuelle du salaire, en [ 5 - 10 [ 510 1955 680 0,920 0,320
€, des employés d’une [10 - 20 [ 92 2047 170 0,963 0,080
[20 - 30 [ 63 2110 78 0,993 0,037
multinationale au cours [30 – 50[ 15 2125 15 1,000 0,007
de l’année 2005. Total : 2125

Il y a 1445 employés dont l’augmentation est strictement inférieure à 5

Il y a 170 employés dont l’augmentation est supérieure ou égale à 10

Combien y-a-t-il d’employés dont l’augmentation est inférieure à 17 ?

01/12/2023 N. SOUKHER (EST) 35


Statistiques Descriptive Univariée
I- Tableaux et Graphiques

RESUME
VARIABLE QUALITATIVE VARIABLE QUANTITATIVE
Nominale Ordinale Discrète Continue

Effectifs ou Fréquences Effectifs ou Fréquences


Diagramme en barres Diagramme en barres Diagramme en bâtons Histogramme

Modalités dans
l ’ordre

Diagramme circulaire

01/12/2023 N. SOUKHER (EST) 36


Statistiques Descriptive Univariée

PARAMETRES STATISTIQUES

01/12/2023 N. SOUKHER (EST) 37


Statistiques Descriptive Univariée
II-Paramètres statistiques
Les représentations graphiques ont permis une première synthèse visuelle de la
distribution des observations

Un paramètre statistique permet de résumer par une seule quantité numérique une
information contenue dans une distribution d’observations.

! Les paramètres statistiques ne concernent que les variables quantitatives

Variable Variable Variable


3000 3000 3000

2500 2500 2500

100 % - A % 2000
2000 2000
Dispersion
Tendance centrale 1500
1500 1500
Position
1000 1000
A% 1000

500 500 500

0 0 0
0 N° individu 0 N° individu 0 N° individu

01/12/2023 N. SOUKHER (EST) 38


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 ou plus...

Mode Mode Classe modale

Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente

01/12/2023 N. SOUKHER (EST) 39


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 ou plus...

Mode Mode Classe modale

Le mode correspond à l'abscisse du maximum, c.à.d. la valeur la plus fréquente

01/12/2023 N. SOUKHER (EST) 40


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
Calcule du mode M0

01/12/2023 N. SOUKHER (EST) 41


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
La Médiane

Les valeurs observées doivent être rangées par ordre croissant.

La médiane𝑀 est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".

Nombre impair d’observations Nombre pair d’observations

3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9

4 valeurs 4 valeurs 4 valeurs 4 valeurs


𝑴 Intervalle médian
𝑴 = milieu = 𝟓, 𝟓

01/12/2023 N. SOUKHER (EST) 42


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
La Moyenne Arithmétique
La moyenne arithmétique est notée x

1 n
Série brute x1, x2, … , xn x =  xi
n i=1

Série groupée Valeurs de Effectifs Fréquences 1 k


la variable x =  nixi
x1 n1 f1= n1/n n i=1
… … …
k
nixi k
xi ni fi= ni/n
 = fi x i
… … … i=1 n i=1
xk nk fk= nk/n

01/12/2023 N. SOUKHER (EST) 43


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
La Moyenne Arithmétique

Classes Effectifs Fréquences Centres de classe


Série classée
[e1 – e2[ n1 f1 x1= ( e1 + e2)/2
[e2 – e3[ n2 f2 x2= ( e2 + e3)/2
…. …. …. ….
[ek – ek+1[ nk fk xk= ( ek + ek+1)/2

1 k k
x =  n i x i   fi x i
n i=1 i=1

01/12/2023 N. SOUKHER (EST) 44


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
La Moyenne Arithmétique
Comment faire la moyenne de plusieurs populations ?

Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2

Population P = P1 P2
Effectif n = n1+ n2
Moyenne x?

k
nixi
x= 1 1 2 2 
nx +n x Moyenne globale = moyenne des moyennes
n i=1 n

01/12/2023 N. SOUKHER (EST) 45


Statistiques Descriptive Univariée
II-Paramètres statistiques

1. Tendance centrale
Moyennes Géométrique et Harmonique
Moyenne géométrique

n1 n 2 nk
G = n x x .....x
1 2 k
Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen)

Moyenne harmonique
n
H= k
ni
x
Utilisée dans le cas où l’on combine 2 variables
sous forme de rapport (pièces/heure,
km/litre,…)
i=1 i
01/12/2023 N. SOUKHER (EST) 46
Statistiques Descriptive Univariée
II-Paramètres statistiques

2. Position
Les Fractiles ou Quantiles
On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les
observations en k parties d'effectifs égaux.

1 médiane M qui divise les observations en 2 parties égales

3 quartiles Q1, Q2, Q3 qui divisent les observations en 4 parties égales

9 déciles D1, D2, …, D9 qui divisent les observations en 10 parties égales

99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales

01/12/2023 N. SOUKHER (EST) 47


Statistiques Descriptive Univariée
II-Paramètres statistiques

3. Dispersion
Paramètres de Dispersion
Etendue : R = xmax - xmin
Intervalle interquartile : IQ = Q3 - Q1

Variance : Série brute : Série groupée ou classée :

1 n 1 k k
V =   xi - x  V =  n i  x i - x    fi  x i - x 
2 2 2

n i=1 n i=1 i=1

1 k
V =  n i x i2  x 2 = Moyenne des carrés - Carré de la moyenne
n i=1

Ecart-type : σ= V

01/12/2023 N. SOUKHER (EST) 48


Statistiques Descriptive Univariée
II-Paramètres statistiques

3. Dispersion
Paramètres de Dispersion
Comment faire la variance de plusieurs populations ?

Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Variance V1 Variance V2

Population P = P1 P2
Effectif n = n1+ n2
Moyenne x
Variance V ?

01/12/2023 N. SOUKHER (EST) 49


Statistiques Descriptive Univariée
II-Paramètres statistiques

3. Dispersion

Paramètres de Dispersion

Comment faire la variance de plusieurs populations ?

1 k 1 k
V =  n i Vi +  n i  x i -x 
2

n i=1 n i=1
Variance globale = Moyenne des variances + Variance des moyennes

01/12/2023 N. SOUKHER (EST) 50


Statistiques Descriptive Univariée
II-Paramètres statistiques

3. Dispersion
Propriétés Importantes de la Moyenne et de la Variance
Comment se comportent la moyenne et la variance
lorsqu’on fait subir un changement de variable aux observations?

xi yi = a xi + b

y=ax+b V(y) = a 2 V(x) σ(y) = a σ(x)

Comment se comportent la moyenne et la variance


de la somme de deux séries d’observations?

xi
zi = xi + yi
yi
z= x+ y V(z)  V(x)+ V(y)

01/12/2023 N. SOUKHER (EST) 51


Statistiques Descriptive Univariée
III- Exercice d’application
Considérons la distribution des 200 employés d’une entreprise selon leur salaire annuel X
exprimé en Kilo-euros:

Salaire
Effectif
annuel
𝑛𝑖
(𝐾€) 1) Donner la variable étudiée et sa nature.
10; 20 20 2) Déterminez:
a) Le salaire moyen
20; 30 60 b)Le mode
30; 40 35 c)Le premier quartile
40; 50 15 d)La médiane
e)Le troisième quartile
50; 60 40 f) La variance
60; 70 18
70; 80 12
TOTAL 200

01/12/2023 N. SOUKHER (EST) 52


Les séries statistiques à deux
dimensions

01/12/2023 N. SOUKHER (ESTFBS) 53


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire Taille Poids
1/ Tableaux et graphiques 140 38,2

A- Séries quantitatives connues individuellement 161 44,3


155 46,1
Exemple
148 38,2
On dispose des mesures de taille et de poids de 19 adolescents. Les
155 50,5
données sont présentées par paires. Le premier élément de la paire
correspond à la taille et le second au poids. 123 22,4
160 40,4

Tableau 1
140; 38,2 ; 161; 44,3 ; 155; 46,1 ; 148; 38,2 ; 155; 50,5 ; 123; 22,4 ; 140 34,7
160; 40,4 ; 140; 34,7 ; 165; 50,5 ; 172; 50,5 ; 155; 38,1 ; 160; 57,3 ;
165 50; 5
142; 39,3 ; 157; 46,1 ; 142; 37,1 ; 148; 45,9 ; 180; 66,3 ; 167; 60 ;
165; 50,5 172 50,5
155 38,1
La présentation des données dans un tableau à deux 160 57,3
dimensions est données ci-contre, avec la 142 39,3
représentation graphique la plus courante qui est
celle dite du « nuage de points ». 157 46,1
142 37,1
148 45,9
01/12/2023 N. SOUKHER (ESTFBS) 54
180 66,3
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1/ Tableaux et graphiques
A- Séries quantitatives connues individuellement

70
65

Figure 60
55
1 50
45
40
35
30
25
20
120 130 140 150 160 170 180 190

Ce graphique permet d’avoir un aperçu visuel de l’existence ou non d’une


corrélation entre les deux variables, ici la taille et le poids.

01/12/2023 N. SOUKHER (ESTFBS) 55


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1/ Tableaux et graphiques
A- Séries quantitatives connues individuellement
Ainsi sur la figure 2, une droite « de tendance » a été ajoutée.
70

65

60

55

Figure 50

2 45

40

35

30

25

20
120 130 140 150 160 170 180 190

Les coefficients de cette droite peuvent être calculés précisément.

01/12/2023 N. SOUKHER (ESTFBS) 56


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1. Tableaux et graphiques
B- Séries quantitatives groupées

Exemple
Les données de l’exemple 1 concernant la taille et le poids de 19 adolescents ont
été regroupées par classe dans le tableau de contingence ci-dessous.

Tableau 2
20, 40 40, 60 60; 80
Poids

Taille
120; 140 1 0 0
140; 160 6 4 0
160; 180 0 6 2

01/12/2023 N. SOUKHER (ESTFBS) 57


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1. Tableaux et graphiques
B- Séries quantitatives groupées

Exemple:

6
6
6

5 4
La figure 3 illustre la représentation 4

Effectifs
classique sous forme d’un histogramme à 2
3
trois dimensions: le poids, la taille et les 2
effectifs. Les effectifs non nuls ont été 0
[160;180]
1 0
reportés directement sur les barres. [140;160[
[120;140[
0
[20;40[ [40;60[ [60;80]
Taille

Figure 3

01/12/2023 N. SOUKHER (ESTFBS) 58


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1. Tableaux et graphiques

C- Séries qualitatives

Exemple: supposons que l’on ait les données suivantes sur le sexe et le statut d’activité de
20 personnes. Les données sont présentées par paire. La première information concerne
le sexe avec les deux modalités 𝑀 et 𝐹. La seconde information concerne le statut
d’activité, avec trois modalités (actif occupé [𝐴𝑂], chômeur[𝐶], inactif[𝐼]).

𝐹; 𝐴𝑂 ; 𝑀; 𝐼 ; 𝐹; 𝐶 ; 𝐹; 𝐶 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐶 ; 𝐹; 𝐼 ; 𝐹; 𝐼 ; 𝐹; 𝐼 ;
𝑀; 𝐶 ; 𝐹; 𝐴𝑂 ; 𝐹; 𝐴𝑂 ; 𝐹; 𝐴𝑂 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐶 ; 𝑀; 𝐴𝑂 ; 𝐹; 𝐼 ; 𝐹; 𝐶 ; 𝑀; 𝐴𝑂

01/12/2023 N. SOUKHER (ESTFBS) 59


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1. Tableaux et graphiques
C- Séries qualitatives

Regroupons ces données dans un tableau de contingence (Tableau 3). On obtient le


graphique suivant (Figure 4), qui est une variante d’histogramme:

Tableau Figure 4
3
Actifs Chôme Inactifs
Statut occupés urs 5
4

EFFECTIFS
Sexe 3
Mascul 5 3 1 2
in 1 Féminin
Masculin
0
Fémini 4 3 4 Actifs chômeurs Inactifs
n occupés

01/12/2023 N. SOUKHER (ESTFBS) 60


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contingence
Généralisation: TABLEAU DE CONTINGENCE
Le tableau suivant (tableau 4) représente un tableau de contingence sous forme symbolique. A
l’intersection de la modalité 𝑋𝑖 et de la modalité 𝑌𝑗 se trouve l’effectif correspondant.
Valeurs ou modalités de 𝑌
Tableau 4

Y 𝑌1 𝑌2 … 𝑌𝑗 … 𝑌𝑞 𝑛𝑖+
X

Effectifs marginaux de
𝑋1 𝑛1+
Valeurs ou modalités de

𝑋2 𝑛22 𝑛2𝑞
𝑛2+
… …
𝑋𝑖 𝑛𝑖𝑗
𝑛𝑖+
… …
𝑋𝑝 𝑛𝑝𝑞 𝑛𝑝+
𝑛+𝑗 𝑛+1 𝑛+2 … 𝑛+𝑗 … 𝑛+𝑞 𝑛++
Effectifs marginaux de 𝑌
01/12/2023 N. SOUKHER (ESTFBS) 61
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contingence
Généralisation: TABLEAU DE CONTINGENCE

L’effectif 𝒏𝒊𝒋représente le nombre d’individus qui ont à la fois la modalité/valeur


𝑋𝑖 et la modalité/valeur 𝑌𝑗 . On a ensuite les symboles suivants:
𝒏𝟐𝟐 : effectif des individus qui ont la modalité/valeur 2 de 𝑋 et la modalité 2 de
𝑌.
Par convention, on note toujours la modalité/valeur 2 de 𝑋 𝑖 avant celle de
𝑌 𝑗 .
𝒏𝟐𝒒 : effectif des individus qui ont la modalité/valeur 2 de 𝑋 et la modalité 𝑞 de
𝑌.
𝒏𝒑𝒒 : effectif des individus qui ont la modalité/valeur 𝑝 de 𝑋 et la modalité/valeur
𝑞 de 𝑌.

01/12/2023 N. SOUKHER (ESTFBS) 62


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contingence
Généralisation: TABLEAU DE CONTINGENCE

𝒏𝒊+ : effectif des individus qui ont la modalité/valeur 𝑖, (le « + » à


la place du 𝑗 signifie que l’on ne tient pas compte de 𝑌). Exemple:
𝒏𝟏+ désigne l’effectif des individus qui ont la modalité/valeur 1 de
𝑋.
𝒏+𝒋 : effectif des individus qui ont la modalité 𝑗, (le « + » à la place
du 𝑖 signifie que l’on ne tient pas compte de 𝑋). Exemple: 𝑛+1
désigne l’effectif des individus qui ont la modalité/valeur 1 de 𝑌.
𝒏++ : effectif total.

01/12/2023 N. SOUKHER (ESTFBS) 63


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contignence
Généralisation: TABLEAU DE CONTINGENCE

Dés lors:
𝑞

𝑛𝑖+ = ෍ 𝑛𝑖𝑗 = 𝑛𝑖1 + 𝑛𝑖2 + ⋯ + 𝑛𝑖𝑞


𝑗=1
𝑝

𝑛+𝑗 = ෍ 𝑛𝑖𝑗 = 𝑛1𝑗 + 𝑛2𝑗 + ⋯ + 𝑛𝑝𝑗


𝑖=1
𝑝 𝑝 𝑞 𝑞 𝑞 𝑝

𝑛++ = ෍ 𝑛𝑖+ = ෍ ෍ 𝑛𝑖𝑗 = ෍ 𝑛+𝑗 = ෍ ෍ 𝑛𝑖𝑗


𝑖=1 𝑖=1 𝑗=1 𝑗=1 𝑗=1 𝑖=1

01/12/2023 N. SOUKHER (ESTFBS) 64


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contingence
Généralisation: TABLEAU DE CONTINGENCE
Exemple: soit le tableau de contingence suivant d’un groupe de 50 personnes réparties par groupe
d’âge "𝑋" et par sexe "𝑌" , tous âgés de 45 ans au plus.

𝑌 𝐻 𝐹
𝑋
Tableau 5
[0 10 20

[ 5 a ici: 15
En reprenant la notation du18
tableau 4 on

𝑛11 = 10, 𝑛12 = 20, 𝑛21 = 5, 𝑛22 = 15

𝑛1+ = 𝑛11 + 𝑛12 = 10 + 20 = 30 𝑛2+ = 𝑛21 + 𝑛22 = 5 + 15 = 20

𝑛+1 = 𝑛11 +𝑛21 = 10 + 5 = 15 𝑛+2 = 𝑛12 + 𝑛22 = 20 + 15 = 35


𝑛++ = 𝑛11 + 𝑛12 + 𝑛21 + 𝑛22 = 10 + 20 + 5 + 15 = 50
𝑛++ = 𝑛1+ + 𝑛2+ = 30 + 20 = 50 𝑛++ = 𝑛+1 + 𝑛+2 = 15 + 35 = 50
01/12/2023 N. SOUKHER (ESTFBS) 65
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
3. Effectifs Marginaux et Fréquences marginales

Ajoutant une ligne et une colonne au tableau 5, et remplissons-les par les résultats des
sommes que nous venons juste de calculer.

𝑌 𝐻 𝐹 𝑛𝑖+
𝑋
0 − 18 10 20 30
Tableau 6
[18 5 15 20

𝑛+𝑗 15 35 50
Cette ligne et cette colonne que nous venons d’ajouter, ce sont les distributions
marginales du tableau de contingence. Ainsi, la colonne 𝑛𝑖+ représente la distribution
marginales de 𝑿, c’est-à-dire les valeurs possibles de 𝑋 quel que soit 𝑌. De même la
ligne 𝑛+𝑗 représente la distribution marginale de 𝒀, c’est-à-dire les valeurs possibles de
𝑌 quel que soit 𝑋.
01/12/2023 N. SOUKHER (ESTFBS) 66
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
3. Effectifs Marginaux et Fréquences marginales

Les fréquences marginales de 𝑿 s’obtiennent en divisant la colonne par son total soit dans
l’exemple 30 + 20 = 50. De même les fréquences marginales de 𝒀s’obtiennent en divisant la
ligne par son total soit dans l’exemple 15 + 35 = 50. Le tableau 7 donne les fréquences
marginales de 𝑋 et de 𝑌 dans le cas du tableau 6.

𝑌 𝐻 𝐹 𝑓𝑖+
𝑋
30
0 − 18 10 20 = 0,6
50
20
Tableau 7 = 0,4
18 − 45 5 15 50
𝑓+𝑗 15 35 50
= 0,3 = 0,7 = 1
50 50 50

01/12/2023 N. SOUKHER (ESTFBS) 67


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
3. Effectifs Marginaux et Fréquences marginales

Fréquences marginales de 𝑋:
𝑛𝑖+
𝑓𝑖+ = , 𝑖 = 1, … , 𝑝
𝑛++
Fréquence marginales de 𝑌:
𝑛+𝑗
𝑓+𝑗 = , 𝑗 = 1, … , 𝑞
𝑛++

Ainsi, dans l’exemple du tableau 7, on a:


𝑛1+ 30
𝑓1+ = = = 0,6
𝑛++ 50 𝑌 𝐻 𝐹 𝑓𝑖+
𝑛2+ 20 𝑋
𝑓2+ = = = 0,4
30
𝑛++ 50 0 − 18 10 20
= 0,6
𝑛+1 15 50
𝑓+1 = = = 0,3 18 − 45 5 15 20
𝑛++ 50 = 0,4
50
𝑛+2 35
𝑓+2 = = = 0,7 𝑓+𝑗 15 35 50
𝑛++ 50 = 0,3 =1
50 50 50
01/12/2023 N. SOUKHER (ESTFBS) = 0,7 68
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
4. Moyennes et Variances Marginales

A- Moyennes Marginales

Les moyennes marginales de 𝑋 et de 𝑌 se calculent à partir des distributions


marginales en utilisant les formules suivantes:
𝑝
1
𝑋ധ = ෍ 𝑛𝑖+ 𝑋𝑖
𝑛++
𝑖=1

𝑞
1
𝑌ധ = ෍ 𝑛+𝑗 𝑌𝑗
𝑛++
𝑗=1

Où le signe « ന » situé sur 𝑋 et 𝑌 permet de rappeler qu’il s’agit de moyennes de


distributions marginales.

01/12/2023 N. SOUKHER (ESTFBS) 69


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
4. Moyennes et Variances Marginales

A- Moyennes Marginales

Calculons la moyenne marginale de 𝑋:


𝑝
Exemple: Soit le tableau de 1
contingence suivant 𝑋ധ = ෍ 𝑛𝑖+ 𝑋𝑖
𝑛++
𝑖=1
1
= 8 × 2 + 16 × 8
24
Tableau 8
=6
𝑌 1 4 𝑛𝑖+ Ainsi que la moyenne marginale de 𝑌:
𝑋 1
𝑞

2 3 5 8 𝑌ധ = ෍ 𝑛+𝑗 𝑌𝑗
𝑛++
𝑗=1
1
8 4 12 16 = 7 × 1 + 17 × 4
24

𝑛+𝑗 7 17 24 = 3,125

01/12/2023 N. SOUKHER (ESTFBS) 70


Les séries statistiques à deux dimensions
I.Tableau, graphiques, vocabulaire
4. Moyennes et Variances Marginales
B- Variance marginales

Les variances marginales de 𝑋 et de 𝑌 se calculent à partir des distributions marginales


en utilisant les formules suivantes:
𝑝 𝑝
1 2 1 2
2
𝜎𝑋 = ෍ 𝑛𝑖+ 𝑋𝑖 − 𝑋ധ = ෍ 𝑛𝑖+ 𝑋𝑖2 − 𝑋ധ
𝑛++ 𝑛++
𝑖=1 𝑖=1

𝑞 𝑞
1 2 1 2
𝜎𝑌2 = ෍ 𝑛+𝑗 𝑌𝑗 − 𝑌ധ = ෍ 𝑛+𝑗 𝑌𝑗2 − 𝑌ധ
𝑛++ 𝑛++
𝑗=1 𝑗=1

01/12/2023 N. SOUKHER (ESTFBS) 71


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
4. Moyennes et Variances Marginales
B- Variance marginales

Exemple: Calculons les variances marginales de 𝑋 et de 𝑌 à partir des données du


tableau 8. Disposons les calculs sous forme de tableaux.
Tableau 9
𝑋𝑖 𝑛𝑖+ 𝑋𝑖2 𝑛𝑖+ 𝑋𝑖2 𝑌𝑗 𝑛+𝑗 𝑌𝑗2 𝑛+𝑗 𝑌𝑗2
2 8 4 32 7 7
1 1
8 16 64 1024 4 17 16 272
1056 279
𝑝 𝑞
෍ 𝑛𝑖+ 𝑋𝑖2 ෍ 𝑛+𝑗 𝑌𝑗2
𝑖=1 𝑗=1
𝑝
1 2 1
𝜎𝑋2 = ෍ 𝑛𝑖+ 𝑋𝑖2 − 𝑋ധ = 1056 − 62 = 8
𝑛++ 24
𝑖=1𝑞
1 2 1 2
𝜎𝑌2 = ෍ 𝑛+𝑗 𝑌𝑗2 − 𝑌ധ = 279 − 3,125 = 1,859375
𝑛++ 24
𝑗=1
01/12/2023 N. SOUKHER (ESTFBS) 72
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
5. Fréquences partielles

Les fréquences partielles s’obtiennent en divisant chaque 𝑛𝑖𝑗 par l’effectif total.
Exemple: Calculons les fréquences partielles sur effectif total du tableau 8

Tableau 10 On remarquera que la somme des effectifs


partielles sur effectif total est égale à 1. En
𝑌 1 4
𝑋 effet:
3 5
2 = 0,125 = 0,208
24 24 0,125 + 0,208 + 0,167 + 0,5 ≈ 1
4 12
8 24
= 0,167
24
= 0,5 Plus précisément, l’effectif partiel se définit
par la notation:
𝑛++ = 24
𝑛𝑖𝑗
𝑓𝑖𝑗 =
𝑛++
On a donc:
𝑓11 + 𝑓12 + 𝑓21 + 𝑓22 = 1

01/12/2023 N. SOUKHER (ESTFBS) 73


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

A- Covariance

Définition
Elle caractérise deux variables simultanément
𝑛
1
𝑐𝑜𝑣 𝑋, 𝑌 = ෍ 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑛
𝑖=1
𝑝 𝑞
1
𝑐𝑜𝑣 𝑋, 𝑌 = ෍ ෍ 𝑛𝑖𝑗 𝑋𝑖 − 𝑋ത 𝑌𝑗 − 𝑌ത
𝑛
𝑖=1 𝑗=1

Remarque
- La covariance peut prendre des valeurs positives, négatives ou nulles.
- Quand 𝑋𝑖 = 𝑌𝑖 , pour tout 𝑖 = 1, … , 𝑛, la covariance est égale à la variance.

01/12/2023 N. SOUKHER (ESTFBS) 74


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

A- Covariance

Théorème
La covariance peut également s’écrire:
𝑝 𝑞
1
𝐶𝑜𝑣 𝑋, 𝑌 = ෍ ෍ 𝑛𝑖𝑗 𝑋𝑖 𝑌𝑗 − 𝑋ത 𝑌ത .
𝑛
𝑖=1 𝑗=1

𝑐𝑜𝑣 𝑋, 𝑌 = 𝑋𝑌 − 𝑋ത 𝑌ത

01/12/2023 N. SOUKHER (ESTFBS) 75


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

B- Corrélation

Définition

Le degré de liaison linéaire entre 𝑋 et 𝑌 est étudié par le coefficient de corrélation


linéaire noté 𝑅.

𝑐𝑜𝑣 𝑋, 𝑌
𝑅=
𝜎𝑋 𝜎𝑌
Encore noté 𝑅𝑋𝑌 ou R 𝑋, 𝑌
Le coefficient de détermination est le carré du coefficient de corrélation:

𝑐𝑜𝑣 2 𝑋, 𝑌
𝑅2 = .
𝜎𝑋2 𝜎𝑌2

01/12/2023 N. SOUKHER (ESTFBS) 76


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

B- Corrélation
Remarques
- Le coefficient de corrélation mesure la dépendance linéaire entre deux variables:
- −1 ≤ 𝑅 ≤ 1,
- 0 ≤ 𝑅2 ≤ 1.
- Si le coefficient de corrélation est positif, les points sont alignés le long d’une droite
croissante.
- Si le coefficient de corrélation est négatif, les points sont alignés le long d’une
droite décroissante.
- Si le coefficient de corrélation est nul ou proche de zéro, il n’y a pas de
dépendance linéaire. On peut cependant avoir une dépendance non-linéaire avec
un coefficient de corrélation nul.

01/12/2023 N. SOUKHER (ESTFBS) 77


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

B- Corrélation

01/12/2023 N. SOUKHER (ESTFBS) 78


Les séries statistiques à deux dimensions
I.Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples
Cas 1: Séries quantitatives non-groupée

Exemple
Calculons la 𝑐𝑜𝑣 𝑋, 𝑌 dans le cas de la série suivante:
1; 3,5 ; 3; 3,6 ; 4,4 ; 6; 5 ; 7; 6,6 ; 8; 6,8
Pour faciliter les calculs, adoptons la disposition en tableau suivante:
𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2
1 3,5 3,5 1 12,25

3 3,6 10,8 9 12,96


4 4 16 16 16
6 5 30 36 25
7 6,6 46,2 49 43,56
8 6,8 54,4 64 46,24
Somme 29 29,5 160,9 175 156,01

01/12/2023 N. SOUKHER (ESTFBS) 79


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples

𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2 a) Les moyennes de 𝑿 et de 𝒀
1 3,5 3,5 1 12,25
𝑖=6
1 29
3 3,6 10,8 9 12,96 𝑋ത = ෍ 𝑋𝑖 = ≈ 4,83
𝑛 6
𝑖=1
4 4 16 16 16
𝑖=6
6 5 30 36 25 1 29,5
𝑌ത = ෍ 𝑌𝑖 = ≈ 4,92
𝑛 6
𝑖=1
7 6,6 46,2 49 43,56
8 6,8 54,4 64 46,24
Somme 29 29,5 160,9 175 156,01

1 175
b) Les variances 𝜎𝑋2 = ෍ 𝑋𝑖2 − 𝑋ത 2 = ≈ 5,84
𝑛 6
1 156,01
𝜎𝑌2 = ෍ 𝑌𝑖2 − 𝑌ത 2 = − 4,92 2 ≈ 1,80
𝑛 6

01/12/2023 N. SOUKHER (ESTFBS) 80


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples

𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2
1 3,5 3,5 1 12,25 c) Covariance

3 3,6 10,8 9 12,96


4 4 16 16 16 𝑐𝑜𝑣 𝑋, 𝑌

6 5 30 36 25 160,9
= − 4,83 × 4,92
7 6,6 46,2 49 43,56 6
Somme
= 3,053,
8 6,8 54,4 64 46,24
29 29,5 160,9 175 156,01

𝑐𝑜𝑣 𝑋, 𝑌 3,053
b) Coefficient de Corrélation 𝑟= = = 0,94
𝜎𝑋 𝜎𝑌 5,84 × 1,80

01/12/2023 N. SOUKHER (ESTFBS) 81


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation

C- Exemples

Cas 2: Série quantitative groupée

Exemple
On considère le tableau statistique suivant:

𝑌 0−3 3−9
𝑋
0−4 2 4

4 − 12 8 3

Pour effectuer les calculs, il est nécessaire de faire un tableau disposé comme ci-
dessous

01/12/2023 N. SOUKHER (ESTFBS) 82


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples

𝑌 0,3 3,9 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖2


𝑋
6 2 12 24
0,4 2 4
11 8 88 704
4,12 8 3
𝑛+𝑗 10 7 17 100 728

𝑌𝑗 1,5 6
a) Moyennes marginales
𝑛+𝑗 𝑌𝑗 15 42 57
100
𝑛+𝑗 𝑌𝑗2 22,5 252 274,5 𝑋ത = = 5,88
17
57
𝑌ത = = 3,35
17

b) Les variances marginales

728 274,5
𝜎𝑋2 = − 5,88 2
= 8,25 𝜎𝑌2 = − 3,35 2
= 4,92
17 17

01/12/2023 N. SOUKHER (ESTFBS) 83


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples

𝑌 0,3 3,9 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖2


𝑋
0,4 6 2 48 4 6 2 12 24
4,12 96 8 144 3 11 8 88 704
𝑛+𝑗 10 7 17 100 728
𝑌𝑗 1,5 6 c) Covariance
𝑛+𝑗 𝑌𝑗 15 42 57
𝑛+𝑗 𝑌𝑗2 22,5 252 274,5

Calculs intermédiaire:
𝑛11 𝑋1 𝑌1 = 2 × 2 × 1,5 = 6 𝑛21 𝑋2 𝑌1 = 8 × 8 × 1,5 = 96

𝑛12 𝑋1 𝑌2 = 4 × 2 × 6 = 48 𝑛22 𝑋2 𝑌2 = 3 × 8 × 6 = 144

01/12/2023 N. SOUKHER (ESTFBS) 84


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
6- Covariance et corrélation
C- Exemples

𝑌 0,3 3,9 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖2


𝑋
0,4 6 2 48 4 6 2 12 24
4,12 96 8 144 3 11 8 88 704
𝑛+𝑗 10 7 17 100 728
𝑌𝑗 1,5 6
𝑛+𝑗 𝑌𝑗 15 42 57 c) Covariance
2 𝑛+𝑗 𝑌𝑗2 22,5 252 274,5 294
6 + 96 48 + 144 294
𝐶𝑜𝑣 𝑋, 𝑌 = − 5,88 × 3,35
෍ 𝑛𝑖𝑗 𝑋𝑖 𝑌𝑗 17
= 102 = 192
𝑖=1 = −2,404

d) Coefficient de corrélation
𝑐𝑜𝑣 𝑋, 𝑌 −2,404
𝑟= = ≈ −0,38
𝜎𝑋 𝜎𝑌 8,25 × 4,93
01/12/2023 N. SOUKHER (ESTFBS) 85
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
7- Distributions Conditionnelles

Les distributions conditionnelles s’obtiennent en fixant la valeur d’une des deux


variables où la modalité d’un des deux caractères).

Exemple 𝟏: Dans le cas de chiffres du Tableau 11


tableau 8, la distribution conditionnelle
𝑌 𝟏 𝟒 𝑛𝑖+
de 𝑋 quand Y = 1 est donnée par la
𝑋
première colonne du tableau. De
même, la distribution conditionnelle de 𝟐 3 5 𝟖
𝑋 quand Y = 4 est donnée par la
𝟖 4 12 𝟏𝟔
deuxième colonne du tableau. Le
tableau 11 illustre les deux distributions 𝑛+𝑗 𝟕 𝟏𝟕 𝟐𝟒
conditionnelles de 𝑋 pour 𝑌 donné. Il y
a deux distributions conditionnelles de Distribution Distribution
𝑋 car 𝑌 ne prend ici que deux valeurs. conditionnelle de conditionnelle de
En général, sachant que 𝑗 varie de 1 à 𝑞, 𝑋 quand Y = 1 𝑋 quand Y = 4
il y a 𝑞 distributions conditionnelles de
𝑋.

01/12/2023 N. SOUKHER (ESTFBS) 86


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
7- Distributions Conditionnelles

Exemple 𝟐: Toujours en prenant les chiffres du tableau 8, la distribution conditionnelle de 𝑌


quand 𝑋 = 2 est données par la première ligne du tableau. De même, la distribution
conditionnelle de 𝑌 quand X = 8 est donnée par la deuxième ligne du tableau. Le tableau
12, illustre les deux distributions conditionnelles de 𝑌 pour 𝑋 donné. Il y a deux
distributions conditionnelles de 𝑌 car 𝑋 ne prend ici que deux valeurs. En général, sachant
que 𝑖 varie de 1 à 𝑝, il y a 𝑝 distributions conditionnelles de 𝑌.
Tableau 12
𝑌 𝟏 𝟒 𝑛𝑖+
𝑋
𝟐 3 5 𝟖

𝟖 4 12 𝟏𝟔

𝑛+𝑗 𝟕 𝟏𝟕 𝟐𝟒

Distribution conditionnelle Distribution conditionnelle de


de 𝑌 quand X = 2 𝑌 quand X = 8

01/12/2023 N. SOUKHER (ESTFBS) 87


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
8- Moyennes Conditionnelles

Pour chaque distribution conditionnelle, on peut calculer une moyenne. Ainsi, dans le
cas du tableau 8, puisqu’il y a deux distributions conditionnelles de 𝑋, il y a deux
moyennes conditionnelles que nous noterons respectivement:
𝑋ത/1 pour désigner la moyenne conditionnelle de 𝑋 quand Y = 1

𝑋ത/2 pour désigner la moyenne conditionnelle de 𝑋 quand Y = 4


De la même façon, puisqu’il y a deux distributions conditionnelles de 𝑌, il y a deux
moyennes conditionnelles de 𝑌 que nous noterons respectivement:
𝑌ത/1 pour désigner la moyenne conditionnelle de 𝑌 quand 𝑋 = 2
𝑌ത/2 pour désigner la moyenne conditionnelle de 𝑌 quand X = 8

01/12/2023 N. SOUKHER (ESTFBS) 88


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
8- Moyennes Conditionnelles

Exemple 𝟏: Calculons les deux moyennes conditionnelles de 𝑋 dans le cas des


données du tableau 8

1 𝑌 1 4 𝑛𝑖+
𝑋ത/1 = 3×2 + 4×8 = 5,4286 𝑋
7
2 3 5 8
1
𝑋ത/2 = 5 × 2 + 12 × 8 = 6,23529
17 8 4 12 16

𝑛+𝑗 7 17 24

La formule des moyennes conditionnelles de 𝑋 est donc donnée par:


𝑝
1
𝑋ത/𝑗 = ෍ 𝑛𝑖𝑗 𝑋𝑖 1≤𝑗≤𝑞
𝑛+𝑗
𝑖=1

01/12/2023 N. SOUKHER (ESTFBS) 89


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
8- Moyennes Conditionnelles

Exemple 𝟐: Calculons les deux moyennes conditionnelles de 𝑌 dans le cas des


données du tableau 8:

1 𝑌 1 4 𝑛𝑖+
𝑌ത/1 = 8
3×1 + 5×4 = 2,875
𝑋
2 3 5 8
1
𝑌ത/2 = 4 × 1 + 12 × 4 = 3,25
16 8 4 12 16

𝑛+𝑗 7 17 24

La formule des moyennes conditionnelles de 𝑌 est donc donnée par:


𝑞
1
𝑌ത/𝑖 = ෍ 𝑛𝑖𝑗 𝑌𝑗 1≤𝑖≤𝑝
𝑛𝑖+
𝑗=1

01/12/2023 N. SOUKHER (ESTFBS) 90


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
9- Variances Conditionnelles

Pour chaque distribution conditionnelle, on peut calculer une variance. Ainsi, dans
le cas du tableau 8, puisqu’il y a deux distributions conditionnelles de 𝑋, il y a deux
variances conditionnelles de 𝑋, que nous noterons respectivement:

𝜎𝑋2/1 pour désigner la variance conditionnelle de 𝑋 quand Y = 1

𝜎𝑋2/2 pour désigner la variance conditionnelle de 𝑋 quand Y = 4

De la même façon, puisqu’il y a deux distributions conditionnelles de 𝑌, il y a deux


variances conditionnelles de 𝑌 que nous noterons respectivement:

𝜎𝑌2/1 pour désigner la variance conditionnelle de 𝑌 quand X = 2

𝜎𝑌2/2 pour désigner la variance conditionnelle de 𝑌 quand X = 8

01/12/2023 N. SOUKHER (ESTFBS) 91


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
9- Variances Conditionnelles

Exemple 𝟑: Calculons les deux variances conditionnelles de 𝑋 dans le cas des


données du tableau 8:
1
𝜎𝑋2/1 = 7
3 × 22 + 4 × 82 − 5,428 2
𝑌 1 4 𝑛𝑖+
𝑋
= 8,82 2 3 5 8
1
𝜎𝑋2/2 = 5 × 22 + 12 × 82 − 6,2353 2
8 4 12 16
17
= 7,474 𝑛+𝑗 7 17 24

La formule des variances conditionnelles de 𝑋 est donc donnée par:


𝑝 𝑝
1 2 1
𝜎𝑋2/𝑗 = ෍ 𝑛𝑖𝑗 𝑋𝑖 − 𝑋ത/𝑗 = ෍ 𝑛𝑖𝑗 𝑋𝑖2 − 𝑋ത/𝑗
2
𝑛+𝑗 𝑛+𝑗
𝑖=1 𝑖=1

01/12/2023 N. SOUKHER (ESTFBS) 92


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
9- Variances Conditionnelles

Exemple 𝟒: Calculons les deux variances conditionnelles de 𝑌 dans le cas des


données du tableau 8:
1 𝑌 1 4 𝑛𝑖+
𝜎𝑌2/1 = 3 × 12 + 5 × 42 − 2,875 2
𝑋
8
= 2,1094 2 3 5 8

1 8 4 12 16
𝜎𝑌2/2 = 4 × 12 + 12 × 42 − 3,25 2
16
= 1,6875 𝑛+𝑗 7 17 24

La formule des variances conditionnelles de 𝑌 est donc donnée par:


𝑞 𝑞
1 2 1
𝜎𝑌2/𝑖 = ෍ 𝑛𝑖𝑗 𝑌𝑗 − 𝑌ത/𝑖 = ෍ 𝑛𝑖𝑗 𝑌𝑗2 − 𝑌ത/𝑖2
𝑛𝑖+ 𝑛𝑖+
𝑗=1 𝑗=1

01/12/2023 N. SOUKHER (ESTFBS) 93


Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
10. Exercice d’application

Exercice

Soit 𝑋 l’espérance de vie des hommes et 𝑌 l’espérance de vie des femmes, relevées en
2004 dans 21 pays:
Dans la suite de l’exercice on
𝑌 75,80 80,85
s’intéresse aux pays ayant une
𝑋
espérance de vie des femmes
65,70 4 0 compris entre 75 et 80 ans.
4) Dégager la distribution
70,75 0 3 conditionnelles de 𝑋 sachant
𝑌 ∈ 75,80 .
75,80 2 12 5) Calculer la moyenne
conditionnelles de 𝑋 sachant
1) Calculer la moyenne et a variance de 𝑌 ∈ 75,80 .
la variable 𝑋 6) Calculer la variance
2) Calculer la moyenne et la variance de conditionnelle de 𝑋 sachant
la variable 𝑌 𝑌 ∈ 75,80 .
3) Calculer la covariance entre 𝑋 et 𝑌

01/12/2023 N. SOUKHER (ESTFBS) 94


Outils d’analyse

01/12/2023 N. SOUKHER (ESTFBS) 95


Outils d’analyse
I- Etude de 2 variables quantitatives
𝟏. MESURE DE LA LIAISON ENTRE 𝟐 VARIABLES QUANTITATIVES

95

90
Poids
Nom Taille Poids 85

𝒙𝒊 𝒄𝒎 𝒚𝒊 𝒌𝒈 80

Pierre 175 73 75

70
Arantxa 168 56 65

… ⋯ ⋯ 60

55
Martin 185 87 Taille
50
150 160 170 180 190 200

La connaissance de la taille 𝑥 apporte une certaine information sur le poids 𝑦

Il existe une relation de dépendance entre 𝑥 et 𝑦

01/12/2023 N. SOUKHER (ESTFBS) 96


Outils d’analyse
I- Etude de 2 variables quantitatives
𝟏. MESURE DE LA LIAISON ENTRE 𝟐 VARIABLES QUANTITATIVES

𝑛
Covariance : 1
Cov 𝑥, 𝑦 = ෍ 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑛
𝑖=1
Propriétés :

cov 𝑥, 𝑦 > 0 ⟺ 𝑥 et 𝑦 varient dans le même sens

cov 𝑥, 𝑦 < 0 ⟺ 𝑥 et 𝑦 varient en sens contraire

cov 𝑥, 𝑦 = cov 𝑦, 𝑥

cov 𝑥, 𝑥 = 𝑉 𝑥

cov 𝑎𝑥 + 𝑏𝑦, 𝑧 = 𝑎𝑐ov 𝑥, 𝑧 + 𝑏𝑐𝑜𝑣 𝑦, 𝑥

01/12/2023 N. SOUKHER (ESTFBS) 97


Outils d’analyse
I- Etude de 2 variables quantitatives
𝟏. MESURE DE LA LIAISON ENTRE 𝟐 VARIABLES QUANTITATIVES

cov(x,y)
Corrélation linéaire: ρ =
σ(x) σ(y)

Propriétés :

1  ρ  1
ρ = 1 si a > 0
y=ax+b ⇔ቊ
ρ = −1 si a < 0

ρ =1⇔ Il existe une relation fonctionnelle entre 𝑥 et 𝑦

ρ=0⇔ 𝑥 et 𝑦 sont indépendantes


0< ρ <1⇔ Il existe une dépendance linéaire d’autant plus forte que |𝜌| est grand

01/12/2023 N. SOUKHER (ESTFBS) 98


Outils d’analyse
I- Etude de 2 variables quantitatives
𝟏. MESURE DE LA LIAISON ENTRE 𝟐 VARIABLES QUANTITATIVES

! Ne pas confondre causalité et corrélation

Quelle différence entre corrélation et causalité ?

 Une corrélation est un lien statistique, sans qu'on se demande quelle variable agit
sur l'autre.

 Une causalité est un lien qui affirme qu'une variable agit sur une autre.

01/12/2023 N. SOUKHER (ESTFBS) 99


Outils d’analyse
I- Etude de 2 variables quantitatives
Exemple Reprenons l’exemple du chapitre précédent

𝑌 0,3 3,9 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖2


𝑋
0,4 2 4 6 2 12 24
4,12 8 3 11 8 88 704
𝑛+𝑗 10 7 17 100 728
𝑌𝑗 1,5 6 On
𝑋ത = 100 = 5,88; 𝑌ത =
57
= 3,35;
obtient;17 17
𝑛+𝑗 𝑌𝑗 15 42 57 728 2
2 𝑉 𝑋 = − 5,88 = 8,25
2 622,5 252 274,5 17
෍𝑛𝑛+𝑗 𝑌
𝑋𝑗𝑌
𝑖𝑗 𝑖 𝑗
+ 96 48 + 144 294
= 102 = 192 274,5
𝑖=1 2
𝑉 𝑌 = − 3,35 = 4,93
17
Sachant que 𝐶𝑜𝑣 𝑋, 𝑌 = −2,403 alors, on a
𝐶𝑜𝑣 𝑋, 𝑌 −2,403
𝑎=
𝑉 𝑋
=
8,25
= −0,29 et 𝑏 = 𝑦ത − 𝑎𝑥ҧ = 3,35 − −0,29 × 5,88 = 5,0552
D’où 𝐷𝑌/𝑋 : 𝑦 = −0,29𝑥 + 5,0552
01/12/2023 N. SOUKHER (ESTFBS) 100
Outils d’analyse
I- Etude de 2 variables quantitatives
Exemple Reprenons l’exemple du chapitre précédent

𝑌 0,3 3,9 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖 𝑛𝑖+ 𝑋𝑖2


𝑋
0,4 2 4 6 2 12 24
4,12 8 3 11 8 88 704
𝑛+𝑗 10 7 17 100 728
𝑌𝑗 1,5 6 On
𝑋ത = 100 = 5,88; 𝑌ത =
57
= 3,35;
obtient;17 17
𝑛+𝑗 𝑌𝑗 15 42 57 728 2
2 𝑉 𝑋 = − 5,88 = 8,25
2 622,5 252 274,5 17
෍𝑛𝑛+𝑗 𝑌
𝑋𝑗𝑌
𝑖𝑗 𝑖 𝑗
+ 96 48 + 144 294
= 102 = 192 274,5
𝑖=1 2
𝑉 𝑌 = − 3,35 = 4,93
17
Sachant que 𝐶𝑜𝑣 𝑋, 𝑌 = −2,403 alors, on a
𝐶𝑜𝑣 𝑋, 𝑌 −2,403
𝑎′ = = = −0,49 et b′ = 𝑥ҧ − 𝑎′𝑦ത = 5,88 − −0,49 × 3,35 = 7,5215
𝑉 𝑌 4,93
D’où 𝐷𝑥/𝑦 : 𝑦 = −0,49𝑥 + 7,5215
01/12/2023 N. SOUKHER (ESTFBS) 101
Outils d’analyse
I- Etude de 2 variables quantitatives
LIENS ENTRE CORRELATION ET DROITES DE REGRESSION

𝑐𝑜𝑣 𝑥, 𝑦
𝐷𝑦/𝑥 : 𝑦 = 𝑎𝑥 + 𝑏 𝑎=
𝑉 𝑥
𝑏 = 𝑦ത − 𝑎𝑥ҧ
𝜎 𝑥 𝜎 𝑦
𝜌2 = 𝑎𝑎′ 𝜌=𝑎
𝜎 𝑦
= 𝑎′
𝜎 𝑥
𝑐𝑜𝑣 𝑥, 𝑦
𝐷𝑥/𝑦 : 𝑥 = 𝑎′ 𝑦 + 𝑏′ 𝑎′ =
𝑉 𝑦
𝑏′ = 𝑥ҧ − 𝑎′𝑦ത

1 𝑏′
⟺𝑦= 𝑥 −
𝑎′ 𝑎′

01/12/2023 N. SOUKHER (ESTFBS) 102


Outils d’analyse
I- Etude de 2 variables quantitatives
LIENS ENTRE CORRELATION ET DROITES DE REGRESSION

 x, y   x, y 
 x, y 

𝜌 2 = 𝑎𝑎′ = 0 0 < 𝜌 2 = 𝑎𝑎′ < 1 𝜌 2 = 𝑎𝑎′ = 1

Indépendance linéaire Le degré de dépendance linéaire Liaison fonctionnelle linéaire


se mesure à la proximité des
droites de régression

01/12/2023 N. SOUKHER (ESTFBS) 103


Outils d’analyse
I- Etude de 2 variables quantitatives
Exercice d’application
Le tableau suivant représente le nombre moyen des véhicules entrés par jour dans un
parking entre 1997 et 2001:
𝑿: 𝒓𝒂𝒏𝒈 𝒅𝒆 𝒍′ 𝒂𝒏𝒏é𝒆 𝒀: 𝒏𝒐𝒎𝒃𝒓𝒆 𝒎𝒐𝒚𝒆𝒏 𝒅𝒆
𝒗é𝒉𝒊𝒄𝒖𝒍𝒆𝒔 𝒆𝒏𝒕𝒓é𝒔 𝒑𝒂𝒓 𝒋𝒐𝒖𝒓
1 152
2 130
3 102
4 81
5 60
1) Représenter le nuage de points; on prendra comme origine le point 0; 50 et comme
échelle: 1 unité=2 cm pour 𝑋 et 10 unité=1cm pour 𝑌.
2) Calculer le coefficient de corrélation entre 𝑋 et 𝑌.
3) Déterminer la droite de régression de 𝑌 en 𝑋.
4) En se basant sur ce modèle déterminer le nombre des véhicules entrés par jour en
2003.

01/12/2023 N. SOUKHER (ESTFBS) 104


Outils d’analyse
I- Etude de 2 variables quantitatives

Exercice d’application

1) Représenter le nuage de points; on prendra comme origine le point 𝟎; 𝟓𝟎 et comme échelle: 𝟏 unité=𝟐 cm
pour 𝑿 et 𝟏𝟎 unité=𝟏cm pour 𝒀.

160
150
140
130
120
110
100
90
80
70
60
50
0 1 2 3 4 5 6

01/12/2023 N. SOUKHER (ESTFBS) 105


Outils d’analyse
I- Etude de 2 variables quantitatives
Exercice d’application
2) Calculer le coefficient de corrélation entre 𝑿 et 𝒀.

𝑿 𝒀 𝑿𝟐 𝒀𝟐 𝑿×𝒀

1 152 23104 152


1
2 130 16900 260
4
3 102 10404 306
9
4 81 6561 324
16
5 60 3600 300
25
Somme 15 525 55
60569 1342

01/12/2023 N. SOUKHER (ESTFBS) 106


Outils d’analyse
I- Etude de 2 variables quantitatives
Exercice d’application

La moyenne marginale de 𝑋 et de 𝑌 sont donnée par : 𝑋ത = 3 et 𝑌ത = 105

Les variances marginales de 𝑋 et de 𝑌 sont donnée par: 𝑉 𝑋 = 2 et 𝑉 𝑌 = 1088,8

La covariance entre 𝑋 et 𝑌 est donnée par: 𝑐𝑜𝑣 𝑋, 𝑌 = −46,6


𝑐𝑜𝑣 𝑋, 𝑌
Le coefficient de corrélation linéaire: 𝑅 𝑋, 𝑌 = = −0,99861219
𝑉 𝑋 𝑉 𝑌

Donc 𝑅 est proche de 1, ainsi un ajustement linéaire est très bon pour cette
distribution

01/12/2023 N. SOUKHER (ESTFBS) 107


Outils d’analyse
I- Etude de 2 variables quantitatives

Exercice d’application

3) Déterminer la droite de régression de 𝒀 en 𝑿.

Il s’agit de déterminer la droite


𝐷𝑌/𝑋 : 𝑦 = 𝑎𝑥 + 𝑏
𝑐𝑜𝑣 𝑥,𝑦
Où 𝑎 = et 𝑏 = 𝑦ത − 𝑎𝑥.ҧ
𝑉 𝑥
D’après la question précédente on a
𝑐𝑜𝑣 𝑋, 𝑌 = −46,6; 𝑉 𝑋 = 2; 𝑋ത = 3 et 𝑌ത = 105

Alors

−46,6
𝑎= = −23,3
2
et
𝑏 = 105 − −23,3 × 3 = 174,9

Donc
𝐷𝑌/𝑋 : 𝑦 = −23,3𝑥 + 174,9

01/12/2023 N. SOUKHER (ESTFBS) 108


Outils d’analyse
I- Etude de 2 variables quantitatives

Exercice d’application

4) En se basant sur ce modèle déterminer le nombre des véhicules entrés par jour en 𝟐𝟎𝟎𝟑.

Le rang de l’année 2003 est donnée par 𝑋 = 7, alors en reportant dans l’équation de la droite de
régression
𝐷𝑌/𝑋 : 𝑦 = −23,3𝑥 + 174,9
On trouve
𝑦 = −23,3 × 7 + 174,9 = 11,8 ≈ 12

01/12/2023 N. SOUKHER (ESTFBS) 109

Vous aimerez peut-être aussi