Académique Documents
Professionnel Documents
Culture Documents
Naima SOUKHER
Plan
1 Chapitre introductif
4 -Outils d’analyse
Définition
Remarque
Ne pas confondre « La statistique » et « les statistiques »
La statistique: Cf. définition.
Les statistiques: données chiffrées ou les résultat numériques
de la statistique.
Exemple
... etc
Dans chaque exemple cité, c’est un caractère différent qui est étudié: âge, revenus,
loisirs.
Un caractère peut varier d’un individu à l’autre. On dit que ce caractère présente
différentes modalités.
Variable
Définition
L’effectif total est le nombre d’individus appartenant à la population statistique
étudiée. L’effectif total sera noté 𝑁.
Exemple
Considérons un groupe comprenant trente étudiants et observons l’âge des
étudiants dans cette population.
L’effectif total de la population statistique étudiée est trente (𝑁 = 30).
Exemple
Considérons de nouveau le groupe de trente étudiants et construisons un tableau
pour regrouper les différentes informations que l’on a sur leur âge.
La première information que l’on va noter dans ce tableau est l’effectif de chaque
âge observé.
Âge Effectif 𝒏𝒊
18 2
19 4
20 10
21 11
22 3
Total 30
𝑛1 + 𝑛2 + ⋯ + 𝑛𝑘 = 𝑛𝑖
𝑖=1
Cette notation se lit somme des 𝑛𝑖 pour 𝑖 variant de 1 à 𝑘.
Définition
80
60
60
40 40
40
Noir
54% 20
0
Bleu Noir Noisette Vert
35 32
30
25
25 23
20
15
10
10
0
A B C D E
Diagramme en bâtons
140
120
100
80
60
40
20
0
0 1 2 3 4 5 6
Quantitative discrète
Quantitative discrète
Quantitative continue
Remarque1: Une variable continue ne prend pas des valeurs isolées, mais des valeurs
appartenant à des intervalles. C'est pourquoi, au lieu de définir des effectifs par valeurs,
on définira des effectifs par intervalles, appelés classes.
Remarque2 : Une variable discrète comportant trop de valeurs est aussi traitée comme
une variable continue.
Quantitative continue
effectif
900
800
Classes Effectifs
700
[0 – 3[ 830
600
[3 – 5[ 615 500
[5 – 10[ 510 400
[10 – 20 [ 92 300
[20 – 30[ 63 200
[30 – 50[ 15 100
0
0
3
30
50
01/12/2023 N. SOUKHER (EST) 31
Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue
350
Effectif rectifié
Classes Effectifs Amplitude Effectifs 300
ni ai rectifiés 250
ni /ai HISTOGRAMME
[0 – 3[ 830 3 276,7 200
30
50
01/12/2023 N. SOUKHER (EST) 32
Statistiques Descriptive Univariée
I- Tableaux et Graphiques
Quantitative continue
0
3
30
50
La surface = ai ×(ni/ai) est de 830 unités
Dans un histogramme, ce sont les surfaces des rectangles (ce que l’œil voit), qui sont
proportionnelles aux effectifs, et non les hauteurs de ces rectangles
RESUME
VARIABLE QUALITATIVE VARIABLE QUANTITATIVE
Nominale Ordinale Discrète Continue
Modalités dans
l ’ordre
Diagramme circulaire
PARAMETRES STATISTIQUES
Un paramètre statistique permet de résumer par une seule quantité numérique une
information contenue dans une distribution d’observations.
100 % - A % 2000
2000 2000
Dispersion
Tendance centrale 1500
1500 1500
Position
1000 1000
A% 1000
0 0 0
0 N° individu 0 N° individu 0 N° individu
1. Tendance centrale
LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 ou plus...
1. Tendance centrale
LE MODE
Une distribution est unimodale si elle présente un maximum marqué, et pas d'autres
maxima relatifs.
La lecture s’effectue sur le diagramme en bâtons ou l'histogramme.
100
140 90
80
120
70
100
60
80 50
60 40
30
40
20
20
10
0 0
0 1 2 3 4 5 6 900 1400 1900 2400 2900 3500 ou plus...
1. Tendance centrale
Calcule du mode M0
1. Tendance centrale
La Médiane
La médiane𝑀 est la valeur du milieu de la série d’observations, c.à.d. telle qu'il y ait
autant d'observations "au-dessous" que "au-dessus".
3 4 4 5 6 8 8 9 10 3 4 4 5 6 8 8 9
1. Tendance centrale
La Moyenne Arithmétique
La moyenne arithmétique est notée x
1 n
Série brute x1, x2, … , xn x = xi
n i=1
1. Tendance centrale
La Moyenne Arithmétique
1 k k
x = n i x i fi x i
n i=1 i=1
1. Tendance centrale
La Moyenne Arithmétique
Comment faire la moyenne de plusieurs populations ?
Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Population P = P1 P2
Effectif n = n1+ n2
Moyenne x?
k
nixi
x= 1 1 2 2
nx +n x Moyenne globale = moyenne des moyennes
n i=1 n
1. Tendance centrale
Moyennes Géométrique et Harmonique
Moyenne géométrique
n1 n 2 nk
G = n x x .....x
1 2 k
Utilisée dans le cas de phénomènes multiplicatifs (taux de croissance moyen)
Moyenne harmonique
n
H= k
ni
x
Utilisée dans le cas où l’on combine 2 variables
sous forme de rapport (pièces/heure,
km/litre,…)
i=1 i
01/12/2023 N. SOUKHER (EST) 46
Statistiques Descriptive Univariée
II-Paramètres statistiques
2. Position
Les Fractiles ou Quantiles
On appelle fractiles ou quantiles d'ordre k les (k-1) valeurs qui divisent les
observations en k parties d'effectifs égaux.
99 centiles C1, C2, …, C99 qui divisent les observations en 100 parties égales
3. Dispersion
Paramètres de Dispersion
Etendue : R = xmax - xmin
Intervalle interquartile : IQ = Q3 - Q1
1 n 1 k k
V = xi - x V = n i x i - x fi x i - x
2 2 2
1 k
V = n i x i2 x 2 = Moyenne des carrés - Carré de la moyenne
n i=1
Ecart-type : σ= V
3. Dispersion
Paramètres de Dispersion
Comment faire la variance de plusieurs populations ?
Population P1 Population P2
Effectif n1 Effectif n2
Moyenne x1 Moyenne x 2
Variance V1 Variance V2
Population P = P1 P2
Effectif n = n1+ n2
Moyenne x
Variance V ?
3. Dispersion
Paramètres de Dispersion
1 k 1 k
V = n i Vi + n i x i -x
2
n i=1 n i=1
Variance globale = Moyenne des variances + Variance des moyennes
3. Dispersion
Propriétés Importantes de la Moyenne et de la Variance
Comment se comportent la moyenne et la variance
lorsqu’on fait subir un changement de variable aux observations?
xi yi = a xi + b
xi
zi = xi + yi
yi
z= x+ y V(z) V(x)+ V(y)
Salaire
Effectif
annuel
𝑛𝑖
(𝐾€) 1) Donner la variable étudiée et sa nature.
10; 20 20 2) Déterminez:
a) Le salaire moyen
20; 30 60 b)Le mode
30; 40 35 c)Le premier quartile
40; 50 15 d)La médiane
e)Le troisième quartile
50; 60 40 f) La variance
60; 70 18
70; 80 12
TOTAL 200
Tableau 1
140; 38,2 ; 161; 44,3 ; 155; 46,1 ; 148; 38,2 ; 155; 50,5 ; 123; 22,4 ; 140 34,7
160; 40,4 ; 140; 34,7 ; 165; 50,5 ; 172; 50,5 ; 155; 38,1 ; 160; 57,3 ;
165 50; 5
142; 39,3 ; 157; 46,1 ; 142; 37,1 ; 148; 45,9 ; 180; 66,3 ; 167; 60 ;
165; 50,5 172 50,5
155 38,1
La présentation des données dans un tableau à deux 160 57,3
dimensions est données ci-contre, avec la 142 39,3
représentation graphique la plus courante qui est
celle dite du « nuage de points ». 157 46,1
142 37,1
148 45,9
01/12/2023 N. SOUKHER (ESTFBS) 54
180 66,3
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
1/ Tableaux et graphiques
A- Séries quantitatives connues individuellement
70
65
Figure 60
55
1 50
45
40
35
30
25
20
120 130 140 150 160 170 180 190
65
60
55
Figure 50
2 45
40
35
30
25
20
120 130 140 150 160 170 180 190
Exemple
Les données de l’exemple 1 concernant la taille et le poids de 19 adolescents ont
été regroupées par classe dans le tableau de contingence ci-dessous.
Tableau 2
20, 40 40, 60 60; 80
Poids
Taille
120; 140 1 0 0
140; 160 6 4 0
160; 180 0 6 2
Exemple:
6
6
6
5 4
La figure 3 illustre la représentation 4
Effectifs
classique sous forme d’un histogramme à 2
3
trois dimensions: le poids, la taille et les 2
effectifs. Les effectifs non nuls ont été 0
[160;180]
1 0
reportés directement sur les barres. [140;160[
[120;140[
0
[20;40[ [40;60[ [60;80]
Taille
Figure 3
C- Séries qualitatives
Exemple: supposons que l’on ait les données suivantes sur le sexe et le statut d’activité de
20 personnes. Les données sont présentées par paire. La première information concerne
le sexe avec les deux modalités 𝑀 et 𝐹. La seconde information concerne le statut
d’activité, avec trois modalités (actif occupé [𝐴𝑂], chômeur[𝐶], inactif[𝐼]).
𝐹; 𝐴𝑂 ; 𝑀; 𝐼 ; 𝐹; 𝐶 ; 𝐹; 𝐶 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐶 ; 𝐹; 𝐼 ; 𝐹; 𝐼 ; 𝐹; 𝐼 ;
𝑀; 𝐶 ; 𝐹; 𝐴𝑂 ; 𝐹; 𝐴𝑂 ; 𝐹; 𝐴𝑂 ; 𝑀; 𝐴𝑂 ; 𝑀; 𝐶 ; 𝑀; 𝐴𝑂 ; 𝐹; 𝐼 ; 𝐹; 𝐶 ; 𝑀; 𝐴𝑂
Tableau Figure 4
3
Actifs Chôme Inactifs
Statut occupés urs 5
4
EFFECTIFS
Sexe 3
Mascul 5 3 1 2
in 1 Féminin
Masculin
0
Fémini 4 3 4 Actifs chômeurs Inactifs
n occupés
Y 𝑌1 𝑌2 … 𝑌𝑗 … 𝑌𝑞 𝑛𝑖+
X
Effectifs marginaux de
𝑋1 𝑛1+
Valeurs ou modalités de
𝑋2 𝑛22 𝑛2𝑞
𝑛2+
… …
𝑋𝑖 𝑛𝑖𝑗
𝑛𝑖+
… …
𝑋𝑝 𝑛𝑝𝑞 𝑛𝑝+
𝑛+𝑗 𝑛+1 𝑛+2 … 𝑛+𝑗 … 𝑛+𝑞 𝑛++
Effectifs marginaux de 𝑌
01/12/2023 N. SOUKHER (ESTFBS) 61
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
2. Représentation abstraite d’un tableau de contingence
Généralisation: TABLEAU DE CONTINGENCE
Dés lors:
𝑞
𝑌 𝐻 𝐹
𝑋
Tableau 5
[0 10 20
[ 5 a ici: 15
En reprenant la notation du18
tableau 4 on
Ajoutant une ligne et une colonne au tableau 5, et remplissons-les par les résultats des
sommes que nous venons juste de calculer.
𝑌 𝐻 𝐹 𝑛𝑖+
𝑋
0 − 18 10 20 30
Tableau 6
[18 5 15 20
𝑛+𝑗 15 35 50
Cette ligne et cette colonne que nous venons d’ajouter, ce sont les distributions
marginales du tableau de contingence. Ainsi, la colonne 𝑛𝑖+ représente la distribution
marginales de 𝑿, c’est-à-dire les valeurs possibles de 𝑋 quel que soit 𝑌. De même la
ligne 𝑛+𝑗 représente la distribution marginale de 𝒀, c’est-à-dire les valeurs possibles de
𝑌 quel que soit 𝑋.
01/12/2023 N. SOUKHER (ESTFBS) 66
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
3. Effectifs Marginaux et Fréquences marginales
Les fréquences marginales de 𝑿 s’obtiennent en divisant la colonne par son total soit dans
l’exemple 30 + 20 = 50. De même les fréquences marginales de 𝒀s’obtiennent en divisant la
ligne par son total soit dans l’exemple 15 + 35 = 50. Le tableau 7 donne les fréquences
marginales de 𝑋 et de 𝑌 dans le cas du tableau 6.
𝑌 𝐻 𝐹 𝑓𝑖+
𝑋
30
0 − 18 10 20 = 0,6
50
20
Tableau 7 = 0,4
18 − 45 5 15 50
𝑓+𝑗 15 35 50
= 0,3 = 0,7 = 1
50 50 50
Fréquences marginales de 𝑋:
𝑛𝑖+
𝑓𝑖+ = , 𝑖 = 1, … , 𝑝
𝑛++
Fréquence marginales de 𝑌:
𝑛+𝑗
𝑓+𝑗 = , 𝑗 = 1, … , 𝑞
𝑛++
A- Moyennes Marginales
𝑞
1
𝑌ധ = 𝑛+𝑗 𝑌𝑗
𝑛++
𝑗=1
A- Moyennes Marginales
2 3 5 8 𝑌ധ = 𝑛+𝑗 𝑌𝑗
𝑛++
𝑗=1
1
8 4 12 16 = 7 × 1 + 17 × 4
24
𝑛+𝑗 7 17 24 = 3,125
𝑞 𝑞
1 2 1 2
𝜎𝑌2 = 𝑛+𝑗 𝑌𝑗 − 𝑌ധ = 𝑛+𝑗 𝑌𝑗2 − 𝑌ധ
𝑛++ 𝑛++
𝑗=1 𝑗=1
Les fréquences partielles s’obtiennent en divisant chaque 𝑛𝑖𝑗 par l’effectif total.
Exemple: Calculons les fréquences partielles sur effectif total du tableau 8
A- Covariance
Définition
Elle caractérise deux variables simultanément
𝑛
1
𝑐𝑜𝑣 𝑋, 𝑌 = 𝑋𝑖 − 𝑋ത 𝑌𝑖 − 𝑌ത
𝑛
𝑖=1
𝑝 𝑞
1
𝑐𝑜𝑣 𝑋, 𝑌 = 𝑛𝑖𝑗 𝑋𝑖 − 𝑋ത 𝑌𝑗 − 𝑌ത
𝑛
𝑖=1 𝑗=1
Remarque
- La covariance peut prendre des valeurs positives, négatives ou nulles.
- Quand 𝑋𝑖 = 𝑌𝑖 , pour tout 𝑖 = 1, … , 𝑛, la covariance est égale à la variance.
A- Covariance
Théorème
La covariance peut également s’écrire:
𝑝 𝑞
1
𝐶𝑜𝑣 𝑋, 𝑌 = 𝑛𝑖𝑗 𝑋𝑖 𝑌𝑗 − 𝑋ത 𝑌ത .
𝑛
𝑖=1 𝑗=1
𝑐𝑜𝑣 𝑋, 𝑌 = 𝑋𝑌 − 𝑋ത 𝑌ത
B- Corrélation
Définition
𝑐𝑜𝑣 𝑋, 𝑌
𝑅=
𝜎𝑋 𝜎𝑌
Encore noté 𝑅𝑋𝑌 ou R 𝑋, 𝑌
Le coefficient de détermination est le carré du coefficient de corrélation:
𝑐𝑜𝑣 2 𝑋, 𝑌
𝑅2 = .
𝜎𝑋2 𝜎𝑌2
B- Corrélation
Remarques
- Le coefficient de corrélation mesure la dépendance linéaire entre deux variables:
- −1 ≤ 𝑅 ≤ 1,
- 0 ≤ 𝑅2 ≤ 1.
- Si le coefficient de corrélation est positif, les points sont alignés le long d’une droite
croissante.
- Si le coefficient de corrélation est négatif, les points sont alignés le long d’une
droite décroissante.
- Si le coefficient de corrélation est nul ou proche de zéro, il n’y a pas de
dépendance linéaire. On peut cependant avoir une dépendance non-linéaire avec
un coefficient de corrélation nul.
B- Corrélation
Exemple
Calculons la 𝑐𝑜𝑣 𝑋, 𝑌 dans le cas de la série suivante:
1; 3,5 ; 3; 3,6 ; 4,4 ; 6; 5 ; 7; 6,6 ; 8; 6,8
Pour faciliter les calculs, adoptons la disposition en tableau suivante:
𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2
1 3,5 3,5 1 12,25
𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2 a) Les moyennes de 𝑿 et de 𝒀
1 3,5 3,5 1 12,25
𝑖=6
1 29
3 3,6 10,8 9 12,96 𝑋ത = 𝑋𝑖 = ≈ 4,83
𝑛 6
𝑖=1
4 4 16 16 16
𝑖=6
6 5 30 36 25 1 29,5
𝑌ത = 𝑌𝑖 = ≈ 4,92
𝑛 6
𝑖=1
7 6,6 46,2 49 43,56
8 6,8 54,4 64 46,24
Somme 29 29,5 160,9 175 156,01
1 175
b) Les variances 𝜎𝑋2 = 𝑋𝑖2 − 𝑋ത 2 = ≈ 5,84
𝑛 6
1 156,01
𝜎𝑌2 = 𝑌𝑖2 − 𝑌ത 2 = − 4,92 2 ≈ 1,80
𝑛 6
𝑋 𝑌 𝑋𝑌 𝑋2 𝑌2
1 3,5 3,5 1 12,25 c) Covariance
6 5 30 36 25 160,9
= − 4,83 × 4,92
7 6,6 46,2 49 43,56 6
Somme
= 3,053,
8 6,8 54,4 64 46,24
29 29,5 160,9 175 156,01
𝑐𝑜𝑣 𝑋, 𝑌 3,053
b) Coefficient de Corrélation 𝑟= = = 0,94
𝜎𝑋 𝜎𝑌 5,84 × 1,80
C- Exemples
Exemple
On considère le tableau statistique suivant:
𝑌 0−3 3−9
𝑋
0−4 2 4
4 − 12 8 3
Pour effectuer les calculs, il est nécessaire de faire un tableau disposé comme ci-
dessous
𝑌𝑗 1,5 6
a) Moyennes marginales
𝑛+𝑗 𝑌𝑗 15 42 57
100
𝑛+𝑗 𝑌𝑗2 22,5 252 274,5 𝑋ത = = 5,88
17
57
𝑌ത = = 3,35
17
728 274,5
𝜎𝑋2 = − 5,88 2
= 8,25 𝜎𝑌2 = − 3,35 2
= 4,92
17 17
Calculs intermédiaire:
𝑛11 𝑋1 𝑌1 = 2 × 2 × 1,5 = 6 𝑛21 𝑋2 𝑌1 = 8 × 8 × 1,5 = 96
d) Coefficient de corrélation
𝑐𝑜𝑣 𝑋, 𝑌 −2,404
𝑟= = ≈ −0,38
𝜎𝑋 𝜎𝑌 8,25 × 4,93
01/12/2023 N. SOUKHER (ESTFBS) 85
Les séries statistiques à deux dimensions
I. Tableau, graphiques, vocabulaire
7- Distributions Conditionnelles
𝟖 4 12 𝟏𝟔
𝑛+𝑗 𝟕 𝟏𝟕 𝟐𝟒
Pour chaque distribution conditionnelle, on peut calculer une moyenne. Ainsi, dans le
cas du tableau 8, puisqu’il y a deux distributions conditionnelles de 𝑋, il y a deux
moyennes conditionnelles que nous noterons respectivement:
𝑋ത/1 pour désigner la moyenne conditionnelle de 𝑋 quand Y = 1
1 𝑌 1 4 𝑛𝑖+
𝑋ത/1 = 3×2 + 4×8 = 5,4286 𝑋
7
2 3 5 8
1
𝑋ത/2 = 5 × 2 + 12 × 8 = 6,23529
17 8 4 12 16
𝑛+𝑗 7 17 24
1 𝑌 1 4 𝑛𝑖+
𝑌ത/1 = 8
3×1 + 5×4 = 2,875
𝑋
2 3 5 8
1
𝑌ത/2 = 4 × 1 + 12 × 4 = 3,25
16 8 4 12 16
𝑛+𝑗 7 17 24
Pour chaque distribution conditionnelle, on peut calculer une variance. Ainsi, dans
le cas du tableau 8, puisqu’il y a deux distributions conditionnelles de 𝑋, il y a deux
variances conditionnelles de 𝑋, que nous noterons respectivement:
1 8 4 12 16
𝜎𝑌2/2 = 4 × 12 + 12 × 42 − 3,25 2
16
= 1,6875 𝑛+𝑗 7 17 24
Exercice
Soit 𝑋 l’espérance de vie des hommes et 𝑌 l’espérance de vie des femmes, relevées en
2004 dans 21 pays:
Dans la suite de l’exercice on
𝑌 75,80 80,85
s’intéresse aux pays ayant une
𝑋
espérance de vie des femmes
65,70 4 0 compris entre 75 et 80 ans.
4) Dégager la distribution
70,75 0 3 conditionnelles de 𝑋 sachant
𝑌 ∈ 75,80 .
75,80 2 12 5) Calculer la moyenne
conditionnelles de 𝑋 sachant
1) Calculer la moyenne et a variance de 𝑌 ∈ 75,80 .
la variable 𝑋 6) Calculer la variance
2) Calculer la moyenne et la variance de conditionnelle de 𝑋 sachant
la variable 𝑌 𝑌 ∈ 75,80 .
3) Calculer la covariance entre 𝑋 et 𝑌
95
90
Poids
Nom Taille Poids 85
𝒙𝒊 𝒄𝒎 𝒚𝒊 𝒌𝒈 80
Pierre 175 73 75
70
Arantxa 168 56 65
… ⋯ ⋯ 60
55
Martin 185 87 Taille
50
150 160 170 180 190 200
𝑛
Covariance : 1
Cov 𝑥, 𝑦 = 𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
𝑛
𝑖=1
Propriétés :
cov 𝑥, 𝑦 = cov 𝑦, 𝑥
cov 𝑥, 𝑥 = 𝑉 𝑥
cov(x,y)
Corrélation linéaire: ρ =
σ(x) σ(y)
Propriétés :
1 ρ 1
ρ = 1 si a > 0
y=ax+b ⇔ቊ
ρ = −1 si a < 0
Une corrélation est un lien statistique, sans qu'on se demande quelle variable agit
sur l'autre.
Une causalité est un lien qui affirme qu'une variable agit sur une autre.
𝑐𝑜𝑣 𝑥, 𝑦
𝐷𝑦/𝑥 : 𝑦 = 𝑎𝑥 + 𝑏 𝑎=
𝑉 𝑥
𝑏 = 𝑦ത − 𝑎𝑥ҧ
𝜎 𝑥 𝜎 𝑦
𝜌2 = 𝑎𝑎′ 𝜌=𝑎
𝜎 𝑦
= 𝑎′
𝜎 𝑥
𝑐𝑜𝑣 𝑥, 𝑦
𝐷𝑥/𝑦 : 𝑥 = 𝑎′ 𝑦 + 𝑏′ 𝑎′ =
𝑉 𝑦
𝑏′ = 𝑥ҧ − 𝑎′𝑦ത
1 𝑏′
⟺𝑦= 𝑥 −
𝑎′ 𝑎′
x, y x, y
x, y
Exercice d’application
1) Représenter le nuage de points; on prendra comme origine le point 𝟎; 𝟓𝟎 et comme échelle: 𝟏 unité=𝟐 cm
pour 𝑿 et 𝟏𝟎 unité=𝟏cm pour 𝒀.
160
150
140
130
120
110
100
90
80
70
60
50
0 1 2 3 4 5 6
𝑿 𝒀 𝑿𝟐 𝒀𝟐 𝑿×𝒀
Donc 𝑅 est proche de 1, ainsi un ajustement linéaire est très bon pour cette
distribution
Exercice d’application
Alors
−46,6
𝑎= = −23,3
2
et
𝑏 = 105 − −23,3 × 3 = 174,9
Donc
𝐷𝑌/𝑋 : 𝑦 = −23,3𝑥 + 174,9
Exercice d’application
4) En se basant sur ce modèle déterminer le nombre des véhicules entrés par jour en 𝟐𝟎𝟎𝟑.
Le rang de l’année 2003 est donnée par 𝑋 = 7, alors en reportant dans l’équation de la droite de
régression
𝐷𝑌/𝑋 : 𝑦 = −23,3𝑥 + 174,9
On trouve
𝑦 = −23,3 × 7 + 174,9 = 11,8 ≈ 12