Vous êtes sur la page 1sur 24

Département des sciences économiques et de gestion

Filière : Sciences économiques et de gestion

Semestre 1
Module 05:
Statistique descriptive
Présentation du Cours
SEG S1 Groupe: 3

1
Année universitaire 2016 - 2017
Chapitre 3:

Distribution statistique à deux variables

2
Plan

Section 1: Les tableaux de contingence

Section 2 : Les distributions marginales

Section 3 : Les distributions conditionnelles


Section 4: Relation entre les caractéristiques marginales et
conditionnelles
Section 5: Régression linéaire et corrélation

3
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
La notion du tableau de contingence Numéro Taille i Poids j
1 158 55
Définition 2 177 80
3 181 72
• C’est une distribution ou l’observation s’effectue selon 2 4 190 77
caractères. 5 163 53
6 158 58
7 165 74
8 164 64
Exemple illustratif (la taille et le poids des étudiants) 9 166 72
10 169 74
• Soient les caractère statistiques : «la taille des étudiants» et «le 11 173 64
poids des étudiants» 12 175 72
13 174 74
• Le tableau de contingence croise les modalités de deux 14 180 64
variables et relatives à une même population. 15 164 55
• Les modalités d’une variable sont présentées en ligne () et les 16 166 65
modalités de l’autre variable () sont présentées en colonne 17 172 61
18 163 50
19 188 73
20 150 48 4
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
La notion du tableau de contingence Numéro Taille i Poids j
1 158 55
Exemple illustratif (la taille et le poids des étudiants) 2 177 80
En effectifs 3 181 72
4 190 77
le poids des étudiants
5 163 53
𝑗=1 𝑗=2 𝑗=3
6 158 58
la taille des étudiants

Modalités de
[45, 55[ [55, 65[ [65, 80[ Total
7 165 74
𝑖=3 𝑖=1

Modalités de
[150, 160[ 1 2 0 3 8 164 64
𝑖=4 𝑖=2

[160, 170[ 2 3 3 8 9 166 72


[170, 180[ 0 2 3 5 10 169 74
[180, 190] 0 1 3 4 11 173 64
Total 3 8 9 20 12 175 72
13 174 74
Ce sont des effectifs absolus notés 14 180 64
15 164 55
Lecture 16 166 65
𝑛11=1 𝑛12=2 𝑛13 =0 17 172 61
18 163 50
𝑛21 =2 𝑛22 =3 𝑛33 =3 𝑛..=20 19 188 73
𝑛43 =3 𝑛42 =1 𝑛23 =3 20 150 48 5
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
La notion du tableau de contingence Numéro Taille i Poids j
1 158 55
Exemple illustratif (la taille et le poids des étudiants) 2 177 80
En fréquences 3 181 72
4 190 77
le poids des étudiants
5 163 53
𝑗=1 𝑗=2 𝑗=3
6 158 58
la taille des étudiants

Modalités de
[45, 55[ [55, 65[ [65, 80[ Total
7 165 74
𝑖=3 𝑖=1

Modalités de
[150, 160[ 0,05 0,1 0 0,15 8 164 64
𝑖=4 𝑖=2

[160, 170[ 0,1 0,15 0,15 0,4 9 166 72


[170, 180[ 0 0,1 0,15 0,25 10 169 74
[180, 190] 0 0,05 0,15 0,2 11 173 64
Total 0,15 0,4 0,45 1 12 175 72
13 174 74
Ce sont des effectifs relatifs notés 14 180 64
15 164 55
Lecture 16 166 65
𝑓 11=0,05 𝑓 12=0,1 𝑓 13=0 17 172 61
18 163 50
𝑓 21=0,1 𝑓 22=0,15 𝑓 33=0,15 19 188 73
𝑓 43=0,15 𝑓 42=0,05 𝑓 23=0,15 20 150 48 6
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales

Définition
 Ce sont les distributions relatives à la seule variable ou
Exemple illustratif (la taille et le poids des étudiants)

Distribution marginale des


 Il y a deux distributions marginales
Xi Yj [45, 55[ [55, 65[ [65, 80[ Total
[150, 160[ 1 2 0 𝒏𝟏 .=¿ 3
[160, 170[ 2 3 3 𝒏𝟐 .=¿ 8
[170, 180[ 0 2 3 𝒏𝟑 .=¿ 5
[180, 190] 0 1 3 𝒏𝟒. =¿ 4
Total 𝒏.𝟏=¿ 3 𝒏.𝟐=¿ 8 𝒏.𝟑=¿ 9 20
Distribution marginale des
Catégories du poids des étudiants Catégories de la taille des étudiants
Effectifs Fréquences
Effectifs Fréquences Lecture
3 3/20 3 3/20
8 8/20 𝑓 .1 =3/20 𝑓 1. =3/20 8 8/20
9 9/20 𝑓 .2 =8 /20 𝑓 2. =8 /20 5
4
5/20
4/20
20 1
𝑓 .3 =9 /20 𝑓 3. =5/20 𝑓 4 .=4 /20 20 1 7
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Les paramètres des distributions marginales

On peut calculer les moyennes de ces distributions marginales


Moyenne marginale du poids Moyenne marginale de la taille
Catégories du poids des étudiants Catégories de la taille des étudiants
Modalités Yj Effectifs Fréquences Modalités Xi Effectifs Fréquences
[45, 55[ 3 3/20 [150, 160[ 3 3/20
[55, 65[ 8 8/20 [160, 170[ 8 8/20
[65, 80[ 9 9/20 [170, 180[ 5 5/20
20 1 [180, 190] 4 4/20
20 1

Les formules sont :


𝑘
𝑝

∑ 𝑛. 𝑗 𝑦 𝑗 𝑘
∑ 𝑛𝑖 . 𝑥 𝑖 𝑘

𝑦= 𝑗=1
=∑ 𝑓 𝑦 𝑥= 𝑖 =1
=∑ 𝑓 𝑖 . 𝑥𝑖
𝑛.. . 𝑗 𝑗 𝑛.. 𝑖 =1
𝑖=1

8
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Les paramètres des distributions marginales

On peut calculer les variances de ces distributions marginales


Variance marginale du poids Variance marginale de la taille
Catégories du poids des étudiants Catégories de la taille des étudiants
Modalités Yj Effectifs Fréquences Modalités Xi Effectifs Fréquences
[45, 55[ 3 3/20 [150, 160[ 3 3/20
[55, 65[ 8 8/20 [160, 170[ 8 8/20
[65, 80[ 9 9/20 [170, 180[ 5 5/20
20 1 [180, 190] 4 4/20
20 1

Les formules sont:

∑ 𝑛𝑖 . 𝑥𝑖 ²
𝑖= 1
𝑣 𝑎𝑟 ( 𝑥 ) = −𝑥²
𝑛..

9
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Les distributions conditionnelles
Définition
 On appelle distribution Conditionnelle la distribution ou l’on a posé une condition.
Exemple illustratif (la taille et le poids des étudiants)
 Il y a distributions conditionnelles
 Distribution par catégories de taille dont le poids est dans l’intervalle [55,65]
En Effectifs Xi Yj [45, 55[ [55, 65[ [65, 80[ Total
[150, 160[ 1 𝒏𝟏 𝟐=¿2 0 𝒏𝟏 .=¿ 3
[160, 170[ 2 𝒏𝟐𝟐 =¿3 3 𝒏𝟐 . =¿ 8
[170, 180[ 0 𝒏𝟑𝟐 =¿2 3 𝒏𝟑 . =¿ 5
Catégories de la taille des étudiants [180, 190] 0 𝒏𝟒𝟐 =¿1 3 𝒏𝟒. =¿ 4
pour un poids compris entre 55 et
65 kg Total 𝒏.𝟏=¿ 3 𝒏.𝟐=¿ 8 𝒏.𝟑=¿ 9 20
Effectifs Fréquences
Distribution conditionnelle des
2 2/8
3 3/8 Lecture
2 2/8 𝑓 1/ 2=0,1; 𝑓 2 /2=0,375 ;
1 1/8
8 1 En fréquence 𝑓 3 /2 =0,25 ; 𝑓 4 / 2=0,125 10
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Les distributions conditionnelles
Exemple illustratif (la taille et le poids des étudiants)
 Distribution par catégories de poids dont la taille est dans l’intervalle [170, 180]
En Effectifs [45, 55[ [55, 65[ [65, 80[ Total
Xi Yj
[150, 160[ 1 2 0 𝒏𝟏 . =¿ 3
[160, 170[ 2 3 3 𝒏𝟐 . =¿ 8
[170, 180[ 𝒏𝟑𝟏 =¿0 𝒏𝟑𝟐 =¿ 2 𝒏𝟑𝟑 =¿3 𝒏𝟑 . =¿ 5
[180, 190] 0 1 3 𝒏𝟒. =¿ 4
Total 𝒏.𝟏=¿ 3 𝒏.𝟐=¿ 8 𝒏.𝟑=¿ 9 20

Catégories du poids des étudiants Distribution Conditionnelle des


pour une taille comprise ente 170 et
180 cm
Effectifs fréquences
0 0
2 2/5
3 3/5
5 1
En fréquence 11
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Les distributions conditionnelles

On peut calculer les moyennes de ces distributions conditionnelles


Moyenne Conditionnelle du poids pour i=3 Moyenne conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille comprise Catégories de la taille des étudiants pour un poids compris entre
ente 170 et 180 cm 55 et 65 kg
Modalités des Xi Effectifs Fréquences
Modalités des Yj Effectifs Fréquences
[45, 55[ 0 0 [150, 160[ 2 2/8
[55, 65[ 2 2/5 [160, 170[ 3 3/8
[65, 80[ 3 3/5 [170, 180[ 2 2/8
5 1 [180, 190] 1 1/8
8 1

On a par exemple :

 n3 j y j x2 
 n i2 xi
y3  n.2
n3.

12
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Les distributions conditionnelles

On peut calculer les variances de ces distributions conditionnelles


Variance Conditionnelle du poids pour i=3 Variance conditionnelle de la taille pour j=2
Catégories du poids des étudiants pour une taille Catégories de la taille des étudiants pour un poids
comprise ente 170 et 180 cm compris entre 55 et 65 kg
Modalités des Yj Effectifs Fréquences Modalités des Xi Effectifs Fréquences
[45, 55[ 0 0 [150, 160[ 2 2/8
[55, 65[ 2 2/5 [160, 170[ 3 3/8
[65, 80[ 3 3/5 [170, 180[ 2 2/8
5 1 [180, 190] 1 1/8
8 1

On a par exemple :

13
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles

1- Relation entre les moyennes

La moyenne marginale est la moyenne arithmétique pondérée

des moyennes conditionnelles

14
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles

2- Relation entre les variances


La variance marginale est égale à la variance des moyennes
conditionnelles plus la moyenne des variances conditionnelles

15
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation

Introduction

• Dans Cette section, on va étudier les relations, lorsqu’elles existent,


entre deux distributions statistiques dont les valeurs sont observées
isolément.
• Par exemple la relation entre deux variables : publicité et vente, ou
entre le revenu et les dépenses.
• On peut s'intéresser à une liaison éventuelle entre les deux variables
quantitatives.
• La régression fournit une expression de cette liaison sous la forme
d'une fonction mathématique.
• La corrélation renseigne sur l'intensité de ce lien.

16
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation Données quantitatives : nuages de points
Définition Numéro Taille i Poids i
1 158 55
• Considérons deux caractères numériques et . Si à partir 2 177 80
d’une étude menée sur un échantillon de taille on obtient les 3 181 72
valeurs et yi , la représentation graphique dans le plan de 4 190 77
5 163 53
l’ensemble des points de coordonnées s’appelle nuage 6 158 58
statistique. 7 165 74
Exemple illustratif : la taille et le poids des étudiants 8 164 64
9 166 72
• Cette représentation 10 169 74
graphique du nuage de 11 173 64
12 175 72
points permet : 13 174 74
• D’apprécier l’existence 14 180 64
ou non d’une 15 164 55
16 166 65
éventuelle liaison 17 172 61
• De déterminer la forme 18 163 50
de la liaison 19 188 73 17
20 150 48
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation
Ajustement à une fonction linéaire
• A partir de ce nuage, il faut chercher à exprimer la relation entre les deux variables
quantitatives à l’aide d’une équation mathématique . On pourrait le faire de plus
d’une façon, mais on va se limiter ici à la plus simple, c’est-à-dire l’équation
linéaire de la forme affine
y
Définition
• On appelle régression linéaire, l’ajustement d’une droite au nuage statistique (xi; yi)
85
80
75
70
65
Le Poids

60
55
50
45
40
140 150 160 170 180 190 200
La Taille 18
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation

La méthode des moindres carrés


• Le problème consiste donc à trouver une droite d’équation qui traduit, avec le
plus de fidélité, le lien entre x et y.
• Pour cela nous allons utiliser une technique appelée : la méthode des
moindres carrés,
• Cette méthode consiste à minimiser la somme des carrés des distances Di
verticales entre la droite et chacun des points (xi; yi).
• Après démonstration, on a:
𝑛

∑ 𝑥𝑖 𝑦𝑖 −𝑛 𝑥 𝑦
𝑎= 𝑖=1


𝑛
2
𝑥 − 𝑛 (𝑥 ²)
𝑖
Avec 𝑏=𝑦 − 𝑎 𝑥
𝑖 =1

Où et sont respectivement les moyennes arithmétiques deet de

19
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation
La méthode des moindres carrés
Numéro Taille xi Poids yi xy x²
Exemple illustratif : la taille et le poids des étudiants 1 158 55 8690 24964
𝑛
2 177 80 14160 31329
∑ 𝑥𝑖 𝑦𝑖 −𝑛 𝑥 𝑦
𝑎=
𝑖=1 3 181 72 13032 32761
𝑛

∑ 𝑥2 4 190 77 14630 36100


𝑖 − 𝑛 (𝑥 ²)
𝑖 =1 5 163 53 8639 26569
222923 −20 × 169,5 ×65,25 6 158 58 9164 24964
𝑎= 7 165 74 12210 27225
578604 − 20 ×(169,5) ² 8
9
164
166
64
72
10496
11952
26896
27556
1334
𝑎= =0,6795 10 169 74 12506 28561
1963,5 11
12
173
175
64
72
11072
12600
29929
30625
𝑏=𝑦 − 𝑎 𝑥 13
14
174
180
74
64
12876
11520
30276
32400
15 164 55 9020 26896
16 166 65 10790 27556
17 172 61 10492 29584
L’équation de la droite est: 18 163 50 8150 26569
19 188 73 13724 35344
y 20 150 48 7200 22500
Total 20 3396 1305 222923 578604 20
Moyenne 169,8 65,25
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation

La covariance
Définition

• La covariance de Pearson entre deux variables aléatoires est un nombre permettant


de quantifier leurs écarts conjoints par rapport à leurs moyennes respectives.
• La covariance est une extension de la notion de variance.
𝑛
1
𝑐𝑜𝑣 ( 𝑥, 𝑦 ) = ∑ (𝑥 𝑖 − 𝑥)( 𝑦 𝑖 − 𝑦) 
𝑛 𝑖=1
Propriétés

• et varient dans le même sens.


• et varient en sens opposé.

21
Chapitre 3: Distribution statistique à deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions
Section 3: Distribution conditionnelles
marginales
Section 4: Relation entre les caractéristiques marginales et conditionnelles
Section 5: Régression linéaire et corrélation
La Covariance
Exemple illustratif : la taille et le poids ² () () ()
des étudiants 158 55 8690 24964 -11,8 -10,25 120,95
177 80 14160 31329 7,2 14,75 106,2
181 72 13032 32761 11,2 6,75 75,6
 Calcul de la covariance 190 77 14630 36100 20,2 11,75 237,35
163 53 8639 26569 -6,8 -12,25 83,3
158 58 9164 24964 -11,8 -7,25 85,55
𝑛 165 74 12210 27225 -4,8 8,75 -42
1
𝑐𝑜𝑣 ( 𝑥 , 𝑦 ) = ∑ (𝑥 𝑖 − 𝑥)( 𝑦 𝑖 − 𝑦 ) 
164 64 10496 26896 -5,8 -1,25 7,25
166 72 11952 27556 -3,8 6,75 -25,65
𝑛 𝑖=1 169
173
74
64
12506
11072
28561 -0,8
29929 3,2
8,75
-1,25
-7
-4
175 72 12600 30625 5,2 6,75 35,1
1334 174 74 12876 30276 4,2 8,75 36,75
𝑐𝑜𝑣 ( 𝑥 , 𝑦 ) = =66,7 180 64 11520 32400 10,2 -1,25 -12,75
20 164 55 9020 26896 -5,8 -10,25 59,45
166 65 10790 27556 -3,8 -0,25 0,95
172 61 10492 29584 2,2 -4,25 -9,35
 La taille et le poids des étudiants varient 163 50 8150 26569 -6,8 -15,25 103,7
dans le même sens. 188 73 13724 35344 18,2 7,75 141,05
150 48 7200 22500 -19,8 -17,25 341,55
57860 22
3396 1305 222923 4     1334
Chapitre 3: Distribution statistique à une deux variables
Section 1: Les tableaux de contingence
Section 2: Les distributions marginales
Section 3: Distribution conditionnelles
Section 4 : Relation entre les caractéristiques marginales et conditionnelles
Section 5 : Régression linéaire et corrélation
Coefficient de corrélation linéaire
Définition

• Coefficient de corrélation linéaire mesure l’intensité de la relation linéaire entre


deux variables 𝑐𝑜𝑣 ( 𝑥 , 𝑦 )
𝑟=
𝜎𝑥𝜎𝑦
Propriétés

• Le coefficient de corrélation a le même signe que la covariance ; il est nul


quand la covariance est nulle.
• Il est dangereux d'interpréter le coefficient de corrélation comme un
pourcentage.
• relation fonctionnelle linéaire.
• indépendance linéaire.
• -1 ≤ r ≤ 1 le coefficient de corrélation est toujours compris entre -1 et 1
• dépendance linéaire autant plus forte que est est grand. 23
Notion d’indépendance

24

Vous aimerez peut-être aussi