Vous êtes sur la page 1sur 46

Fondamentaux de Statistique pour le

Management QF01
Chapitre 3. Statistique descriptive bivariée
Décrire les liens entre deux variables statistiques

C. Hahn & R. Jallet-Cattan


Objectif de l’analyse bivariée

Étudier le lien entre deux


variables

2
Exemple : Cas Timbert

emploi âge satisfaction prix …


1 ouvrier 21 ++ 2,75 …
2 ingénieur 37 + 4,6 …
3 Agent de 48 - 3,5 …
maîtrise
4 ouvrier 55 - 9,7 …
… … … … … …

3
De l’analyse univariée à…

Satisfaction Effectif Genre Effectif

-- 85 Femme 328

- 244 Homme 472

+ 292 Total 800

++ 179

Total 800
4
… l’analyse bivariée
Genre Femme Homme Total

Satisfaction

-- 53 32 85

- 156 88 244

+ 92 200 292

++ 27 152 179

Total 328 472 800


5
Distributions marginales
Satisfaction Effectif Genre Effectif

-- 85 Femme 328

- 244 Homme 472

+ 292 Total 800

++ 179

Total 800

6
Distributions conditionnelles
Satisfaction/Femme Effectif Genre/++ Effectif

-- 53 Femme 27

- 156 Homme 152

+ 92 Total 179

++ 27

Total 328

7
Tableau de profils ligne
Genre Femme Homme Total

Satisfaction
-- 62 38 100

- 64 36 100

+ 32 68 100

++ 15 85 100

Marge 41 59 100
8
Tableau de profils colonne
Genre Femme Homme Marge

Satisfaction
-- 16 7 11

- 48 19 30

+ 28 42 37

++ 8 32 22

Total 100 100 100


9
Indépendance statistique

10
Cas Timbert : Situation observée

Genre Femme Homme Total

Satisfaction
-- 53 32 85

- 156 88 244

+ 92 200 292

++ 27 152 179

Total 328 472 800


11
Situation théorique d’indépendance
Genre Femme Homme Total

Satisfaction
-- 35 50 85

- 100 144 244

+ 120 172 292

++ 73 106 179

Total 328 472 800


12
Effectifs théoriques

N i. N.j
Tij 
N
Ni. :effectif marginal en ligne

N.j : effectif marginal en colonne

N : effectif total

13
Indicateur de dépendance : Khi-deux

Il mesure l’intensité de la dépendance

14
Avec une variable quantitative

Croiser une variable quantitative


avec une variable qualitative :

Etudier la distribution de la variable


quantitative sur une partition
de la population

15
Étude du prix selon le genre

Femmes
1
N1

Hommes
2
N2


²
N 16
Étude du prix selon le genre

Prix moyen payé par les femmes (N1=328)


1 = 4,9
Prix moyen payé par les hommes (N2=472)
2 = 3,8
Prix moyen tous genres confondus (N=800)
m = 4,25

17
Étude du prix selon le genre

Femmes
1
N1

Hommes
2
? N2


²
N
18
Corrélation
X qualitative
Y quantitative

Y est dite non corrélée à X

i, μ Y/X  x i  μ Y

19
Étude du prix selon le genre

Femmes
1
N1
Variance
inter
Hommes
2
N2


²
N
20
Étude du prix selon le genre

Femmes
1 = 4,9 1²
N1 = 328
Variance
inter
Hommes
= 2 = 3,8 2²
N2 = 472
?
 = 4,25
²
N = 800
21
Étude du prix selon le genre

Femmes
1 1²
N1
Variance
inter
Hommes
} Variance
intra

2 2²
N2


²
N
22
Étude du prix selon le genre

Femmes
1 1² = 1,1
N1 = 328
Variance
inter
Hommes
} Variance
Intra

2 2² = 2 =
N2 = 472

?

²
N = 800
23
Étude du prix selon le genre

Femmes
1 1²
N1
Variance
inter
Hommes
} Variance
intra

2 2²
N2


²
N
24
Rapport de corrélation

Mesure l’intensité de corrélation de Y en X

²Y/X : Rapport de corrélation de Y en X

25
Indicateur de la corrélation simple

²Y/X
s’interprète comme
un pourcentage
de la variance de Y

26
Deux variables quantitatives

Croiser deux variables quantitatives :

Analyser la relation entre deux variables


quantitatives

27
De la description / synthèse à la construction d’un modèle

Existe-t-il un lien?

Si oui, peut-on modéliser cette relation?

28
Exemple 1

Représentation du montant des achats


effectués par un client d’une entreprise de
vente par correspondance

29
Graphique 1

400

350

300

montant achats
250

200

150

100

50

0
0 2 4 6 8 10 12 14

nombre enfants

30
Graphique 2

120

100

montant achats 80

60

40

20

0
10 20 30 40 50 60 70 80 90

âge

31
Graphique 3

700

600

500
montant
400

300

200

100

0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000

revenu

32
Exemple 2

Représentation du CA des magasins d’une chaîne.

33
Exemple 2
350
300
250
200
CA

150
100
50
0
0 2 4 6 8 10 12 14 16 18
nb d'employés

34
Coefficient de corrélation linéaire

CovX, Y 
ρ
σXσY

35
Exemple 2

Cov (X, Y) = 494,79


X = 5,17

Y = 96,67


 = ???

36
Attention :

Ne pas confondre corrélation et causalité !

37
Télévision et espérance de vie

Y-a-t-il un lien entre l’espérance de vie dans un pays et le nombre


de téléviseurs?

38
 peut être trompeur!

Toujours
dessiner le nuage de points

39
40
Faire un ajustement linéaire
Exemple 2

350
300
250
200
CA

150
100
50
0
0 2 4 6 nb 8 10
d'employés 12 14 16 18

41
Droite des moindres carrés de Y en X

Variable explicative : X
Variable expliquée : Y

Ŷ  β1X  β 0

 β1  CovX, Y  / σ 2X
 β 0  μ Y  β1μ X

42
Les résidus

Écarts, mesurés verticalement, entre les points


du nuage et les points correspondants sur la
droite

43
Décomposition de la variance
Variance totale
=
Variance expliquée par la droite + Variance résiduelle

Somme Carrés totale


=
Somme Carrés expliquée + Somme Carrés résiduelle

44
Coefficient de détermination

Mesure la qualité de l’ajustement linéaire

45
Procédure générale

46

Vous aimerez peut-être aussi