Vous êtes sur la page 1sur 23

Mohamed EL OTMANI 11-02-2010

Introduction
Lorsque lon tudie plusieurs caractres simultanment, on souhaite

valuer le lien entre les caractres et leur dpendance.

Statistique multivarie

On va se limiter ici deux dimensions


Statistique Bivarie
11/02/2010

Statistique descriptive bivarie


Le but est dtudier simultanment deux variables X et Y sur une mme population. Plusieurs cas se prsentent selon la nature de ces deux variables : X et Y sont deux variables quantitatives (continues ou discrtes) Exemple : on peut chercher savoir sil y a un lien entre le salaire des hommes et le salaire des femmes au sein dun foyer. X est qualitative (ou quantitative discrte avec peu de valeurs distinctes) et Y est continue. Exemple : Lacceptation du crdit X est-elle associe au Y ? On observe le prix Y dun produit de consommation courante dans des grandes surfaces de 3 rgions diffrentes X. X et Y sont deux variables quantitatives. Exemple : Lacceptation du crdit X est-elle associe au type de contrat de travail Y ?
11/02/2010

Les tableaux deux caractres


Une population statistique peut tre dcrite laide de deux caractres

simultanment

Les tableaux statistiques correspondant sont deux dimensions,


ils sont appels tableaux de contingence ou croiss dynamiques ou double entres

11/02/2010

Prsentation gnrale des tableaux de contingence


Considrons une population statistique dcrite selon deux caractres : Un caractre X dont les n modalits xi sont x1, x2, ..., xi, ...., xp

Un caractre Y dont les k modalits yj sont y1, y2, ..., yj, ...., yk

Les k modalits de Y yj

xi
Les n modalits de X
x1 x2
. . .

y1

y2 . . . . . y j . . . . . . y k

ni. n1. n2.


. . . . . . . .

Les effectifs partiels apparaissent

n11 n21
. . . . . . . .

n12 . . . . .n1j . . . . . n1k n22 . . . . .n2j . . . . . n2k

lintrieur du tableau
nij : effectif de la population prsentant

la fois la modalit xi et la modalit yj


nij : lindice de X i dabord et de Y

xi
. . .

ni1

ni2 . . . . . nij . . . . . . nik

ni.

j ensuite
Les marges ou effectifs marginaux ni. : somme des effectifs de la ime ligne,

xp

n.j

np1 np2 . . . . . npj . . . . . npk n.1 n.2 . . . . . n.j . . . . . n.k

np. n..

lindice j variant de 1 K est remplac par . n.j : somme des effectifs de la modalit yj , lindice i = 1 p est remplac par .

Prsentation gnrale des tableaux de contingence


Le tableau de contingence obit une notation conventionnelle
1. Le tableau contient :
Dans la 1re colonne les n modalits x1, x2, ..., xi, ...., xp du caractre X Dans la 1re ligne les k modalits y1, y2, ..., yj, ...., yk du caractre Y 2. Leffectif nij correspond lintersection dune ligne i et dune colonne j Leffectif de la population prsentant la fois la modalit xi et la modalit yj 3. Pour les effectifs marginaux ni. et n.j , on remplace lindice qui varie par .
ni. : somme des effectifs de la ime ligne, j =1, ..., K est remplac par . n.j : somme des effectifs de la jme colonne, i =1, ..., p est remplac par .

4. Leffectif gnral marginal de X est not ni. et celui de Y n.j


5. Leffectif total du tableau est not n.. : il sagit de leffectif total de la population tudie
11/02/2010

Prsentation gnrale des tableaux de contingence


Exemple : rpartition des salaris dune entreprise X selon le sexe (xi ) et le niveau

de formation (yj ) yj xi Bac + 3

Fminin Masculin Total (ni. )


45 49 94

La marge n.j et la ligne du haut yj

donne la distribution marginale des salaris de lentreprise selon leur sexe

Bac + 5
Bac + 8 Total (n.j )

16
4 65

11
6 66

27
10 n.. = 131 Distribution marginale du caractre Y

La marge ni. et la premire colonne xi donne la distribution marginale des salaris de

lentreprise selon leur niveau de formation

Distribution marginale du caractre X

Proprits des tableaux de contingence


a) Les modalits de xi et yj tant incompatibles et exhaustives, on peut

crire plusieurs sries dgalits


Pour yj

j=1

n1j = n1.
k j=1

n1. reprsente le nombre dindividus prsentant la modalit x1 de X quelle que soit la modalit de y

De faon gnrale :
Pour xi

nij = ni.

i=1

ni1 = n.1
p i=1

n.1 reprsente le nombre dindividus prsentant la modalit y1 de Y quelle que soit la modalit de x

De faon gnrale :

nij = n.j

11/02/2010

Leffectif total de la population n..


Leffectif total de la population n..

Apparat lintersection de la dernire ligne et de la dernire colonne


Est gal la somme de la dernire ligne ou de la dernire colonne

n.. = ni. = n.j


i=1 j=1

En remplaant ni. et n.j par les expressions prcdentes, on obtient

n.. = i=1 j=1 nij = j=1 i=1 nij

11/02/2010

Les frquences partielles


b) Les frquences partielles

Rapport de leffectif partiel sur leffectif total La frquence partielle des modalits xi , yj est gale :

fij =

nij n..

Proportion dindividus satisfaisant la fois la modalit xi et la modalit yj

La somme des frquences partielles est gale 1

11/02/2010

Les frquences partielles


Exercice: rpartition des salaris dune entreprise M selon le sexe (xi ) et le

niveau de formation (yj )


yj

xi
Bac + 3 Bac + 5

Fminin Masculin Total (ni. )


45 16 49 11 94 27

Bac + 8
Total (n.j )

4
65

6
66

10
n.. = 131

1. Calculer f22 , f31, f12 2. Interprter les rsultats 3. Calculer n.2 puis en dduire f32
11/02/2010

Les diffrentes distributions statistiques


Plusieurs distributions statistiques peuvent tre dfinies dans un tableau

double entres
Les distributions marginales
Les distributions conditionnelles 1.

Les distributions marginales


Un tableau de contingence compte deux distributions marginales: la distribution

marginale du caractre X et la distribution marginale du caractre Y


La distribution marginale du caractre X Est compose des modalits du caractre X et des effectifs correspondant

quelles que soit les modalits du caractre Y

11/02/2010

Distributions marginales
La distribution marginale du caractre X est donne par le tableau suivant Caractre x1 x2
. . .

Effectifs marginaux n1. n2.


. . .

Frquences marginales f1. f2.


. . .

xi
. . .

ni.
. . .

fi.
. . .

xp
Total leffectif total

np.
n..

fp.
1

On peut calculer les frquences marginales : rapport de leffectif marginal sur

fi. =

ni.

n..

Distributions marginales
La distribution marginale du caractre Y Est compose des modalits du caractre Y et des effectifs correspondant

quelles que soit les modalits du caractre X


La frquence marginale de la modalit yj est gale :

f.j =

n.j

n..

Caractre

Effectifs marginaux

Frquences marginales

y1 y2
. . .

n.1 n.2
. . .

f.1 f.2
. . .

yi
. . .

n.j
. . .

f.j
. . .

yk
Total
11/02/2010

n.k
n..

f.k
1

Distributions marginales
Exercice: Rpartition des salaris dune entreprise M selon le sexe (xi ) et le niveau de formation (yj )
yj
xi Fminin Masculin Total (ni. )

Bac + 3
Bac + 5 Bac + 8 Total (n.j )

45
16 4 65

49
11 6 66

94
27 10 n.. = 131
Distribution marginale des effectifs des salaris en fonction de leur niveau de formation

Distribution marginale des effectifs des salaris en fonction de leur sexe

1. Complter le tableau en calculant les frquences marginales. 2. Interprter les rsultats.


11/02/2010

Distributions conditionnelles
2.

Les distributions conditionnelles


Deux sries de distributions conditionnelles

Celle du caractre X conditionnellement au caractre Y Celle du caractre Y conditionnellement au caractre X

Distributions conditionnelles du caractre X lies par yj, j=1, ..., k

Ce sont les modalits de X et des effectifs de chacune de ces modalits dans la sous population prsentant la modalit yj de Y Exemple: rpartition de la sous population des femmes de lentreprise M selon leur
niveau de formation xi Bac + 3 Bac + 5 Bac + 8 Total (n.j ) yj Fminin 45 16 4 65

Distributions conditionnelles

Distribution conditionnelle du caractre X lie par yj (j=1,,k) est la suivante :

Caractre
x1 x2
. . .

Effectifs de yj
n1j n2j
. . .

Frquences conditionnelles
f1/ j f2/ j
. . .

xi
. . .

nij
. . .

fi/ j
. . .

xp

npj

fp/ j

Total

n.j

On peut calculer la frquence conditionnelle de la modalit xi de X sous condition

que Y=yj : proportion dindividus prsentant la modalit xi parmi les individus qui prsentent uniquement la modalit yj

11/02/2010

nij fxi/y j = n .j

Distributions conditionnelles

Distributions conditionnelles du caractre Y lies par xi , i=1, ..., p

Ce sont les modalits de Y et des effectifs de chacune de ces modalits dans la sous population prsentant la modalit xi de X
Exemple: rpartition de la sous population de lentreprise M ayant un niveau de
formation Bac+3 selon le sexe

yj

xi
Bac + 3

Fminin
45

Masculin
49

Total (ni. )
94

La frquence conditionnelle de la modalit yj de Y sous condition que x = xi : proportion dindividus prsentant la modalit yj parmi les individus qui prsentent uniquement la modalit xi

nij fyj/ xi = n i.

Distributions conditionnelles

Distribution conditionnelle du caractre Y lies par xi (i=1, ..., p) est la suivante

Caractre y1 y2
. . .

Effectifs de yj ni1 ni2


. . .

Frquences conditionnelles f1/ i f2/ i


. . .

yj
. . .

nij
. . .

fj/ i
. . .

yk Total

nik ni.

fk/ i 1

11/02/2010

Distributions conditionnelles
Rpartition des salaris dune entreprise M selon le sexe (xi ) et le niveau de formation (yj )

yj

xi
Bac + 3 Bac + 5

Fminin Masculin Total (ni. )


45 16 49 11 94 27

Bac + 8
Total (n.j ) 1. Calculer : fx /y 2 2 2. Calculer : fy /x
2

4
65

6
66

10
n.. = 131

, fx3/y1, fx1/y2 , fy3/x1, fy1/x2 2

11/02/2010

Relation entre les frquences marginales et les frquences conditionnelles


3.

Relation entre les frquences marginales et les frquences conditionnelles

On peut dmontrer que le produit des frquences marginales par les frquences conditionnelles est gal aux frquences partielles

fi.
et

x fj/i

fij

f.j

fi/j

= fij

11/02/2010

Indpendance statistique:
Les deux caractres X et Y sont statiquement indpendants si

la variation de lun nentraine pas la variation de lautre. Si X est indpendant de Y alors Y est indpendant de X.
Exemple de caractres indpendants: Modalits du caractre Y Modalits du caractre X y1 y2 y3 y4

x1 x2
x3

3 6
12

5 10
20

2 4
8

4 8
16

11/02/2010

Indpendance statistique:
Les deux caractres X et Y sont statiquement indpendants si

et si seulement si, pour tout i et j, on a

ni. n.j fij=fi. f.j ou nij= n..

cela signifie que la connaissance des distributions marginales suffit reconstruire lintrieur du tableau du distribution conjointe.
Lindpendance est un cas extrme que lon rencontre rarement ltat pur dans la pratique. On peut cependant mesurer lintensit de la dpendance entre deux caractres X et Y .

11/02/2010

Vous aimerez peut-être aussi