Vous êtes sur la page 1sur 8

Chapitre 2 Statistique Descriptive Double.

Lorsqu’on étudie 2 caractères 𝑋 et 𝑌 simultanément, on dit qu’on étudie une série statistique
double. La série statistique est alors une suite (𝑥1 , 𝑦1 ), … , (𝑥𝑖 , 𝑦𝑖 ), … , (𝑥𝑛 , 𝑦𝑛 ) de 𝑛
couples des valeurs prises par les deux variables sur chaque individu

quantitatif, quantitatif

Ces deux caractères peuvent être quantitatif, qualitatif

qualitatif, qualitatif

Exemples : à chaque individu, on peut relever les caractères suivants :

1) X = taille, Y = poids
2) X = couleur des yeux Y = couleur des cheveux
3) X = série du bac Y = moyenne annuelle en 1ère année

Tableau de données : c’est la série x , y 


i i i 1,...,n

𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑛
𝑦𝑖 𝑦1 𝑦2 … 𝑦𝑛

Exemple : On a fait une étude statistique sur 6 sites de commerce électronique ayant pour
but de sonder, sur une semaine, le nombre de visiteurs de chaque site et le nombre de
commandes.

Soient : 𝑋 = 𝑙𝑒 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑣𝑖𝑠𝑖𝑡𝑒𝑢𝑟𝑠, 𝑌 = 𝑙𝑒 𝑛𝑜𝑚𝑏𝑟𝑒 𝑑𝑒 𝑐𝑜𝑚𝑚𝑎𝑛𝑑𝑒𝑠,

𝑥𝑖 10 11 12 15 16 20
yi 5 6 6 10 12 15

Chacun de ces deux caractères pris seul, représente une variable statistique simple : Pour
les caractères quantitatifs, on peut donc calculer la moyenne, la variance et tout autre
paramètre défini au chapitre précédent.

1
Ce qui nous intéresse en plus par rapport à l’étude séparée de chacun des deux
caractères (chapitre 1) est de voir dans quelle mesure les 2 caractères pris ensembles,
s’influencent l’un et l’autre. On présente alors les données sous forme d’un tableau à double
entrée, appelé tableau de contingence, ou tableau de distribution conjointe.

I. Tableaux de contingence ou tableau de distribution conjointe


𝑿 est une variable pouvant prendre 𝑘 modalités et 𝒀 est une variable pouvant
prendre 𝑙 modalités. On construit le tableau de contingence qui représente la
distribution d’effectif du couple de variable (𝑿, 𝒀 ).

𝒀 𝑌1 𝑌2 … 𝒀𝒋 … 𝑌𝑙 𝒏𝒊.
𝑿
𝑋1 𝑛11 𝑛12 … 𝑛1𝑗 … 𝑛1𝑙 𝒏𝟏.

𝑋2 𝑛21 𝑛22 … 𝑛2𝑗 … 𝑛2𝑙 𝒏𝟐.

⋮ ⋮ ⋮ … ⋮ … 0 ⋮

𝑿𝒊 𝑛𝑖1 𝑛𝑖2 … 𝒏𝒊𝒋 … 𝑛𝑖𝑙 ⋮

⋮ ⋮ ⋮ … ⋮ … … ⋮

𝑋𝑘 𝑛𝑘1 𝑛𝑘2 … 𝑛𝑘𝑗 … 𝑛𝑘𝑙 𝒏𝒌.

𝒏.𝒋 𝒏.𝟏 𝒏.𝟐 … ⋮ … 𝒏.𝒍 𝒏


Où :

 𝒏𝒊𝒋 : l’effectif de la cellule (𝑿𝒊 , 𝒀𝒋 ) est le nombre d’individus qui possèdent en


même temps les caractères 𝑿𝒊 et 𝒀𝒋

 𝒏𝒊• :l’effectif des individus qui présentent la modalité 𝑿𝒊 avec 𝒏𝒊• = ∑𝒍𝒋=𝟏 𝒏𝒊𝒋 .

 𝒏•𝒋 : l’effectif des individus qui présentent la modalité 𝒀𝒋 avec 𝒏•𝒋 = ∑𝒌𝒊=𝟏 𝒏𝒊𝒋 .
De même, on définit :
𝒏𝒊𝒋
 𝒇𝒊𝒋 = : la fréquence de la cellule(𝑥𝑖 , 𝑦𝑗 ).
𝒏
𝒏𝒊•
 𝒇𝒊• = : la fréquence marginale de la modalité 𝑿𝒊 .
𝒏
𝒏•𝒋
 𝒇•𝒋 = : la fréquence marginale la modalité 𝒀𝒋
𝒏

2
Exemple : On mesure le poids 𝒀 et la taille 𝑿 de 20 individus. Les observations sont
données dans le premier tableau (à gauche), et après répartition en 5 classes
d’égales amplitudes pour chacune des deux variables, nous obtenons le tableau de
contingence ci-dessous (à droite).

Y [60, 69[ [69, 78[ [78, 87[ [87, 96[ [96, 105[ 𝒏𝒊.
X
[155, 162[ 2 0 0 0 0 𝟐

[162, 169 [ 2 1 0 0 0 𝟑

[ 169, 176[ 1 4 2 1 0 𝟖

[176, 183[ 0 2 1 0 1 𝟒

[183, 190[ 0 0 0 0 3 𝟑

𝒏.𝒋 𝟓 𝟕 𝟑 𝟏 𝟒 𝟐𝟎

II. Représentation graphique (Nuage de points)


Chaque couple est composé de deux valeurs numériques si les deux caractères sont
quantitatifs. Un couple de nombres (entiers ou réels) peut toujours être représenté
comme un point dans un plan de coordonnées(𝑥𝑖 , 𝑦𝑖 ).
Exemple : (Poids et taille de 20 individus)

3
III. Distributions

1. Distributions marginales

La série (𝑿𝒊 , 𝒏𝒊. ) 𝒊=𝟏…𝒌 (respectivement (𝒀𝒊 , 𝒏.𝒋 ) 𝒋=𝟏…𝒍 ) est appelé la distribution marginale
de 𝑿 (respectivement la distribution marginale de 𝒀). Ce sont toutes les deux des
statistiques simples pour lesquelles on a les tableaux de distribution respectifs :

𝑿𝒊 𝑋1 𝑋2 … 𝑋𝑘 ∑
𝒏𝒊. 𝑛1 . 𝑛2. … 𝑛𝑘. 𝒏 Distribution marginale de 𝑿.
𝒇𝒊. 𝑓1 . 𝑓2. … 𝑓𝑘. 1

𝒀𝒋 𝑌1 𝑌2 … 𝑌𝑙 ∑
Distribution marginale de 𝒀.
𝒏.𝒋 𝑛.1 𝑛.2 … 𝑛.𝑙 𝒏
𝒇.𝒋 𝑓.1 𝑓.2 … 𝑓.𝑙 1

2. Distributions conditionnelles

La 𝑗 è𝑚𝑒 colonne du tableau statistique décrit la sous population des individus


possédant la modalité 𝑦𝑗 suivant le caractère 𝑋. La fréquence conditionnelle de la
modalité 𝑥𝑖 sachant 𝑦𝑗 (ou liée à 𝑦𝑗 ) est :

4
𝒇𝒊𝒋 𝒏𝒊𝒋
𝒇𝒊/𝒋 = = ∀ 1 ≤ 𝑖 ≤ 𝑘 et 𝑗 fixé.
𝒇•𝒋 𝒏•𝒋

De même, la distribution conditionnelle sachant 𝑥𝑖 :


𝒇𝒊𝒋 𝒏𝒊𝒋
𝒇𝒋/𝒊 = = ∀ 1 ≤ 𝑗 ≤ 𝑙 et 𝑖 fixé.
𝒇𝒊• 𝒏𝒊•

Remarque :
 𝑓𝑖𝑗 = 𝑓𝑖• 𝑓𝑗/𝑖 = 𝑓•𝑗 𝑓𝑖/𝑗
 ∑𝑘𝑖=1 𝑓𝑖/𝑗 = 1 et ∑𝑙𝑗=1 𝑓𝑗/𝑖 = 1

Exemple :
Distribution de 𝑿 conditionnée par 𝒀 ∈ [ 𝟔𝟗 , 𝟕𝟖 [ .
classes [155, 162[ [162,169[ [169,176[ [176,183[ [183, 190[ Σ
𝑋𝑖 158.5 165.5 172.5 179.5 186.5
𝑛𝑖2 0 1 4 2 0 𝑛•2 =7
𝑓𝑋=𝑋𝑖/𝑌∈[69,78[ 0 1/7 4/7 2/7 0 1

Distribution de 𝒀 conditionnée par 𝑿 ∈ [ 𝟏𝟔𝟗 , 𝟏𝟕𝟔 [ .


Classes [60, 69[ [69, 78[ [78, 87[ [87, 96[ [96, 105[ Σ
𝑌𝑖 64.5 73.5 82.5 91.5 100.5
𝑛3𝑗 1 4 2 1 0 𝑛3• = 𝟖
𝑓𝑋=𝑋𝑖/𝑌∈[69,78[ 1/8 4/8 2/8 1/8 0 1

3. Indépendance de deux variables


Les deux variables 𝑋 et 𝑌 sont dites indépendantes si :
𝑓𝑖/𝑗 est indépendante de 𝑗 , ∀ 1 ≤ 𝑖 ≤ 𝑘 soit 𝑓𝑖/1 = ⋯ = 𝑓𝑖/𝑙 alors 𝑓𝑖/𝑗 = 𝑓𝑖• ∀ 1 ≤ 𝑗 ≤ 𝑙
𝑓𝑗/𝑖 est indépendante de 𝑖 , ∀ 1 ≤ 𝑗 ≤ 𝑙 soit 𝑓𝑗/1 = ⋯ = 𝑓𝑗/𝑘 alors 𝑓𝑗/𝑖 = 𝑓•𝑗 ∀ 1 ≤ 𝑖 ≤ 𝑘
D’où, la relation : 𝑓𝑖𝑗 = 𝑓𝑖• × 𝑓•𝑗 qui nous donne :

𝒏 × 𝒏𝒊𝒋 = 𝒏𝒊• × 𝒏•𝒋 , ∀𝒊 et ∀𝒋

5
IV. Paramètres marginaux

1. Moyenne
1
Moyenne de 𝑿 : 𝑥̅ = ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖 = ∑𝑘𝑖=1 𝑓𝑖• 𝑋𝑖
𝑛
1
Moyenne de 𝒀 : 𝑦
̅= ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗 = ∑𝑙𝑗=1 𝑓•𝑗 𝑌𝑗
𝑛

2. Variance

Variance de 𝑿 :
1 1
𝜎𝑋2 = 𝑛 ∑𝑘𝑖=1 𝑛𝑖• (𝑋𝑖 − 𝑥̅ )2 = (𝑛 ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖2 ) − 𝑥̅ 2

𝑘 𝑘

𝜎𝑋2 = ∑ 𝑓𝑖• (𝑋𝑖 − 𝑥̅ )2 = (∑ 𝑓𝑖• 𝑋𝑖2 ) − 𝑥̅ 2


𝑖=1 𝑖=1

Variance de 𝒀 :
1 2 1
𝜎𝑌2 = 𝑛 ∑𝑙𝑗=1 𝑛•𝑗 (𝑌𝑗 − 𝑦̅) = (𝑛 ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗2 ) − 𝑦̅ 2

𝑙 𝑙
2
𝜎𝑌2 = ∑ 𝑓•𝑗 (𝑌𝑗 − 𝑦̅) = (∑ 𝑓•𝑗 𝑌𝑗2 ) − 𝑦̅ 2
𝑗=1 𝑗=1

Exemple : Calcul des moyennes et variances marginales de 𝑋 et de 𝑌.

𝑌 [60,69[ [69,78[ [78,87[ [87,96[ [96,105[


𝑋
𝑌𝑗
𝑋𝑖
64.5 73.5 82.5 91.5 100.5 𝑛𝑖• 𝑛𝑖• 𝑋𝑖 𝑛𝑖• 𝑋𝑖2
[155,162[ 158.5 2 0 0 0 0 2 317
[162,169[ 165.5 2 1 0 0 0 3 496.5
[169,176[ 172.5 1 4 2 1 8 1380
[176,183[ 179.5 0 2 1 0 1 4 718
[183,190[ 186.5 0 0 0 0 3 3 559.5
𝑛•𝑗 5 7 3 1 4 20 3471 603693
𝑛•𝑗 𝑌𝑗 322.5 514.5 247.5 91.5 402 1578
𝑛•𝑗 𝑌𝑗2 127809

1 3471 1 1578
 𝑥̅ = ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖 = = 173.55 et 𝑦̅ = ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗 = = 78.9
𝑛 20 𝑛 20

6
1 1
 𝜎𝑋2 = ( ∑𝑘𝑖=1 𝑛𝑖• 𝑥𝑖2 ) − 𝑥̅ 2 = ( 603693) − (173.55)2 = 65.0475
𝑛 20
1 1
 𝜎𝑌2 = ( ∑𝑙𝑗=1 𝑛•𝑗 𝑦𝑗2 ) − 𝑦̅ 2 = ( 127809) − (78.9)2 = 165.24
𝑛 20

V. Moyennes et variances conditionnelles


 Moyenne de 𝑿/𝒀 = 𝒚 : 𝑥̅ ∕𝑌=𝑦 = ∑𝑘𝑖=1 𝑓𝑖/𝑗 𝑥𝑖
 Moyenne de 𝒀/𝑿 = 𝒙 : 𝑦̅∕𝑋=𝑥 = ∑𝑙𝑗=1 𝑓𝑗/𝑖 𝑦𝑗
 Variance de 𝑿/𝒀 = 𝒚 :
2
𝜎𝑋2/𝑌=𝑦 = ∑𝑘𝑖=1 𝑓𝑖/𝑗 (𝑥𝑖 − 𝑥̅∕𝑌=𝑦 ) = ∑𝑘𝑖=1 𝑓𝑖/𝑗 𝑥𝑖2 − (𝑥̅∕𝑌=𝑦 )2

 Variance de 𝒀/𝑿 = 𝒙 :
2
𝜎𝑌2/𝑋=𝑥 = ∑𝑙𝑗=1 𝑓𝑗/𝑖 (𝑦𝑗 − 𝑦̅∕𝑋=𝑥 ) = ∑𝑙𝑗=1 𝑓𝑗/𝑖 𝑦𝑗2 − (𝑦̅∕𝑋=𝑥 )2

Remarque :
Si 𝑋 et 𝑌 sont indépendantes alors ̅=𝒙
𝒙 ̅∕𝒀=𝒚 et ̅=𝒚
𝒚 ̅∕𝑿=𝒙

Exemple : Calculer moyenne et variance de 𝑋/𝑦 ∈ [69,78[ .


classes [155, 162[ [162,169[ [169,176[ [176,183[ [183, 190[ Σ
𝑋𝑖 158.5 165.5 172.5 179.5 186.5
𝑛𝑖2 0 1 4 2 0 𝑛•2 =7
𝑓𝑋=𝑋𝑖/𝑌∈[69,78[ 0 1/7 4/7 2/7 0 1

𝑥𝑖 𝑓𝑋=𝑥𝑖 /𝑌∈[69,78[ 0 165.5/7 690/7 359/7 0 173.5


𝑥𝑖 2 𝑓𝑋=𝑥𝑖/𝑌∈[69,78[ 0 27390.25/7 119025/7 64440.5/7 0
30122.25

 𝑥̅∕𝑌∈[69,78[ = ∑𝑘𝑖=1 𝑓𝑖/𝑗 𝑥𝑖 = ∑5𝑖=1 𝑓𝑖/𝑗 𝑥𝑖 = 173.50 et


2
 𝜎𝑋2/𝑌∈[69,78[ = ∑𝑘𝑖=1 𝑓𝑖/𝑗 𝑥𝑖2 − (𝑥̅ ⁄𝑌=𝑦 ) = 30122.25 − (173.5)2 = 20

 𝑥̅ = 173.55 ≠ 173.50 = 𝑥̅∕𝑌∈[69,78[ alors 𝑋 et 𝑌 ne sont pas indépendantes.

7
8

Vous aimerez peut-être aussi