Académique Documents
Professionnel Documents
Culture Documents
Lorsqu’on étudie 2 caractères 𝑋 et 𝑌 simultanément, on dit qu’on étudie une série statistique
double. La série statistique est alors une suite (𝑥1 , 𝑦1 ), … , (𝑥𝑖 , 𝑦𝑖 ), … , (𝑥𝑛 , 𝑦𝑛 ) de 𝑛
couples des valeurs prises par les deux variables sur chaque individu
quantitatif, quantitatif
qualitatif, qualitatif
1) X = taille, Y = poids
2) X = couleur des yeux Y = couleur des cheveux
3) X = série du bac Y = moyenne annuelle en 1ère année
𝑥𝑖 𝑥1 𝑥2 … 𝑥𝑛
𝑦𝑖 𝑦1 𝑦2 … 𝑦𝑛
Exemple : On a fait une étude statistique sur 6 sites de commerce électronique ayant pour
but de sonder, sur une semaine, le nombre de visiteurs de chaque site et le nombre de
commandes.
𝑥𝑖 10 11 12 15 16 20
yi 5 6 6 10 12 15
Chacun de ces deux caractères pris seul, représente une variable statistique simple : Pour
les caractères quantitatifs, on peut donc calculer la moyenne, la variance et tout autre
paramètre défini au chapitre précédent.
1
Ce qui nous intéresse en plus par rapport à l’étude séparée de chacun des deux
caractères (chapitre 1) est de voir dans quelle mesure les 2 caractères pris ensembles,
s’influencent l’un et l’autre. On présente alors les données sous forme d’un tableau à double
entrée, appelé tableau de contingence, ou tableau de distribution conjointe.
𝒀 𝑌1 𝑌2 … 𝒀𝒋 … 𝑌𝑙 𝒏𝒊.
𝑿
𝑋1 𝑛11 𝑛12 … 𝑛1𝑗 … 𝑛1𝑙 𝒏𝟏.
⋮ ⋮ ⋮ … ⋮ … 0 ⋮
⋮ ⋮ ⋮ … ⋮ … … ⋮
𝒏𝒊• :l’effectif des individus qui présentent la modalité 𝑿𝒊 avec 𝒏𝒊• = ∑𝒍𝒋=𝟏 𝒏𝒊𝒋 .
𝒏•𝒋 : l’effectif des individus qui présentent la modalité 𝒀𝒋 avec 𝒏•𝒋 = ∑𝒌𝒊=𝟏 𝒏𝒊𝒋 .
De même, on définit :
𝒏𝒊𝒋
𝒇𝒊𝒋 = : la fréquence de la cellule(𝑥𝑖 , 𝑦𝑗 ).
𝒏
𝒏𝒊•
𝒇𝒊• = : la fréquence marginale de la modalité 𝑿𝒊 .
𝒏
𝒏•𝒋
𝒇•𝒋 = : la fréquence marginale la modalité 𝒀𝒋
𝒏
2
Exemple : On mesure le poids 𝒀 et la taille 𝑿 de 20 individus. Les observations sont
données dans le premier tableau (à gauche), et après répartition en 5 classes
d’égales amplitudes pour chacune des deux variables, nous obtenons le tableau de
contingence ci-dessous (à droite).
Y [60, 69[ [69, 78[ [78, 87[ [87, 96[ [96, 105[ 𝒏𝒊.
X
[155, 162[ 2 0 0 0 0 𝟐
[162, 169 [ 2 1 0 0 0 𝟑
[ 169, 176[ 1 4 2 1 0 𝟖
[176, 183[ 0 2 1 0 1 𝟒
[183, 190[ 0 0 0 0 3 𝟑
𝒏.𝒋 𝟓 𝟕 𝟑 𝟏 𝟒 𝟐𝟎
3
III. Distributions
1. Distributions marginales
La série (𝑿𝒊 , 𝒏𝒊. ) 𝒊=𝟏…𝒌 (respectivement (𝒀𝒊 , 𝒏.𝒋 ) 𝒋=𝟏…𝒍 ) est appelé la distribution marginale
de 𝑿 (respectivement la distribution marginale de 𝒀). Ce sont toutes les deux des
statistiques simples pour lesquelles on a les tableaux de distribution respectifs :
𝑿𝒊 𝑋1 𝑋2 … 𝑋𝑘 ∑
𝒏𝒊. 𝑛1 . 𝑛2. … 𝑛𝑘. 𝒏 Distribution marginale de 𝑿.
𝒇𝒊. 𝑓1 . 𝑓2. … 𝑓𝑘. 1
𝒀𝒋 𝑌1 𝑌2 … 𝑌𝑙 ∑
Distribution marginale de 𝒀.
𝒏.𝒋 𝑛.1 𝑛.2 … 𝑛.𝑙 𝒏
𝒇.𝒋 𝑓.1 𝑓.2 … 𝑓.𝑙 1
2. Distributions conditionnelles
4
𝒇𝒊𝒋 𝒏𝒊𝒋
𝒇𝒊/𝒋 = = ∀ 1 ≤ 𝑖 ≤ 𝑘 et 𝑗 fixé.
𝒇•𝒋 𝒏•𝒋
Remarque :
𝑓𝑖𝑗 = 𝑓𝑖• 𝑓𝑗/𝑖 = 𝑓•𝑗 𝑓𝑖/𝑗
∑𝑘𝑖=1 𝑓𝑖/𝑗 = 1 et ∑𝑙𝑗=1 𝑓𝑗/𝑖 = 1
Exemple :
Distribution de 𝑿 conditionnée par 𝒀 ∈ [ 𝟔𝟗 , 𝟕𝟖 [ .
classes [155, 162[ [162,169[ [169,176[ [176,183[ [183, 190[ Σ
𝑋𝑖 158.5 165.5 172.5 179.5 186.5
𝑛𝑖2 0 1 4 2 0 𝑛•2 =7
𝑓𝑋=𝑋𝑖/𝑌∈[69,78[ 0 1/7 4/7 2/7 0 1
5
IV. Paramètres marginaux
1. Moyenne
1
Moyenne de 𝑿 : 𝑥̅ = ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖 = ∑𝑘𝑖=1 𝑓𝑖• 𝑋𝑖
𝑛
1
Moyenne de 𝒀 : 𝑦
̅= ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗 = ∑𝑙𝑗=1 𝑓•𝑗 𝑌𝑗
𝑛
2. Variance
Variance de 𝑿 :
1 1
𝜎𝑋2 = 𝑛 ∑𝑘𝑖=1 𝑛𝑖• (𝑋𝑖 − 𝑥̅ )2 = (𝑛 ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖2 ) − 𝑥̅ 2
𝑘 𝑘
Variance de 𝒀 :
1 2 1
𝜎𝑌2 = 𝑛 ∑𝑙𝑗=1 𝑛•𝑗 (𝑌𝑗 − 𝑦̅) = (𝑛 ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗2 ) − 𝑦̅ 2
𝑙 𝑙
2
𝜎𝑌2 = ∑ 𝑓•𝑗 (𝑌𝑗 − 𝑦̅) = (∑ 𝑓•𝑗 𝑌𝑗2 ) − 𝑦̅ 2
𝑗=1 𝑗=1
1 3471 1 1578
𝑥̅ = ∑𝑘𝑖=1 𝑛𝑖• 𝑋𝑖 = = 173.55 et 𝑦̅ = ∑𝑙𝑗=1 𝑛•𝑗 𝑌𝑗 = = 78.9
𝑛 20 𝑛 20
6
1 1
𝜎𝑋2 = ( ∑𝑘𝑖=1 𝑛𝑖• 𝑥𝑖2 ) − 𝑥̅ 2 = ( 603693) − (173.55)2 = 65.0475
𝑛 20
1 1
𝜎𝑌2 = ( ∑𝑙𝑗=1 𝑛•𝑗 𝑦𝑗2 ) − 𝑦̅ 2 = ( 127809) − (78.9)2 = 165.24
𝑛 20
Variance de 𝒀/𝑿 = 𝒙 :
2
𝜎𝑌2/𝑋=𝑥 = ∑𝑙𝑗=1 𝑓𝑗/𝑖 (𝑦𝑗 − 𝑦̅∕𝑋=𝑥 ) = ∑𝑙𝑗=1 𝑓𝑗/𝑖 𝑦𝑗2 − (𝑦̅∕𝑋=𝑥 )2
Remarque :
Si 𝑋 et 𝑌 sont indépendantes alors ̅=𝒙
𝒙 ̅∕𝒀=𝒚 et ̅=𝒚
𝒚 ̅∕𝑿=𝒙
7
8