Vous êtes sur la page 1sur 7

Chapitre-II : Séries statistiques à deux variables

• L’étude statistique d’une population peut se porter simultanément sur deux variables 𝑋, 𝑌
• Les deux variables 𝑋, 𝑌 peuvent être de nature différentes (continue-discrète, continue-continue,
qualitative-discrète, …, etc.).

I. Tableau de contingence des effectifs

• Exemple :
Titre : Répartition des salariés d’une entreprise en fonction de l’âge et du salaire

Y : Salaires
(1000 Dh)
y1 y2 y3 5 salariés sont âgés de
Totaux 25 à 30 ans
3 salariés sont 3-4 4-5 5-6
X : Age
âgés de 30 à 35
ans et gagnent
(ans)
entre 4 et 5 x1 20-25 3 1 0 4
milles Dh
x2 25-30 2 3 0 5 Il y’a 16 salariés

x3 30-35 1 5 1 7 dans l’entreprise

Totaux 6 9 1 16

9 salariés gagnent
entre 4 ET 5 milles
Dh

1

II. Tableau de contingence des fréquences

• Exemple :
Titre : Répartition des salariés d’une entreprise en fonction de l’âge et du salaire

Salaires Y
(mille Dh)
y1 y2 y3 31,25% des salariés
Totaux sont âgés de 25 à 30
18,75% des 3-4 4-5 5-6
Age X ans
salariés sont
âgés de 30 à 35
(ans)
ans gagnent x1 20-25 18,75% 6,25% 0,00% 25,00%
entre 4 e 5
x2 25-30 12,50% 18,75% 0,00% 31,25%
milles Dh
x3 30-35 6,25% 31,25% 6,25% 43,75%
Totaux 37,50% 56,25% 6,25% 100,00%

56,25% des salariés

gagnent entre 4 et 5
milles Dh

III. Distributions marginales


• Définition : On appelle distribution marginale de X, la distribution à une dimension des observations
relatives à la variable X indépendamment des observations relatives à la variable Y. Elle correspond aux
effectifs et fréquences de la dernière colonne du tableau de contingence des effectifs et des fréquences.
• Exemple : la distribution marginale de l’âge (variable X) est

2

Age (ans) Effectif Fréquence

x1 20-25 4 25,00%
x2 25-30 5 31,25%
x3 30-35 7 43,75%
Total 16 100,00%
• Interprétation :
§ 4 salariés sont âgés de 20 à 35 ans ce qui correspond à 25,00% des salariés.
§ 31,25% des salariés sont âgés de 25 à 30 ans.
§ 43,75% des salariés sont âgés de 30 à 35 ans.
§ ….
• Moyenne, variance et écart type marginaux de la variable X:
• La moyenne marginale de l’âge (variable X) est:
𝜇! = 0,25×22,5 + 0,3125×27,5 + 0,4375×32,5 = 28,4375
l’âge moyen des salariés est 28,44 ans.
• La variance marginale de l’âge (variable X) est:
𝑉! = 𝜎!! = 0,25×22, 5! + 0,3125×27, 5! + 0,4375×32, 5! − 28, 4375! ≈ 16,31

• L’écart type marginale de l’âge (variable X) est:

𝜎! ≈ 16,31 ≈ 4,04 𝑎𝑛𝑠


• Définition : On appelle distribution marginale de Y, la distribution à une dimension des observations
relatives à la variable Y indépendamment des observations relatives à la variable X. Elle correspond aux
effectifs-fréquences de la dernière ligne du tableau de contingence des effectifs-fréquences.
• Exemple : la distribution marginale du salaire (variable Y) est
y1 y2 y3 Total
Salaire (Dh)
3-4 4-5 5-6

Effectif 6 9 1 16

Fréquence 37,50% 56,25% 6,25% 100,00%

• Interprétation :
§ 6 salariés gagnent entre 3 et 4 milles Dh ce qui correspond à 37,50% des salariés.
§ 31,25% des salariés sont âgés de 25 à 30 ans.
§ 43,75% des salariés sont âgés de 30 à 35 ans.
3

§ ….
§ Moyenne, variance et écart type marginaux de la variable Y:
Sur la distribution marginale de Y on peut faire toute l’étude vue au chapitres précédents
(représentation graphique, paramètres de tendance centrale, de dispersion, …etc.).
• La moyenne marginale de la variable Y (salaire) est:
𝜇! = 0,3750×3500 + 0,5625×4500 + 0,6250×5500 = 4187,5
le salaire moyen des salariés est 28,44 ans.
• La variance marginale de la variable Y (salaire) est:
𝑉! = 𝜎!! = 0,3750×3500! + 0,5625×4500! + 0,6250×5500! − 4187, 5!
= 339843,75

• L’écart type marginale de la variable Y (salaire) est:

𝜎! ≈ 339843,75 ≈ 582,961191 Dh

IV. Distributions Conditionnelles


§ Définition : On appelle la distribution conditionnelle de X sachant que Y=yj, la distribution de la
variable X si la variable Y prend la valeur yj.
§ Elle correspond aux effectifs de la j-ièmme colonne du tableau de contingence des effectifs.

§ : Notez que contrairement à ce qui se produit pour les effectifs, le tableau des fréquences ne
correspond pas à une colonne du tableau des fréquences à double entrée.
§ Fréquence conditionnelle : La fréquence de la valeur xi sachant que Y=yj est définie par :
𝑛!"
𝑓 𝑥! 𝑌 = 𝑦! =
𝑛•!

§ Exemple : la distribution conditionnelle de l’âge (variable X) sachant que le salaire est compris
entre 4000 et 5000 dirhams (Y=y2)
§ Interprétation :
• Parmi les salariés qui gagnent entre 4000 et 5000 dirhams, 11,11% sont âgés de 20 à 25 ans.
• Parmi les salariés qui gagnent entre 4000 et 5000 dirhams, 33,33% sont âgés de 25 à 30 ans.
• Parmi les salariés qui gagnent entre 4000 et 5000 dirhams, 55,56% sont âgés de 30 à 35 ans.

4

Age (ans) Fréquence
Effectif
conditionnelle

𝑓(𝑥! |𝑌 = 𝑦! )
x1 20-25 1
1/9 =11,11%
𝑓(𝑥! |𝑌 = 𝑦! )
x2 25-30 3
3/9=33,33%
𝑓(𝑥! |𝑌 = 𝑦! )
x3 30-35 5
5/9=55,56%
Total 9 100,00%
§

§ Moyenne, variance et écart type conditionnelle de X sachant que Y=yj:


• la moyenne conditionnelle de l’âge (variable X) sachant que le salaire est compris entre
4000 et 5000 dirhams (Y=y2) est
𝜇(𝑋|𝑌 = 𝑦! ) =
L’âge moyen des salariés qui gagnent entre 4000 et 5000 dirhams est : …. ans.
• La variance conditionnelle de l’âge (variable X) sachant que le salaire est compris entre
4000 et 5000 dirhams (Y=y2) est
𝑉(𝑋|𝑌 = 𝑦! ) = 𝜎(𝑋|𝑌 = 𝑦! )! =

• L’écart type conditionnelle de l’âge (variable X) sachant que le salaire est compris entre
4000 et 5000 dirhams (Y=y2) est

𝜎(𝑋|𝑌 = 𝑦! ) ≈                      ≈

§ Définition : On appelle la distribution conditionnelle de Y sachant que X=xi, la distribution de la


variable Y si la variable X prend la valeur xj.
§ Elle correspond aux effectifs (attention pas aux fréquences) de la i-ièmme ligne du tableau de
contingence des effectifs.

§ : Notez que contrairement à ce qui se produit pour les effectifs, le tableau des fréquences ne
correspond pas à une ligne du tableau des fréquences à double entrée.
§ Fréquence conditionnelle : La fréquence de la valeur yj sachant que X=xi est définie par :
𝑛!"
𝑓(𝑦! |𝑋 = 𝑥! ) =
𝑛!•

5

§ La distribution conditionnelle du salaire (variable Y) sachant que l’âge est compris entre 25 et 30
ans (X=x2):
y1 y2 y3 Total
Salaire (Dh)
3-4 4-5 5-6

Effectif 2 3 0 5

Fréquence 𝑓(𝑦! |𝑋 = 𝑥! ) 𝑓(𝑦! |𝑋 = 𝑥! ) 𝑓(𝑦! |𝑋 = 𝑥! )


100,00%
Conditionnelle 2/5=40% 3/5=60% 0/5=0%
§ Interprétation :
• Parmi les salariés qui sont âgés de 25 à 30 ans, 40% gagnent entre 3000 et 4000 Dh.
• Parmi les salariés qui sont âgés de 25 à 30 ans, 60% gagnent entre 4000 et 5000 Dh.
• Parmi les salariés qui sont âgés de 25 à 30 ans, 3 salariés gagnent entre 4000 et 5000 Dh.
§ Moyenne, variance et écart type conditionnelle de Y sachant que X=xj:
• la moyenne conditionnelle du salaire (variable Y) sachant que l’âge est compris entre 25 et
30ans (X=x2) est
𝜇(𝑌|𝑋 = 𝑥! ) =
Le salaire moyen des salariés qui sont âgés entre 25 et 30 ans est : …. ans.
• La variance conditionnelle du salaire (variable Y) sachant que l’âge est compris entre 25 et
30 ans (X=x2) est
𝑉(𝑌|𝑋 = 𝑥! ) = 𝜎(𝑌|𝑋 = 𝑥! )! =

• L’écart type conditionnelle du salaire (variable Y) sachant que l’âge est compris entre 25 et
30ans (X=x2) est
𝜎(𝑌|𝑋 = 𝑥! ) =

V. Indépendance et tableau de contingence


• La variable Y est totalement indépendante de la variable X si les variations de X n’entrainent pas de


variations de Y.
• La variable X est totalement indépendante de la variable Y si les variations de Y n’entrainent pas de
variations de X.
• L’indépendance est réciproque.
• Les variables X et Y sont indépendantes si et seulement si


6

𝑓! ⋅ %×𝑓⋅! % 𝑛! ⋅ ×𝑛⋅!
𝑓!" = 𝑓! ⋅ ×𝑓⋅! 𝑓!" % = 𝑛!" =
100 𝑛
• Dans ce cas les lignes (resp. colonnes) du tableau de contingence sont proportionnelles entre elles.
• Exemple : tableau associé à deux variables indépendantes

VI. Mesure de l’indépendance entre deux variables : 𝝌𝟐 et Coefficient de


Cramer
• Le 𝜒 ! est un nombre mesurant l’écart entre la situation observée et la situation si les variables avaient
été théoriquement indépendantes.

! !
!
(𝑛!" − 𝑛!! )
𝜒 = ∑∑ !
𝑛!"
avec
!
𝑛!• ×𝑛•!
𝑛!" =
𝑛

0 ≤ 𝜒 ! ≤ 𝜒!"#
!
= 𝑛×min (𝐼 − 1, 𝐽 − 1)
• Le coefficient de Cramer C ∈ [0, 1] est défini par :

𝜒2
𝐶=
𝜒2max

C proche de 0 : les deux variable sont presque indépendants


C proche de 1 : les deux variables sont fortement liées.
• Méthodologie :
Avec Emploie Sans Emploie Total

Droitier 62 (61.6) 26 (26.4) 88

Gaucher 8 (8.4) 4 (3.6) 12

Total 70 30 100

Vous aimerez peut-être aussi