Vous êtes sur la page 1sur 4

Ce tableau représente les statistiques des étudiants des différentes filières d’une université selon leurs

cycles universitaires.
Cycle
Filiere
License Master Doctorat Total
Economie 7000 3000 1400 11400
Droit A 8000 3400 1200 12600
Droit F 5000 2000 1000 8000
Total 20000 8400 3600 32000
Dans cet exemple on a 2 variables qualitatives nominales, X : le Filière et Y : le cycle
 Par ces modalités on construit le tableau des fréquences.
En divisant les effectifs de chaque modalité (nij) par l’effectif total n f ij = nij / n avec i ligne et j
colonne
f i. ∑𝑖=1 𝑓 𝑖𝑗: la somme des fréquences de tous les colonne de ligne i
f .j = ∑𝑖=1 𝑓 𝑖𝑗 la somme des fréquences de tous les lignes de colonne j
on obtient :
Total
Filière/cycle License Master Doctorat (Poids de x)
Economie 0.21875 0.09375 0.04375 0.35625
Droit A 0.25 0.10625 0.0375 0.39375
Droit F 0.15625 0.0625 0.03125 0.25
Total
(Poids de y) 0.625 0.2625 0.1125 1

f 11= 7000/32000 : le fréquences des étudiants de licence en économie


f 2. = f 21 + f 22 + f 23 : le fréquences des étudiants de droit A de tous les cycle universitaire
ou le poids de droit A
f .2 = f 12 + f 22 + f 32 : le fréquences des étudiants de cycle Master de tous filières
ou le poids de master
 On note M la matrice associée au tableau des fréquences :
0.218 0.093 0.04
M= ( 0.25 0.106 0.037)
0.156 0.062 0.031
 Le nuage des points profils -ligne :
on calcule les fréquences par rapport à chaque ligne (non par rapport à N et total des modalité)
On peut les calculer par les fréquences ou les modalités.
Total
Filière/cycle Licence Master Doctorat
(Poids de x)
Economie 0.614035 0.263158 0.122807 0.35625
Droit A 0.634921 0.269841 0.095238 0.39375
Droit F 0.625 0.25 0.125 0.25
Profil moyen
f .j 0.625 0.2625 0.1125
(𝟏)
𝒇𝟏 : le fréquence des étudiants en licence en économie par rapport à tous les étudiants du filière économie.
Ou le profil ligne économie licence
(2)
𝑓3 : le fréquence des étudiants de doctorat en droit A par rapport à tous les étudiants du filière droit A .
Ou le profil ligne Droit A
 Le nuage des points (profils-colonnes) :
Profil moyen
Filiere/cycle Licence Master Doctorat f i.
Economie 0.35 0.357143 0.388889 0.35625
Droit A 0.4 0.404762 0.333333 0.39375
Droit F 0.25 0.238095 0.277778 0.25
Total
(Poids de y) 0.625 0.2625 0.1125
𝟏
𝒇(𝟏) : le fréquence des étudiants en licence économie par rapport à tous les des étudiants de Licence .
Ou le profil colonne licence économie
2
𝑓(3) : le fréquence des étudiants en doctorat économie par rapport à tous les des étudiants de doctorat .
Ou le profil colonne doctorat économie
 RESSEMBLANCE ENTRE PROFILS : DISTANCE DU 𝝌𝟐
On calculer la distance entre deux points 𝑓 (𝑎) et𝑓 (𝑏) c’est la métrique de Khi-deux
On peut la pour les lignes et pour les colonnes
(𝒂) (𝒃) 𝟐
(𝒇𝒋 −𝒇𝒋 )
d𝝌𝟐 (profil-ligne a , profil-ligne b) = ∑𝒋
𝒇.𝒋
𝟐
(𝒇𝒊(𝒂) −𝒇𝒊(𝒂) )
d𝝌𝟐 (profil-colonne a , profil-colonne b) = ∑𝒊 𝒇𝒊.

Par exemple la distance entre le profil ligne économie et droit A ( ligne 1 et 2)


(𝟏) (𝟐) 𝟐
(𝒇𝒋 −𝒇𝒋 )
 d𝝌𝟐 ( 𝒇(𝟏) , 𝒇(𝟐) ) = ∑𝒋
𝒇. 𝒋
2 2 2
( 𝟏) ( 𝟐) ( 𝟏) ( 𝟐) ( 𝟏) 𝟐)
(
𝒇𝟏 −𝒇𝟏
( ) ( 𝒇𝟏 −𝒇𝟏 ) (𝒇𝟏 −𝒇𝟏 )

=
𝒇.𝟏
+ 𝒇.𝟐
+
𝒇.𝟐
(𝟎.𝟔𝟏𝟒−𝟎.𝟔𝟑𝟒)𝟐 (𝟎.𝟐𝟔𝟑−𝟎.𝟐𝟔𝟗)𝟐 (𝟎.𝟏𝟐𝟐−𝟎.𝟎𝟗𝟓)𝟐
= 𝟎.𝟔𝟐𝟓
+ 𝟎.𝟐𝟔𝟐
+ 𝟎.𝟏𝟏𝟐

−𝟑
= 7.28× 𝟏𝟎 =0,00728
Et on peut la calculer par la méthode du produit scalaire par la matrice diagonale Q= 𝑫𝒌 −𝟏 ou la
matrice inverse de la matrice diagonale des poids de y
𝟎. 𝟔𝟐𝟓 0 0 𝟏. 𝟔 0 0
−𝟏
𝑫𝒌 = ( 0 𝟎. 𝟐𝟔𝟐 0 ) 𝑫 𝒌 =( 0 𝟑. 𝟖𝟏𝟔 0 )
0 0 𝟎. 𝟏𝟏𝟐 0 0 𝟖. 𝟗𝟐𝟔

d𝝌𝟐 ( 𝒇(𝟏) , 𝒇(𝟐) )= ( 𝒇(𝟏) - 𝒇(𝟐) ) Q ( 𝒇(𝟏) - 𝒇(𝟐) )’


𝟏. 𝟔 0 0 (𝟎. 𝟔𝟏𝟒 − 𝟎. 𝟔𝟑𝟒)
d𝝌𝟐 = ( (0.614 − 0.634) (0.263 − 0.269) (0.122 − 0.095) ) ( 0 𝟑. 𝟖𝟏𝟔 0 ) ( (𝟎. 𝟐𝟔𝟑 − 𝟎. 𝟐𝟔𝟗))
0 0 𝟖. 𝟗𝟐𝟔 (𝟎. 𝟏𝟐𝟐 − 𝟎. 𝟎𝟗𝟓)

(𝟎. 𝟔𝟏𝟒 − 𝟎. 𝟔𝟑𝟒)


=( −0.032 0.022896 0.241002) ( (𝟎. 𝟐𝟔𝟑 − 𝟎. 𝟐𝟔𝟗))= 7.28× 𝟏𝟎−𝟑 =0,00728
(𝟎. 𝟏𝟐𝟐 − 𝟎. 𝟎𝟗𝟓)
la distance entre le profil colonne master et doctorat ( colonne 2 et 3)
𝟐
(𝒇𝒊(𝒂) −𝒇𝒊(𝒂) )
d𝝌𝟐 (𝒇(𝟐) , 𝒇(𝟑) ) = ∑𝒊
𝒇 𝒊.
𝟐 𝟐 𝟐
(𝒇𝟏(𝒂) −𝒇𝟏(𝒂) ) (𝒇𝟐(𝒂) −𝒇𝟐(𝒂) ) (𝒇𝟑(𝒂) −𝒇𝟑(𝒂) )
= 𝒇𝟏.
+ 𝒇𝟐.
+ 𝒇𝟑.
=(𝒇(𝟐) , 𝒇(𝟑) ) 𝐏 (𝒇(𝟐) , 𝒇(𝟑) ) ‘
0.356 0 0 −𝟏
avec P la matrice inverse de la matrice diagonale de poids de x P= ( 0 0.393 0 )
0 0 0.25.

(𝒊)
 On note N (I ) le nuage de points formé des profils-lignes pondérés : (𝒇𝒋 ; fi• ) c-a-d (profil ligne ; poids y)
𝒊
 N (j ) le nuage de points formé des profils-lignes pondérés : (𝒇(𝒋) ; f•j ) c-a-d (profil colonne ; poids x)

MÉTRIQUE DU χ2 ET INERTIE
Tests d’indépendance de χ2

 On décide de rejeter l’hypothèse d’indépendance si la χ2est grande (plus


grande qu’un seuil calculé à l’aide de la table statistique de χ2 pour un
risque donné apriori).
 L'inertie n’est autre que la somme pondérée de la distance
de χ2 entre chaque profil et le profil moyen.
dans ce cours, on ne développera pas cette théorie, on se contentera des résultats
donnés par le logiciel spss

Vous aimerez peut-être aussi