Académique Documents
Professionnel Documents
Culture Documents
Rmi Bachelet
La version jour de ce cours danalyse factorielle des composantes est disponible http://rb.ec-lille.fr
aot 10
1. Comprendre les fondements de lAnalyse Factorielle des Correspondances 2. Savoir quel est le processus de calcul et ses logiques 3. Pouvoir expliquer le mapping produit par une AFC 4. galement :
Connatre quelques logiciels dadministration denqutes et de traitement de donnes Avoir des lments de comparaison AFC ACP (ACP = Analyse en Composantes
Principales).
aot 10
Chapitre 1/4
aot 10
Pourquoi factorielle ? Il sagit de dcomposer le tableau original en une somme de tableaux/matrices qui sont chacun le produit de facteurs simples. Autrement dit, on les met en facteurs
aot 10
Principale source dinformations, et de lexemple utilis pour ce cours : Que sais-je ? L' analyse factorielle - N2095, Philippe CIBOIS, ed. PUF, puis, Utilisation ou copie interdites sans citation extrait disponible en ligne
universit 13 20 10 7 50
aot 10
0 1 0
0 2 1
2 24 2
7 0 0
Production Industrielle
5 0 5
1 1 1
2 0 0 0 0 2 1
1 0 0 5 0 11 6
0 3 1 0 0 0 3
1 2 1 0 3 0 0
0 0 0 4 1 0 0
1 1 2 4 5 2 2
10 0 2 1 1
aot 10
Recherche
6 0 1 6 1 0
21 Mc anique A vance 28 Gnie Civil 10 Matire,Energie et V ivant 11 Ondes, Nano-Electr onique, Tlcoms 7 Sys tmes Electriques et Electroniques 14 Sys tmes A utomatiss 10 Gnie des s ystmes de production 11 Gnie Informatique 14 Infor matique de Ges tion 11 Serv ices et Systmes Socio-Economiques 10 Sys tmes de Trans port et Logistiques Entr epreneuriat Amnagement, Construction, Envir onnement Production Industrielle Rec herche Ges tion - Audit Conception de Produits et Systmes Innov ants Logistique Commerc iale et Industrielle
aot 10
Chapitre 2/4
aot 10
Ce tableau est aussi une matrice, appellons-la T Quelle matrice aurait-on si la rpartition dans les filires post-Bac ne dpendait pas du type de Bac ?
aot 10
Utilisation ou copie interdites sans citation
10 = 50 * 20%
(produit matriciel /100 puisquon raisonne en %)
20 30 20 30
On reconstitue la matrice partir de ses marges
Utilisation ou copie interdites sans citation
50 10 40
Appellons cette matrice T0
aot 10
T T0 = R
13 2 5 10 2 8 3 0 -3
20
15
12
-1
-4
10 5 5 10 2 8
=
0 3 -3
22
15
12
-8
-2
10
R = T1 + T2
.. Chacune de ces matrices tant mise en facteur (le produit dun vecteur ligne et dun vecteur colonne).
T1 = C1L1
(une matrice dont la plus petite dimension est N rang N est dcomposable au maximum en N matrices pouvant se mettre en facteurs ici T = T0 + T1 + T2). T est de rang 3, mais R est de rang 2.
aot 10
Utilisation ou copie interdites sans citation
aot 10
T = CL
On met en facteur T comme le produit dune matrice colonne C par une matrice ligne L
T (2X2) C (1X2) L (2X1)
aot 10 Attention les rgles de prsentation du produit matriciel ne sont pas bien respectes dans nos diapos De plus, la multiplication des matrices n'est pas commutative (LC CL)
R = T1 + T2 = C1L1 + C2L2
3 0 -3 1 1 -2 1 2 -1 -1 1
-1
-4
-2
-2
-2
=
0 3 -3 2 2 -4 2
+
-2 1 1 -1
-8
-2
10
-4
-4
-4
-4
-2
1
Attention le sens de multiplication crit ici est LC au lieu de CL
-2
-1
-1
aot 10
Chapitre 3/4
aot 10
Un vecteur colonne (resp. ligne) correspond une modalit des donnes en colonnes (resp. lignes)
-1
-4
-2
-2
-2
=
0 3 -3 2 2 -4 2
+
-2 1 1 -1
-8
-2
10
-4
-4
-4
-4
-2
-2
-1
-1
aot 10
BDD
CE
-1
FGH
-2
Univ
CPGE
Autres
-1
-1
aot 10
1 CE
BDD
2
-1
1
CPGE
Univ. BDD
CE
FGH
-2
2
-4
1
Aut.
Univ
CPGE
-1
-1
1
-2
Autres
FGH
aot 10
A
Prpa
2. Opposition
Produit scalaire ngatif
Les Bacs A ne vont pas vers les autres (IUT, BTS)
3. Quadrature
Produit scalaire nul
Les bacs A ne vont ni plus ni moins vers les prpas que la moyenne des bacheliers Autres
aot 10
Chapitre 4/4
Optimisation de la factorisation
1. Le Chi-2 ( 2) comme mtrique
Degrs de libert
aot 10
aot 10
Note sur le
2
(R) =
(T1) +
(T2)
2491 = 1998 + 493 Attention considrer le 2 en proportion de la richesse en information le la matrice = de son nombre de ddl. partir des distributions marginales on peut obtenir plusieurs matrices Tn, mais pour chaque ligne et chaque colonne, la dernire case est impose par la contrainte du total marginal Dfinition :
On appelle degr de libert par ligne (ddll) le nombre de colonnes (de modalits) diminu de 1. On appelle degr de libert par colonne (ddlc) le nombre de lignes (de modalits) diminu de 1. Le degr de libert du khi-deux de la matrice est le produit ddll x ddlc = ddl. Pour une matrice donne, le
2
/ ddl
http://brassens.upmf-grenoble.fr/IMSS/MathSHS/SHS1/Stat1/Diapo/COURS9_fichiers/frame.htm
aot 10
(R) =
(T1) +
(T2)
Cette concentration de ce que lon appelle le pourcentage de la variance explique par un axe est particulirement intressante lorsque la taille du tableau de donnes augmente
2 (R)
2 (T ) 1
2 (T ) 2
2 (T
3)
2 (T ) 4
..
Pourquoi ? On ne peut que reprsenter que deux axes la fois sur un mapping autant reprsenter les plus significatifs.
aot 10
Utilisation ou copie interdites sans citation
Univ ersit
BDD'
Pour relativiser leur importance, les axes sont dilats proportionnellement au 2 quils expriment
aot 10
0 1 0
0 2 1
2 24 2
7 0 0
Production Industrielle
5 0 5
1 1 1
2 0 0 0 0 2 1
1 0 0 5 0 11 6
0 3 1 0 0 0 3
1 2 1 0 3 0 0
0 0 0 4 1 0 0
1 1 2 4 5 2 2
10 0 2 1 1
aot 10
Recherche
6 0 1 6 1 0
En treprenariat
Lo gistique Commerciale et Indust rielle Matire,Energie et Vivant Axe 1 (34.4%) Gnie Civil Product ion Indu st rielle
Premiers choix de gnie / filire des 147 G2 en 2003 aot 10 Utilisation ou copie interdites sans citation
Ctait les deux premiers axes = 62% de la variance explique On peut aussi regarder laxe 3.. = 18%
Ax 3 (18.0%) e Entrepreneuriat Ondes, Nano-Electronique, Tlcoms Sy stmes Automatiss
Informatique de Gestion
Recherche
Gnie Informatique
Mcanique Avance
Production Industrielle
aot 10
Conclusion
1. Mise en uvre logicielle
Sphinx, SPSS, SAS
2. Gnralisation de lAFC
Comparaison avec lAnalyse en Composantes Principales (ACP) Gnralisation de lAFC Pour approfondir
aot 10
aot 10
aot 10
aot 10
Gnralisations de lAFC
Les catgories des questionnaires sont souvent mutuellement exclusives :
Sexe : H ou F Politique : gauche, centre, droite Tableau disjonctif
Aux croisements de plus de deux caractristiques : Analyse des Composantes Multiples (ACM)
Bac X Orientation X sexe Tableau de Burt
aot 10
AFC
Donnes Catgorielles
ACP
Mtriques
Dcomposition T - T0 = T1 + T2 T = T1 + T2 + T3
Mtrique
pondr
Attention, le poids des cellules faible effectif10 renforc aot est Utilisation ou copie interdites sans citation
.. Mais alors ?
.. Alors on traite les donnes numriques, les nombres comme des catgories Si par exemple on travaille sur des notes, 18/20 nest plus suprieur 10/20, il nest pas non plus plus proche de 16/20 que de 10/20.
aot 10
aot 10
Analyse factorielle des correspondances dans Wikipdia Leon Analyse factorielle des correspondances du CNAM
aot 10
aot 10
aot 10
Rmi BACHELET
Mes principaux cours Centrale Gestion de projet, sociologie des organisations, recueil, analyse et traitement de donnes, prvention du plagiat, module de marchs financiers, cours de qualit et mthodes de rsolution de problmes, tablir des cartes conceptuelles, utiliser Wikipdia et CentraleWiki, formation au coaching pdagogique et l'encadrement aot 10
Utilisation ou copie interdites sans citation
aot 10