Vous êtes sur la page 1sur 28

Analyse de donnes - analyse factorielle des correspondances, classification hirarchique et analyse en composantes principales

Sommaire
Introduction.................................................................................................................................2 1. Lanalyse factorielle des correspondances......................................................................3 1.1.Tableau des valeurs propres .........................................................................................3 1.2. Interprtations des axes 1 et 2 .....................................................................................3 1.3. Interprtations des axes 3 et 4 .....................................................................................5 2. La classification hirarchique..........................................................................................6 2.1. La procdure RECIP/SEMIS ......................................................................................7 2.2. La procdure PARTI/DECLA ....................................................................................8 2.2.1. Recherche de la meilleure partition.....................................................................8 2.2.2. Ralisation de la coupure en 4 classes.................................................................9 2.2.3. Interprtations....................................................................................................11 3. Lanalyse en composantes principales..........................................................................14 3.1. Statistiques lmentaires............................................................................................14 3.2. Matrice des corrlations.............................................................................................14 3.3. Tableau des valeurs propres ......................................................................................14 3.4. Interprtation des 2 premiers facteurs ......................................................................15 3.4.1. Cercle des corrlations.......................................................................................15 3.4.2. Reprsentation des individus..............................................................................16 3.5. Interprtation du 3e facteur ......................................................................................18 3.5.1. Cercle des corrlations.......................................................................................18 3.5.2. Reprsentation des individus..............................................................................18 3.6. Examen des 3 aides linterprtation........................................................................19 3.6.1. Distance lorigine............................................................................................20 3.6.2. Contributions des individus................................................................................20 3.6.3. Qualit de reprsentation des individus.............................................................20 Conclusion................................................................................................................................21

Introduction
2

Le tableau de donnes dcrit le nombre dtudiants inscrits dans lenseignement suprieur selon les acadmies de la France mtropolitaine et les diffrents types dtablissements au cours de lanne 2007-2008 (cf. Annexe 1). Ainsi, au cours de cette priode, 2 229 075 tudiants sont rpartis dans 26 acadmies et dans 8 tablissements denseignement suprieur. Quelques remarques sur certains tablissements : STS : Sections de Techniciens Suprieurs CPCGE : Classes Prparatoires aux Concours des Grandes coles coles de commerce : concerne aussi les coles de comptabilit, de vente et de gestion. Autres : INP, universits de technologie, formations comptables, coles normales suprieures, facults prives, coles juridiques et administratives, coles suprieures artistiques et culturelles, coles paramdicales et sociales, prparations intgres. Afin d'tudier les diffrentes relations entre les deux ensembles de donnes, les acadmies dune part et les tablissements denseignement suprieur dautre part, nous ralisons successivement trois types danalyse de donnes : lanalyse factorielle des correspondances, la classification hirarchique et lanalyse en composantes principales.

1. Lanalyse factorielle des correspondances.


1.1.Tableau des valeurs propres
Valeur propre 0,0318 0,0110 0,0091 0,0050 0,0014 0,0009 0,0005 Pourcentage cumul 53,23 71,64 86,88 95,29 97,68 99,14 100,00

Numro 1 2 3 4 5 6 7

Pourcentage 53,23 18,40 15,24 8,42 2,39 1,46 0,86

Au vu du tableau des valeurs propres et des pourcentages de la variance explique, nous retenons uniquement les 4 premiers axes puisque ces derniers expliquent 95 % de la variance totale. 1.2. Interprtations des axes 1 et 2 3

Pour une meilleure interprtation de lanalyse factorielle des correspondances, il est ncessaire de connatre les effectifs thoriques afin de mieux dcrire les liens entre les 2 variables qualitatives (cf. Annexe 1). Il est utile aussi de se rfrer aux contributions et cosinus carrs des individus et des variables (cf. Annexe 2).

Analyse du 1er facteur (pourcentage de la variance explique 53.23 %) : Concernant les acadmies, Paris contribuent trs fortement au 1er axe (quasiment 75 %). Elle soppose aux 3 autres modalits (Limoges, Orlans et Caen) qui contribuent nettement plus faiblement cet axe. Concernant les tablissements denseignement, la modalit Autres contribue assez fortement au 1er axe (42 %) et dans une moindre mesure, IUT , STS et coles de commerce . Au niveau de la disposition, Autres et coles de commerce sont opposes STS et IUT . Ainsi, tout ceci se traduit de la manire suivante : - Il existe une surreprsentation de lacadmie de Paris dans les tablissements denseignement autres . Cela se confirme au vu de la comparaison entre les effectifs observs et thoriques. En effet, leffectif observ est de 75 235 qui est suprieur leffectif thorique valant 42 107. - linverse, lacadmie de Paris est sous-reprsente dans les IUT et STS. Les effectifs observs sont bien infrieurs aux effectifs thoriques. - Les acadmies de Limoges, Orlans et Caen sont quant elles sousreprsentes dans les coles de commerce et dans les tablissements autres . - linverse, elles sont surreprsentes dans les IUT et STS. noter que lacadmie de Clermont, qui ne contribue quasiment pas la formation de laxe 1, est bien reprsente sur cet axe (son cosinus carr vaut 0.84). Ainsi, les

tudiants de cette acadmie sont dune part, surreprsents dans les IUT et les STS et dautre part, sous-reprsents dans les tablissements autres . De mme , les tablissements CPCGE et IUFM contribuent trs peu la variance de laxe, mais sont bien reprsents sur ce 1er axe (respectivement 0.62 et 0.56 aux cosinus carrs). Ainsi, les tudiants de lacadmie de Paris sont trs prsents dans les CPCGE, mais sont sous-reprsents dans les IUFM. Analyse du 2e facteur (pourcentage de la variance explique 18.40 %) : propos des tablissements denseignement, cet axe oppose les coles dingnieurs et les universits qui contribuent, eux deux, plus de 60 % la formation de cet axe. Pour les acadmies, Amiens contribue assez fortement cet axe et dans une moindre mesure Nantes, sopposent toutes les deux Aix-Marseille. Ainsi, les acadmies dAmiens et de Nantes sont surreprsentes dans les coles dingnieurs alors que lacadmie dAix-Marseille est sous-reprsente. linverse, les tudiants de lacadmie dAix-Marseille ont tendance aller plus luniversit plutt que dans des coles dingnieurs. Bien que les acadmies de Bordeaux et de Besanon contribuent peu la variance de laxe 2, leur reprsentation graphique est bonne. En effet, la valeur aux cosinus carrs vaut respectivement 0.74 et 0.68. Ainsi, les tudiants de lacadmie de Bordeaux sont surreprsents dans les universits et sous-reprsents en coles dingnieurs. Inversement, lacadmie de Besanon est surreprsente dans les coles dingnieurs et sous-reprsente dans les universits. 1.3. Interprtations des axes 3 et 4

Analyse du 3e facteur (pourcentage de la variance explique 18.40 %) :

Laxe 3 est constitu principalement des coles de commerce concernant les tablissements denseignement et de Reims, Versailles et Crteil concernant les acadmies. Cela se traduit par une surreprsentation (respectivement sous-reprsentation) des acadmies de Reims et Versailles (respectivement Crteil) dans les coles de commerce. Bien que la contribution la variance de laxe 3 soit faible pour la modalit coles dingnieurs , cette dernire est bien reprsente sur cet axe (la valeur du cosinus carr vaut 0.53). Ainsi, lacadmie de Versailles est surreprsente dans ce type dtablissement denseignement (leffectif observ vaut 11 321 alors que leffectif thorique vaut 8 139). Inversement, lacadmie de Crteil est sous-reprsente dans les coles dingnieurs (leffectif observ vaut 5 024 alors que leffectif thorique vaut 6 029). De mme, lacadmie de Rouen est bien reprsente sur cet axe (la valeur du cosinus carr vaut 0.62). Sa position traduit une surreprsentation dans les coles dingnieurs et dans les coles de commerce. Analyse du 4e facteur (pourcentage de la variance explique 8.42 %) : Bien que lintrt de cet axe soit marginal, nous avons quand mme des interprtations utiles. Effectivement, propos des tablissements denseignement, cet axe oppose les IUT aux coles dingnieurs. Concernant les acadmies, il oppose Grenoble Versailles et Lyon. Ainsi, lacadmie de Grenoble est surreprsente dans les IUT et sous-reprsente dans les coles dingnieurs (1 519 observs, 4 099 en thorie) linverse, les acadmies de Versailles et de Lyon sont surreprsentes dans les coles dingnieurs et sous-reprsentes dans les IUT.

2. La classification hirarchique
Cette mthode permet aussi de prsenter les proximits entre les individus (cest-dire les acadmies) en procdant de cette manire : - regroupement en classes de 2 individus les plus proches - regroupement par 2 des classes les plus proches - ritration de ltape prcdente jusqu obtenir une unique classe Remarque : la distance euclidienne usuelle sera utilise pour calculer les ressemblances entre les individus. Le critre de Ward sera utilis pour calculer lcart entre deux sous-ensembles disjoints. Pour effectuer cette classification, nous utilisons 2 types de procdure : 1) RECIP/SEMIS qui permet de choisir les niveaux de coupure de larbre hirarchique (aussi appel dendrogramme). 2) PARTI-DECLA qui permet dobtenir une ou plusieurs partitions des individus. Cette procdure propose aussi la description statistique des partitions choisies. 6

2.1. La procdure RECIP/SEMIS Les regroupements successifs sont dcrits dans le tableau suivant : Numro 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 Somme des indices de niveau Nb d'lments Ain Benjamin terminaux du noeud 5 18 2 14 1 2 8 7 2 22 6 2 9 20 2 12 27 3 15 3 2 4 28 3 29 24 3 13 25 2 11 30 3 23 31 3 33 37 5 38 17 4 2 16 2 35 32 6 10 40 5 26 21 2 41 39 7 44 36 4 43 34 8 42 47 14 46 49 19 45 48 50 11 25 26 Poids du Indice de noeud niveau 95412,00 192134,00 129189,00 151483,00 87094,00 117475,00 113990,00 297688,00 196675,00 266051,00 307434,00 136278,00 421424,00 188784,00 151468,00 314150,00 272833,00 207548,00 572892,00 473599,00 570521,00 884671,00 1046490,0 0 1931160,0 0 2229080,0 0 0,00008 0,00011 0,00012 0,00012 0,00013 0,00014 0,00016 0,00020 0,00022 0,00029 0,00038 0,00052 0,00073 0,00074 0,00082 0,00101 0,00123 0,00157 0,00174 0,00232 0,00255 0,00323 0,00503 0,00813 0,02826 0,05982

Lecture : - le nud 27 rsulte du regroupement du nud 5 (Caen) et du nud 18 (Orlans-Tours). Il est donc constitu de 2 lments. - le nud 32 rsulte du regroupement du nud 12 (Limoges) et du nud 27(cf. ci- dessus). Il est donc constitu de 1 + 2 lments soit 3 lments. partir de ces donnes, il est possible de construire le dendogramme suivant :

2.2. La procdure PARTI/DECLA La procdure PARTI/DECLA construit des partitions par coupure de larbre d'agrgation obtenu prcdemment avec la procdure RECIP/SEMIS. 2.2.1. Recherche de la meilleure partition 8

tudions dabord lhistogramme des indices de niveau :

Daprs ce graphique, nous remarquons des sauts pour une coupure en 4 classes (les 3 dernires barres) et pour une coupure en 3 classes (les 2 dernires barres). Cependant, il est difficile de choisir clairement le nombre de classes. C'est pourquoi nous nous rfrons SPAD qui peut dterminer les 3 meilleures rpartitions qui sont les suivantes : - 4 classes - 5 classes - 7 classes Nous choisissons donc une coupure en 4 classes. 2.2.2. Ralisation de la coupure en 4 classes Afin dobtenir le contenu de chacune des 4 classes, il suffit de couper le dendogramme de cette manire :

Coupure en 4 classes

Il en rsulte : Classe 1 (Effectif : 13)

N. B. Seuls les 10 premiers sont affichs Classe 2 (Effectif : 7)

Classe 3 (Effectif : 5)

10

Classe 4 (Effectif : 1)

RK (Rang) : rang de lindividu. Plus le rang de lindividu est grand, plus celui-ci se trouve loign du centre de gravit de sa classe. Distance : carr de la distance entre lindividu et le centre de gravit de sa classe. Graphiquement, nous obtenons :

2.2.3. Interprtations Pour interprter les diffrentes classes, nous nous intressons uniquement aux informations suivantes qui sont prsentes dans les tableaux de rsultats : - GLOBAL : pourcentage de la frquence dans lchantillon. Ici, il correspond la somme dtudiants inscrits dans un tablissement dans toutes les acadmies divises par le nombre total dtudiants.

11

Par exemple, le 54.99% pour les universits du tableau ci-dessous, sobtient en faisant la somme de tous les effectifs des tudiants en universits des 26 acadmies (1 225 717) diviss par le nombre total dtudiants en France (2 229 075). Logiquement, les pourcentages obtenus sont les mmes quelle que soit la classe. - FRE/CLA : pourcentage de la frquence dans la classe. Il sagit du mme type de calcul que prcdemment sauf quici, plutt que de prendre lensemble des tudiants franais, nous prenons uniquement ceux appartenant la classe tudie. Ainsi, par exemple, le 6.22% pour les IUT du tableau ci-dessous, sobtient en sommant tous les effectifs des tudiants en IUT des 13 acadmies qui forment la classe 1 divis par le nombre total dtudiants dans cette classe. Ainsi, les pourcentages obtenus dpendent directement de chaque classe. Classe 1 :

Les acadmies appartenant cette classe sont caractrises par un pourcentage important dtudiants luniversit (59.14%). Dans une moindre mesure, 10.77% des tudiants de cette classe sont inscrits en STS et 10.66% dans les autres tablissements. De plus, nous remarquons que les proportions dtudiants dans les universits, les IUT, les STS et les IUFM sont plus importantes que les proportions de lchantillon global. Par exemple, dans les acadmies de la classe 1, il y a 6.22% dtudiants en IUT alors que si nous prenons en compte tous les tudiants de la France mtropolitaine, seuls 5.18% sont inscrits en IUT. linverse, toujours par rapport la tendance gnrale, nous voyons que les acadmies de la classe 1 possdent des pourcentages moins levs dtudiants en CPCGE, en coles de commerce, en coles dingnieurs et dans les autres tablissements. Par exemple, nous comptons 4.88 % dtudiants en cole dingnieurs dans toute la France alors quil ny en a que 3.33% dans les acadmies de la classe 1. Classe 2 :

12

Dans les 7 acadmies prsentes dans cette classe, prs dun tudiant sur deux tudie luniversit. Par ailleurs, 14.75% tudient dans dautres tablissements et 12.45% dans les STS. Globalement, par rapport tous les tudiants franais, les tudiants des acadmies de la classe 2 sont plus prsents dans les tablissements suivants : STS, coles dingnieurs, IUT, Autres et IUFM. linverse, ils sont moins nombreux en CPCGE, universits et en coles de commerce. Par exemple, seulement 2.60% des tudiants des acadmies de la classe 2 sont inscrits en cole de commerce alors que le pourcentage vaut 4.29% pour lensemble des acadmies.

Classe 3 :

Dans cette classe, nous trouvons des pourcentages plus levs, compars la tendance gnrale, concernant le nombre dtudiants en coles dingnieurs, de commerce, en IUFM et CPCGE. En revanche, les pourcentages dtudiants en IUT, universits, STS et autres tablissements dans ces acadmies sont moins importants que ceux de lchantillon global. Classe 4

Cette classe, qui se rsume un seul individu (lacadmie de Paris), possde une similarit avec les autres classes dans la mesure o plus dun tudiant sur deux de 13

cette acadmie est inscrit en universit. En revanche, la particularit de cette classe est que plus de 25% des tudiants sont dans dautres tablissements (contre 14.13% pour lchantillon global). Cette acadmie contient aussi des pourcentages dtudiants en coles de commerce et CPCGE plus levs par rapport ceux qui prennent en compte toutes les Acadmies franaises. Inversement, lacadmie de Paris a des proportions dtudiants en universits, coles dingnieurs, IUFM, STS et IUT infrieurs celles observes dans toutes les acadmies. Par exemple, 0.72% des tudiants parisiens sont inscrits lIUT alors que sur lensemble des acadmies mtropolitaines, le pourcentage vaut 5.18 %.

3. Lanalyse en composantes principales


3.1. Statistiques lmentaires Libell de la variable Universits IUT IUFM STS CPCGE coles d'ingnieurs cole de commerce Autres Moyenne cartMinimum Maximum type 47143,00 32576,60 3689 156743 4440,50 2051,04 369 8349 2596,58 1441,46 258 6443 8616,35 4325,76 500 18304 2956,15 2788,36 102 14325 4181,27 3125,65 0 11321 3682,23 4194,95 66 20113 12117,60 13896,80 587 75235

3.2. Matrice des corrlations Universit s 1,00 0,47 0,82 0,86 0,94 0,77 0,85 0,89 IUT 1,00 0,72 0,73 0,28 0,61 0,15 0,16 IUFM STS CPCGE coles cole de Autres d'ingnieurs commerce

Universits IUT IUFM STS CPCGE coles d'ingnieur s cole de commerce Autres

1,00 0,87 0,72 0,82 0,64 0,57

1,00 0,75 0,79 0,62 0,68

1,00 0,73 0,94 0,96 1,00 0,65 0,63 1,00 0,88 1,00

Remarque : la trace de la matrice est gale 8 3.3. Tableau des valeurs propres Numro 1 2 Valeur propre 5,9754 1,3663 Pourcentag Pourcentage e cumul 74,69 74,69 17,08 91,77 14

3 4 5 6 7 8

0,2589 0,1783 0,1027 0,0717 0,0353 0,0115

3,24 2,23 1,28 0,90 0,44 0,14

95,01 97,24 98,52 99,42 99,86 100,00

Pour rsumer le tableau de dpart, nous nutilisons pas les rsultats de ces 8 tapes, mais uniquement les premires qui correspondent des variances expliques importantes. Nous remarquons d'une part que la variance explique par laxe 4 est faible : 2.23 %. Dautre part, les 3 premires tapes fournissent lessentiel de linformation soit 95.01 % de la variance totale. Ainsi, nous retenons uniquement les 3 premires tapes. 3.4. Interprtation des 2 premiers facteurs 3.4.1. Cercle des corrlations

Remarque : la premire composante (facteur 1) rsume 74.69% du tableau et la seconde (facteur 2) 17.08 % donc l'information fournie par ces 2 composantes est de 91.77%. Nous voyons que toutes les variables sont lies fortement et positivement laxe 1 (leur coordonne respective sur cet axe est suprieure 0.85 sauf pour la variable IUT o sa coordonne vaut 0.57). Concernant laxe 2, seule la variable IUT est lie fortement cet axe (0.72) Graphiquement, le regroupement de toutes les variables droite du cercle de corrlation signifie que toutes les variables sont corrles positivement entre elles. Cela se confirme dans les matrices des corrlations puisque les coefficients de corrlations sont tous strictement positifs. De plus, la majorit des variables sont 15

fortement corrles entre elles puisque la plupart des coefficients de corrlation sont proches de 1 : Exemple : R(Universits, CPCGE) = 0.94 ; R(STS, IUFM)=0.87 Toutefois, quelques variables sont significativement non corrles les unes par rapport aux autres. Par exemple, autres et IUT sont quasiment orthogonaux. L aussi, ceci se confirme dans la matrice de corrlation puisque : R (Autres, IUT) = 0.16 ; ou encore R(coles de commerce, IUT) = 0.15 3.4.2. Reprsentation des individus

16

Interprtation de laxe 1 :

Plusieurs groupes de pays se distinguent : - Le groupe, ou plutt lindividu, atypique : lacadmie de Paris (zone en rouge sur le graphique). Loriginalit de cette acadmie rside dans le fait quelle possde des effectifs dtudiants trs levs pour chacun des tablissements sauf pour les IUT. Exemple : 156 743 tudiants sont inscrits en universit alors que la moyenne par acadmie slve 47 143. - le groupe compos des acadmies de Lille, Versailles, Lyon, Toulouse et Nantes (reprsent en bleu) est caractris par un nombre important dtudiants dans tous les tablissements denseignement. - loppos, les acadmies de Corse, Limoges, Caen, Besanon, Clermont, Dijon, Reims et Poitiers, reprsentes en rose, possdent peu dtudiants dans tous les tablissements. Exemple : lacadmie de Corse compte seulement 3 689 tudiants en universit. - le groupe contenant les acadmies de Crteil et de Rennes (zone en verte). Ces acadmies possdent les mmes caractristiques que le 2e groupe la diffrence que le nombre dtudiants en cole de commerce dans ces acadmies est faible. Exemple : lacadmie de Crteil compte 1 318 tudiants en cole de commerce alors quen moyenne, il y en a 3 682 par acadmie. Interprtation de laxe 2 : Lintrt de cet axe est plutt marginal puisque les interprtations que nous allons obtenir vont rpter les explications pour laxe 1. En effet, puisque seule la variable IUT est intressante ici, en observant le graphique ci-dessus, il est facile de voir que les 2 groupes signals en vert et en bleu rassemblent des acadmies ayant un nombre important dtudiants en IUT. 17

linverse, le groupe en rose contient des acadmies possdant peu dtudiants en IUT. 3.5. Interprtation du 3e facteur 3.5.1. Cercle des corrlations

Remarque : la 3e composante (facteur 3) rsume 3.24% du tableau. Certes lintrt de cet axe est faible, mais nous allons quand mme voir quil apporte des informations plus dtailles concernant la variable coles dingnieurs (les autres variables sont proches du centre et donc toute interprtation est hasardeuse). 3.5.2. Reprsentation des individus

18

3 groupes sont visibles : - le groupe atypique form uniquement par lacadmie de Versailles (reprsent en bleu sur le graphique) se caractrise par un nombre trs lev dtudiants en cole dingnieurs. En effet, il y en a 11 321 tudiants ce qui constitue leffectif le plus lev parmi toutes les Acadmies franaises. - le groupe dlimit en vert comprenant les acadmies suivantes : Toulouse, Lyon, Nantes, Amiens et Nancy-Metz. Suite lanalyse du premier facteur, nous savons que pour ces 3 premires acadmies, les effectifs en coles de commerces sont levs. Mais grce lexamen de ce 3e facteur, nous pouvons y ajouter les acadmies dAmiens et de Nancy-Metz. Exemple : lacadmie de Nancy-Metz contient 5 814 tudiants en cole dingnieurs. - le 3e groupe (en rouge) compos de 3 acadmies (Grenoble, Aix-Marseille et Montpellier) est caractris par un faible nombre dtudiants dans ce type dtablissement. Exemple : lacadmie de Grenoble recense 1 519 tudiants en cole dingnieurs. 3.6. Examen des 3 aides linterprtation

19

3.6.1. Distance lorigine Cette colonne est un critre doriginalit . En effet, cela permet de trouver facilement quelles sont les acadmies les plus moyennes (cest--dire les plus proches du centre de gravit) et celles qui sont les plus originales (cest--dire les plus loignes du centre de gravit). Ainsi, nous retrouvons le fait que Paris soit clairement une acadmie atypique. Dans une moindre mesure, il y a les acadmies de Versailles, Lille, Corse et Lyon. 3.6.2. Contributions des individus Elles permettent de dtecter les acadmies qui contribuent le plus la formation des axes. Ainsi, les acadmies qui contribuent essentiellement la formation du premier axe sont : Paris (33.6 %), Versailles (13.1%), Corse (9%) et Lille (8.5%). Cela se retrouve bien sur le graphique de reprsentation des individus du facteur 1 (cf. 3.4.2) puisque ces 4 acadmies sont places aux extrmits de laxe 1 ( gauche comme droite). De la mme manire, les acadmies jouant un rle important dans la formation du 2nd axe sont : Paris (54.6%), Lille (10.2%) et Crteil (10%). Enfin, les acadmies de Versailles (21.3%), Grenoble (20.6%) et Lyon (15.6%) sont les principaux acteurs de la formation du 3e axe. 3.6.3. Qualit de reprsentation des individus Mis en vidence par le paramtre cosinus carrs , cela permet de reprer quelles acadmies sont bien expliques par un axe. La plupart des 26 acadmies sont bien reprsentes sur le 1er plan factoriel (axe 1 et 2) puisque la somme des cosinus carrs est suprieure 0.7). Seules celles de Grenoble, de Montpellier et dAix-Marseille sont mal reprsentes sur ce plan et se situent donc proches du centre. En revanche, elles sont bien reprsentes sur laxe 3.

20

Conclusion
Au terme de cette tude, nous avons effectu trois types danalyse de donnes : lanalyse factorielle des correspondances, la classification hirarchique et une analyse en composantes principales. Ces trois mthodes ont permis dobtenir plusieurs informations sur les effectifs dtudiants dans lenseignement suprieur au cours de lanne 2007-2008. Ces trois analyses prsentent des rsultats plus ou moins similaires. Cependant, nous avons pu voir que, dans le cadre de cette tude, lanalyse en composantes principales fournit moins dinformations prcises compares aux deux autres mthodes. Globalement, nous avons pu voir que les acadmies mtropolitaines prsentent des effectifs varis selon les types dtablissements. De plus, nous avons identifi plusieurs similitudes, mais aussi des disparits entrent certaines acadmies. Plus prcisment, nous pouvons retenir plusieurs lments intressants : - lacadmie de Paris possde un nombre trs lev dtudiants dans chaque type dtablissement (except pour les IUT). C'est pourquoi 13.3 % des tudiants franais mtropolitains font partie de cette acadmie. De plus, cette acadmie connat du succs pour les autres tablissements, les coles de commerce et les CPCGE. - dans une moindre mesure, les acadmies de Versailles, Lille, Lyon et Crteil prsentent aussi des effectifs importants en gnral et des caractristiques plus ou moins homognes selon les tablissements denseignement. Certaines dentre elles peuvent contenir un nombre particulirement important dtudiants dans un tablissement prcis. Cest le cas notamment de lacadmie de Versailles qui compte 12 083 tudiants en cole de commerce. - viennent ensuite les autres acadmies qui sinscrivent dans la moyenne cest--dire quelles possdent des effectifs proches de la moyenne pour chaque tablissement (Exemple : Nancy-Metz, Montpellier, Grenoble) - enfin, les acadmies restantes, telles que celles de la Corse, de Limoges et de Besanon, peuvent tre qualifies de petites acadmies puisquelles possdent des effectifs extrmement faibles.

21

Annexe 1 : Tableau de donnes


Effectifs de l'enseignement suprieur par acadmie en 2007-2008

22

Source : http://media.education.gouv.fr/file/2008/76/0/chap6-2_33760.pdf (p.2) Acadmies Universits IUT IUFM 3 168 2 000 1 360 3 176 1 406 1 312 258 4 312 1 523 2 220 6 047 727 3 982 2 758 2 651 2 840 1 918 2 438 4 380 1 654 1 512 2 588 1 874 2 151 2 813 6 443 3 091 1 298 1 037 3 197 1 131 1 310 169 3 744 1 263 2 546 4 723 668 4 620 2 728 2 415 3 289 1 590 1 759 9 023 1 375 1 231 3 278 1 490 2 044 3 438 5 055 STS 10 336 5 777 4 626 10 603 4 786 4 810 500 11 941 5 252 10 082 18 304 3 208 11 976 10 033 8 426 15 133 4 919 7 672 16 172 5 316 5 401 13 216 5 590 6 040 10 360 13 546 23 10 257 4 309 3 442 10 608 3 752 4 348 560 12 424 4 191 8 447 15 673 2 217 15 330 9 053 8 015 10 914 5 277 5 837 29 941 4 562 4 086 10 877 4 943 6 782 11 408 16 773 CPCGE 3 219 1 076 904 2 805 1 184 1 348 102 3 146 1 514 2 600 5 355 510 5 326 2 182 2 326 3 851 2 237 2 298 14 325 1 221 1 217 3 606 1 421 2 301 3 428 7 358 3 519 1 478 1 181 3 640 1 287 1 492 192 4 262 1 438 2 898 5 377 761 5 260 3 106 2 750 3 744 1 810 2 003 10 272 1 565 1 402 3 732 1 696 2 327 3 914 5 755 coles coles de Autres d'ingnieurs commerce 2 781 4 977 4 548 4 383 10 161 14 425 4 123 2 091 1 157 1 841 8 404 6 059 2 686 1 670 382 1 471 5 149 4 840 3 685 5 148 5 543 4 534 10 142 14 919 1 220 1 821 524 1 603 3 981 5 277 2 176 0 5 024 1 750 1 519 8 040 1 055 10 957 2 464 5 814 7 197 1 352 2 250 8 804 1 501 2 199 6 522 3 204 2 795 8 274 11 321 2 110 272 6 029 2 034 4 099 7 606 1 076 7 439 4 393 3 889 5 296 2 561 2 833 14 529 2 214 1 983 5 278 2 399 3 291 5 536 8 139 1 206 66 1 318 1 777 3 622 4 654 126 7 552 3 237 1 318 4 674 4 279 1 434 20 113 2 143 4 400 2 055 3 030 475 4 022 12 083 1 858 239 5 309 1 791 3 610 6 698 948 6 551 3 869 3 425 4 664 2 255 2 494 12 795 1 950 1 746 4 648 2 112 2 899 4 875 7 168 5 313 587 15 067 4 420 12 510 21 091 2 453 20 964 8 220 12 004 17 652 4 519 6 130 75 235 3 718 5 341 14 630 5 587 6 579 15 890 19 311 6 114 787 17 472 5 894 11 880 22 042 3 118 21 560 12 732 11 271 15 349 7 421 8 209 42 107 6 416 5 746 15 296 6 952 9 538 16 044 23 588

Aix-Marseille 63 634 56 119 4 210 5 286 Amiens 17 571 23 574 2 763 2 220 Besanon 16 623 18 830 2 514 1 774 Bordeaux 64 439 58 042 5 161 5 467 Caen 21 344 20 529 2 888 1 934 Clermont24 380 2 714 Ferrand 23 787 2 241 Corse 3 689 3 063 369 289 Crteil 74 461 67 975 8 349 6 403 Dijon 22 687 22 929 2 776 2 160 Grenoble 44 079 46 217 7 417 4 353 Lille 84 504 85 754 7 956 8 077 Limoges 12 187 12 132 1 797 1 143 Lyon 85 122 83 878 6 660 7 901 Montpellier 57 324 49 531 3 859 4 665 Nancy-Metz 41 766 43 850 5 441 4 130 Nantes 51 505 59 715 5 745 5 625 Nice 29 455 28 872 3 827 2 720 Orlans-Tours 31 278 31 936 4 579 3 008 Paris 156 743 163 815 2 141 15 430 Poitiers 26 668 24 962 3 174 2 351 Reims 17 582 22 356 3 005 2 106 Rennes 58 795 59 510 6 812 5 605 Rouen 24 574 27 045 3 904 2 547 Strasbourg 43 177 37 109 3 968 3 495 Toulouse 62 392 62 418 6 333 5 879 Versailles 89 738 91 770 7 091 8 644

Remarque : les nombres en rouge sont les effectifs thoriques que nous avons calculs.

24

Annexe 2
Contributions des frquences actives Libell de la variable Universits IUT IUFM STS CPCGE coles d'ingnieurs cole de commerce Autres Cosinus carrs des frquences actives Libell de la variable Universits IUT IUFM STS CPCGE coles d'ingnieurs cole de commerce Autres Poids relatif Distance Axe 1 l'origine 54,99 0,00785 0,10 5,18 0,17386 0,77 3,03 0,07274 0,56 10,05 0,06292 0,61 3,45 0,04695 0,62 4,88 0,15534 0,04 4,29 0,27322 0,39 14,13 0,12060 0,79 Axe 2 0,63 0,04 0,01 0,11 0,00 0,56 0,07 0,13 Axe 3 0,17 0,02 0,11 0,01 0,03 0,10 0,53 0,06 Axe 4 0,10 0,09 0,00 0,16 0,00 0,30 0,01 0,02 Poids relatif Distance Axe 1 l'origine 54,99 0,00785 1,30 5,18 0,17386 21,88 3,03 0,07274 3,87 10,05 0,06292 12,10 3,45 0,04695 3,18 4,88 0,15534 0,90 4,29 0,27322 14,43 14,13 0,12060 42,34 Axe 2 24,76 3,14 0,11 6,48 0,05 38,29 7,53 19,64 Axe 3 7,96 1,64 2,65 0,61 0,49 8,65 67,60 10,41 Axe 4 8,58 16,05 0,04 19,84 0,02 44,96 2,31 8,19

Contributions des individus actifs Distance Identificateu Poids r relatif l'origine Aix-Marseille 4,58 0,03419 Amiens 1,92 0,13498 Besanon 1,54 0,07547 Bordeaux 4,74 0,02922 Caen 1,67 0,05643 Clermont 1,94 0,01187 Corse 0,25 0,12463 Crteil 5,55 0,04131 Dijon 1,87 0,02189 Grenoble 3,77 0,05118 Lille 7,00 0,00976 Limoges 0,99 0,07977 Lyon 6,84 0,01881

Axe 1 0,42 0,04 1,03 0,64 2,18 0,61 0,22 3,38 0,87 0,50 0,82 1,86 0,35 25

Axe 2 11,76 21,89 7,16 9,28 0,05 0,02 0,96 0,37 0,09 0,09 0,91 0,45 0,27

Axe 3 0,21 0,24 0,32 0,48 1,41 0,33 0,95 10,82 0,38 0,12 0,62 1,05 1,40

Axe 4 0,12 0,04 0,01 0,18 1,92 0,00 0,20 0,16 1,20 30,34 0,00 0,90 18,35

Montpellier Nancy-Metz Nantes Nice Orlans Paris Poitiers Reims Rennes Rouen Strasbourg Toulouse Versailles

4,04 3,58 4,87 2,36 2,61 13,36 2,04 1,82 4,86 2,21 3,03 5,09 7,49

0,04769 0,03663 0,03549 0,07955 0,04844 0,18319 0,04505 0,14758 0,02485 0,04297 0,06168 0,01595 0,04292

1,46 0,85 0,00 0,20 2,89 74,91 1,72 0,04 1,50 0,67 2,34 0,08 0,44

9,96 7,23 10,74 6,70 0,02 0,30 2,46 0,27 3,27 0,64 2,13 2,35 0,61

1,21 1,38 0,89 8,80 0,06 5,36 0,56 23,73 2,37 6,41 7,10 0,01 23,80

0,12 1,09 2,41 2,84 3,70 2,03 0,85 8,65 0,01 0,38 3,49 7,25 13,77

26

Cosinus carrs des individus actifs Poids Distance Identificateur Axe 1 relatif l'origine Aix-Marseille 4,58 0,03419 0,09 Amiens 1,92 0,13498 0,00 Besanon 1,54 0,07547 0,28 Bordeaux 4,74 0,02922 0,15 Caen 1,67 0,05643 0,73 Clermont 1,94 0,01187 0,84 Corse 0,25 0,12463 0,22 Crteil 5,55 0,04131 0,47 Dijon 1,87 0,02189 0,67 Grenoble 3,77 0,05118 0,08 Lille 7,00 0,00976 0,38 Limoges 0,99 0,07977 0,75 Lyon 6,84 0,01881 0,09 Montpellier 4,04 0,04769 0,24 Nancy-Metz 3,58 0,03663 0,21 Nantes 4,87 0,03549 0,00 Nice 2,36 0,07955 0,03 Orlans 2,61 0,04844 0,73 Paris 13,36 0,18319 0,97 Poitiers 2,04 0,04505 0,60 Reims 1,82 0,14758 0,00 Rennes 4,86 0,02485 0,39 Rouen 2,21 0,04297 0,23 Strasbourg 3,03 0,06168 0,40 Toulouse 5,09 0,01595 0,03 Versailles 7,49 0,04292 0,04

Axe 2 0,83 0,93 0,68 0,74 0,01 0,01 0,34 0,02 0,03 0,01 0,15 0,06 0,02 0,57 0,61 0,68 0,39 0,00 0,00 0,30 0,01 0,30 0,07 0,13 0,32 0,02

Axe 3 0,01 0,01 0,02 0,03 0,14 0,13 0,28 0,43 0,09 0,01 0,08 0,12 0,10 0,06 0,10 0,05 0,43 0,00 0,02 0,06 0,80 0,18 0,62 0,35 0,00 0,68

Axe 4 0,00 0,00 0,00 0,01 0,10 0,00 0,03 0,00 0,15 0,79 0,00 0,06 0,72 0,00 0,04 0,07 0,08 0,15 0,00 0,05 0,16 0,00 0,02 0,09 0,45 0,22

Bibliographie indicative
L'Analyse des donnes: Mode d'emploi, mthodes et tudes de cas Thierry Foucart (1997) Probabilits, analyses des donnes et statistiques Gilbert Saporta (2006) Analyse des donnes qualitatives A-Michael Huberman et Matthew-B Miles (2003) Analyses factorielles simples et multiples : objectifs, mthodes et interprtation Brigitte Escofier et Jrme Pags (2008) 27

28

Vous aimerez peut-être aussi