Académique Documents
Professionnel Documents
Culture Documents
23, n° 1, 20167
Frédéric BERTRAND
DOI: 10.3917/ripc.231.0007
8 Frédéric BERTRAND
10. BRESSOUX P., LIMA L., « La place de l’évaluation dans les politiques éducatives : le cas de la
taille des classes à l’école primaire en France », in FELOUZIS G., HANHART S. (eds.), Gouverner
l’éducation par les nombres ? Usages, débats, controverses, Bruxelles, De Boeck, 2011, p 99-123 ;
BRESSOUX P., LEROY-AUDOUIN C., COUSTERE P., « Les extensions des modèles multiniveau et
leur application pour l’évaluation en éducation », in Mesure et Évaluation en Éducation, vol. 21, n° 1,
1988, p. 39-59.
11. SUREL Y., « L’intégration européenne vue par l’approche cognitive et normative des politiques
publiques », in Revue française de science politique, 50e année, n° 2, 2000, p. 235-254.
12. BÉLAN D., COX H. (eds.), Ideas and Politics in social sciences research, Oxford University press,
2011, 288 p. ; GOFAS A., HAY C., The role of ideas in political analysis, Routledge, 2010, 210 p.
10 Frédéric BERTRAND
idées, les normes ou les valeurs qui structurent une politique auront un poids
sémantique important dans le texte à travers lequel cette politique s’écrit.
Pour vérifier l’existence d’un lien entre les idées aux différents
niveaux de la politique nous analyserons la sémantique latente de trois
documents-cadres liés à la mise en œuvre du fonds social européen
(FSE) en France sur la période 2007-2013 : les Orientations stratégiques
communautaires 2007‑201313 (OSC) ; le cadre stratégique national
pour la France14 (CRSN) ; le programme opérationnel pour la France
métropolitaine15 (PO). Avec un budget de plus de soixante-quinze milliards
d’euros sur la programmation 2007-2013, le FSE est le principal levier
financier de l’Union européenne pour la promotion de l’emploi, de la
formation professionnelle et de l’insertion. Il soutient la mise en œuvre
de la Stratégie européenne pour l’Emploi (SEE). Les procédures de
production et de validation des documents de cadrage du FSE assurent la
bonne articulation des programmes d’action nationaux avec la stratégie
européenne, pour autant les États membres se positionnent dans le cadre
communautaire en fonction de leurs stratégies et de leurs priorités propres.
Nous testerons donc deux hypothèses au regard de l’organisation multiniveau
de la politique de formation professionnelle (Europe/France) et des textes
qui la retranscrivent. Hypothèse 1 : le CRSN et le PO sont proches du point
de vue de leur sémantique latente, et plus éloignés de celle des OSC – c’est
l’hypothèse d’une relative distance sémantique entre la France et l’Europe
au sujet de la politique de formation professionnelle. Hypothèse 2 : le
poids sémantique du PO est en partie déterminé par celui du CRSN et des
OSC – c’est l’hypothèse de la traduction sémantique de l’effet multiniveau
des politiques. La théorie admet que ces hypothèses sont valides, l’intérêt du
présent travail consiste donc moins à les valider à nouveau qu’à proposer un
cadre méthodologique compatible avec le modèle théorique et susceptible à
terme de discuter ce dernier.
Cet article comporte quatre sections. Après avoir présenté les textes et
rappelé comment ils ont été élaborés dans une logique multiniveau, nous
explicitons la méthodologie utilisée pour les analyser. Nous présentons
ensuite les principaux résultats obtenus. Pour finir nous indiquons les
trois intérêts principaux du recours à la LSA pour l’analyse cognitive
des politiques multiniveaux appliquée à la politique de formation. Nous
montrerons que cette analyse permet : 1) d’objectiver la convergence
cognitive qui sous-tend cette politique aux différents niveaux, et qui renvoie,
en l’espèce, à la promotion d’une logique compétence ; 2) de souligner les
points de divergence entre les conceptions de la politique considérées aux
différents niveaux qui embarque la France dans un processus normatif où
une stratégie de promotion de la souveraineté nationale est mise en balance
avec une stratégie de défense des intérêts nationaux ; 3) de donner une
base empirique à une réflexion plus générale sur les idées, les normes et
les valeurs qui sous-tendent les représentations du monde des acteurs où
la formation est présentée comme la clé de voûte du modèle social par sa
vocation à articuler les logiques de protection sociale et de développement
économique.
La LSA a été mise en œuvre sur trois textes à travers lesquels s’organise
la mise en œuvre multiniveau des politiques de formation professionnelle
continue à l’échelle européenne : les Orientations stratégiques
communautaires 2007‑2013 (OSC), le cadre de référence stratégique
national pour la France (CRSN) et le programme opérationnel pour la
France métropolitaine (PO). La dimension multiniveau apparaît clairement
à travers le processus d’élaboration et de validation des textes et le jeu
des références normatives qui sont les leurs. Une des spécificités de la
programmation 2007‑2013 par rapport à la programmation précédente a
précisément été de rechercher une cohérence accrue entre les différents
niveaux. C’est la raison pour laquelle il a été demandé aux États membres
de ne présenter qu’un seul document stratégique de référence, et que le PO
présente une matrice unique pour les niveaux national et régional. Cette
recherche de cohérence fait du PO un texte où les priorités et principes définis
au niveau européen et national s’articulent avec une visée opérationnelle.
Nous avons retenu ces textes parce qu’ils constituent des références centrales
pour les concepteurs du PO. Nous avons uniquement retenu pour l’analyse
les sections de ces textes traitant explicitant de formation professionnelle.
Méthodologie
La LSA est une méthode développée au début des années 2000, dans le champ
des recherches sur les processus cognitifs et épistémiques en particulier
l’induction16. La LSA a trouvé de nombreux domaines d’application en
16. LANDAUER T.K., DUMAIS S.T., « A solution to Plato’s problem: The Latent Semantic Analysis
theory of the acquisition, induction, and representation of knowledge » in Psychological Review,
vol. 104, n° 2, 1997, p. 211-240 ; FOLTZ P.W., KINTSCH W., LANDAUER T.K., « The measurement
of textual Coherence with Latent Semantic Analysis », in Discourse Processes, vol. 25, n° 1-2,
1998, p. 285‑307 ; LANDAUER T.K., FOLTZ P.W., LAHAM D., « Introduction to Latent Semantic
Analysis », in Discourse Processes, vol. 25, n° 1-2, 1998, p. 259-284.
L’apport de l’analyse sémantique latente à l’analyse des politiques publiques multiniveaux15
17. KINTSCH W., « On the notions of theme and topic in psychological process models of text
comprehension », in LOUWERSE M.W., PEER V., (eds.), Thematics: Interdisciplinary Studies,
Amsterdam, Benjamins, 2002, p. 157-170 ; KINTSCH W., « Metaphor comprehension: A computational
theory », in Psyhonomic Bulletin and Review, vol. 7, n° 2, 2000, p. 257-266 ; WOLFE M.B.,
SCHREINER M.E., REHDER B., LAHAM D., FOLTZ P.W., KINTSCH W., LANDAUER T.K.,
« Learning from text: Matching readers and text by Latent Semantic Analysis », in Discourse Processes,
vol. 25, n° 1-2, p. 309-336, 1998 ; LANDAUER T.K., LAHAM D., REHDER B., SCHREINER M.E.,
« How well can passage meaning be derived without using word order? A comparison of Latent Semantic
Analysis and humans », in SHAFTO M.G., LANGLEY P., (eds.), Proceedings of the 19th annual
meeting of the Cognitive Science Society, Mahwah, Erlbaum, 1997, p. 412-417.
18. HARRIS Z.S, Mathematical Structures of Language, Krieger Pub Co, 1968, 230 p.
19. DEERWESTER S., DUMAIS S.T., FURNAS G.W., LANDAUER T.K., HARSHMAN R.,
« Indexing By Latent Semantic Analysis » in Journal of the American Society For Information Science,
vol. 41, n° 6, 1990, p. 391-407.
16 Frédéric BERTRAND
Une fois la valeur des mots des différents textes calculée, les textes
peuvent être comparés entre eux à l’aide d’indicateurs de similarité.
La littérature sur l’analyse de données textuelles ou sur la recherche
documentaire identifie classiquement plusieurs indicateurs de similarité,
dont le coefficient de corrélation de Pearson et l’indice de Dice dont nous
nous sommes servis23. Le coefficient de corrélation de Pearson calcule la
similarité entre deux documents d1 et d2 comme le cosinus de l’angle entre
leurs représentations vectorielles centrées-réduites. La similarité obtenue
simpearson (d1 ; d2) Є [–1 ; 1].
2Nc
simdice(d1 ; d2) =
N1 + N2
23. NEGRE E., « Comparaison de textes, quelques approches », in Cahier du LAMSADE, n° 338,
avril 2013, 28 p.
24. Op. cit., p 8.
18 Frédéric BERTRAND
Les modèles statistiques multiniveaux sont utilisés pour analyser les données
hiérarchisées c’est-à-dire des données emboîtées dans différents niveaux. Ils
permettent d’expliquer la variance constatée entre les individus de chaque
niveau et entre les niveaux eux-mêmes. Rappelons que, dans un exercice
de modélisation statistique, expliquer une variable par une autre signifie
L’apport de l’analyse sémantique latente à l’analyse des politiques publiques multiniveaux19
déterminer la fonction qui lie les variables entre elles, ce qui n’emporte en
aucun cas l’affirmation d’un lien de causalité entre ces variables. L’intérêt
des modèles multiniveaux par rapport aux modèles linéaires généralisés
est qu’ils peuvent s’appliquer à des données non indépendantes, corrélées
entre elles – comme le sont a priori les données hiérarchisées. Dans notre
cas les mots dont la valeur a été calculée avec la LSA sont des unités-
individus regroupées dans des textes constitutifs des niveaux. Chacun
des textes constitue un niveau, il s’agit d’estimer dans quelle mesure la
sémantique latente des orientations européennes explique celle des deux
textes caractérisant la position française. L’analyse multiniveau procède
en deux temps. Le premier temps consiste à estimer comment les valeurs
sémantiques varient dans les différents textes. Ce modèle est équivalent
à une analyse de variance avec effet aléatoire25. Nous partons en effet de
ce double constat que des termes identiques du dictionnaire ont des poids
sémantiques différents au sein des différents textes, et que des termes
différents ont des poids différents au sein de chacun des textes. L’analyse
de variance permet d’estimer la part de la variance liée aux poids des termes
dans les différents textes (analyse intra-groupe) et celle liée aux poids des
termes pour l’ensemble du corpus (analyse intergroupe). Elle permet ainsi
de tester l’hypothèse d’égalité du poids sémantique moyen des termes des
textes. L’hypothèse d’un relatif éloignement entre les textes français et les
OSC du point de vue de leur sémantique latente (hypothèse 1) implique que
les termes identiques aient un poids moyen significativement différents au
sein des deux corpus. Le second temps, qui s’appuie sur l’estimation d’un
modèle linéaire mixte à constante aléatoire26, permet de tester l’hypothèse 2
d’une traduction sémantique de l’organisation multiniveau de la politique.
Celle-ci sera avérée si la sémantique latente du PO est influencée à la fois
par celle du CRSN et celle du PO.
25. BRESSOUX P., Modélisation statistique appliquée aux sciences sociales, De Boeck, 2008, p. 291.
26. Op. cit., p 296.
27. LEBART L., SALEM A., Analyse textuelle, Paris, Dunod, 1994, p. 36-38.
20 Frédéric BERTRAND
La proximité des textes ici ne doit pas surprendre elle reflète notre parti
pris de ne sélectionner que les paragraphes traitant de la formation tout au
long de la vie. Ce qui retient l’attention est plutôt la force de la corrélation :
très forte entre les OSC et le CRSN, plus encore entre le CRSN et le PO,
mais nettement moins marquée entre les OSC et le PO. Le calcul de l’indice
de Dice montre que la corrélation ne repose qu’en partie sur une proximité
lexicale entre les textes.
Il s’agit ici d’entrer plus avant dans l’analyse de l’articulation des textes.
Une analyse en composante principale (ACP) a permis d’identifier les mots
L’apport de l’analyse sémantique latente à l’analyse des politiques publiques multiniveaux21
L’analyse de variance avec effet aléatoire a été effectuée sur les valeurs
sémantiques (non centrées réduites) des textes pour l’ensemble des entrées
du dictionnaire.
28. Si l’hypothèse d’homogénéité des variances doit être rejetée après le test de Leven (Leven (2 ;
765)=21,45 ; p<.001), le test de Welch est quant à lui significatif (Welch (2 ; 465,78)=20,61 ; p<.001).
22 Frédéric BERTRAND
OSC 0,296
CRSN 0,110
PO 0,188
Total 0,198
29. L’analyse a été effectuée sur les valeurs sémantiques (non centrées réduites) des textes pour
l’ensemble des entrées du dictionnaire.
24 Frédéric BERTRAND
à quoi ils se réfèrent. Il s’est agi de trouver dans chacun des textes la réponse
aux questions : « développer quoi ? » ; « améliorer quoi ? » ; « accéder à
quoi ? » et « pour quoi faire ? » (Annexe 4). En première lecture c’est la
proximité entre les contextes d’emploi des trois verbes qui frappe. Les trois
textes précisent par exemple que la formation doit développer les ressources
humaines, le capital humain ou le développement des compétences à
l’échelle des entreprises et des individus, qu’il s’agit d’améliorer l’accès
à la qualification et qu’un enjeu principal des politiques de formation est
de favoriser l’accès à l’emploi. On reconnaîtra ici les principaux traits
du référentiel européen sur la formation tout au long de la vie. Celui-ci
semble bien intégré dans les politiques nationales au point de passer pour
un lieu commun : le développement des compétences par la formation est
un levier important du développement économique et social. On pourrait
parler ici d’une convergence cognitive qui rend possibles l’articulation des
niveaux et l’appropriation nationale du référentiel. Si la méthode ouverte
de coordination a favorisé cette convergence cognitive, d’autres acteurs y
ont contribué par d’autres canaux, notamment les partenaires sociaux qui
ont entrepris dès la fin des années 1980 en France de mettre la compétence
individuelle au cœur des enjeux de qualification dans l’entreprise30. Nous
sommes ici à ce moment de l’histoire sociale où, pour reprendre l’analyse
de Zarfian la logique compétence est venue supplanter la logique de la
qualification31.
autour de l’ANI ne doit pas masquer les divergences de lecture que les
organisations syndicales françaises ont de la sécurisation des parcours et
des modalités de sa mise en œuvre34 ; de la même façon, les « principes
communs de flexicurité » adoptés en 2005 par le Conseil européen ne
doivent pas masquer les différences entre les modèles nationaux – pour
autant, la position française sur la flexicurité témoigne bien sur ce sujet des
tensions cognitives sous-jacentes au processus d’européanisation35.
Conclusion
34. GRIMAULT S., « Sécurisation des parcours professionnels et flexicurité : analyse comparative des
positions syndicales », in Travail et emploi, n° 113, janvier-mars 2008, p. 75-89.
35. CAUNE H., « Les États providence sont aussi des États membres. Comparaison des logiques
nationales de l’européanisation des politiques de l’emploi en France et au Portugal », Thèse de doctorat,
IEP Paris, 2013.
L’apport de l’analyse sémantique latente à l’analyse des politiques publiques multiniveaux29
Annexes
Annexe 1
Annexe 2
L’ACP a été mise en œuvre sur les 256 termes du dictionnaire dont les valeurs
calculées avec la LSA ont été centrées et réduites. Le premier axe dégagé par l’ACP
explique 74,7 % de la variance totale des valeurs sémantiques du corpus.
Résultats de l’ACP
L’ACP a porté sur les 42 termes du dictionnaire les plus importants pour les seuls
OSC et PO
Les résultats de l’ACP montrent les termes qui contribuent le plus fortement à
l’éloignement sémantique entre les OSC et le PO.
32 Frédéric BERTRAND