Académique Documents
Professionnel Documents
Culture Documents
Politique de recherche
Page d'accueil du journal :
www.elsevier.com/locate/respol
A R T I C L EI N F
O ABSTRACT
Classification JEL : Cet article étudie comment l'environnement social auquel un étudiant en doctorat est exposé pendant sa
J24 formation est lié à sa productivité scientifique. Nous étudions comment les caractéristiques du superviseur et
O30 des pairs sont associées à la quantité et à la qualité des publications de l'étudiant, ainsi qu'à la taille du réseau
Mots-clés : de coauteurs. Unique dans notre étude, nous couvrons l'ensemble de la population des étudiants en doctorat
Étudiants en doctorat d'un pays européen pour tous les domaines STEM en analysant 77 143 étudiants qui ont obtenu leur diplôme
Déterminants de la en France entre 2000 et 2014. Nous constatons que le fait d'avoir un superviseur féminin productif, en milieu
productivité de carrière, peu expérimenté et bénéficiant d'une bourse nationale est positivement associé à la productivité de
Environnement social l'étudiant. De plus, nous constatons que le fait d'avoir peu de pairs productifs en première année et au moins
Superviseur
une femme parmi ses pairs est associé positivement à la productivité de l'étudiant. Il est intéressant de noter
Pairs
que nos résultats sont hétérogènes lorsqu'on ventile la population étudiante par domaine de recherche.
* Auteur correspondant.
Adresse électronique : alberto.corsini@univ-cotedazur.fr (A. Corsini).
1
https://www.findaphd.com/advice/blog/4554/the-best-thing-about-my-phd-supervisor-students-share-their-stories.
2
https://www.ese.wustl.edu/~nehorai/students/testimonials.html.
https://doi.org/10.1016/j.respol.2022.104561
Reçu le 1er juillet 2021 ; Reçu sous forme révisée le 21 mars 2022 ; Accepté le 21 mai 2022.
Disponible en ligne le 7 juin 2022
0048-7333/© 2022 Elsevier B.V. Tous droits réservés.
A. Corsini Politique de recherche 51
2015 ; Horta et Santos, 2016 ; Sauermann et Haeussler, 2017 ; van sont formés en petites équipes et supervisés par un professeur ayant un
Dijk et al., 2014). Outre le palmarès des publications, les recruteurs
accordent également de l'importance au réseau scientifique du candidat
(Heffernan, 2021), qui témoigne de sa capacité à établir des
collaborations de recherche à une époque où la production de
connaissances est de plus en plus le résultat d'un travail d'équipe (Katz
et Martin, 1997 ; Wuchty et al., 2007). C'est pourquoi les étudiants, les
directeurs de programmes de doctorat et les décideurs politiques qui
souhaitent former des étudiants très compétitifs sur le marché du
travail demandent instamment de comprendre quelles sont les
conditions de travail associées aux scores élevés de publication et aux
grands réseaux scientifiques des étudiants. En d'autres termes, ils
demandent instamment de répondre à la question suivante : qu'est-ce
qui rend un doctorant productif ?
Dans cet article, nous abordons cette question en analysant le rôle
qu'un large éventail de caractéristiques de l'environnement social
auquel un étudiant en doctorat est exposé a sur la productivité
scientifique de l'étudiant pendant la période de doctorat. Ce faisant,
nous apportons trois contributions à la littérature existante.
Premièrement, les études existantes présentent des preuves
empiriques éparses sur la façon dont des facteurs tels que la qualité de
l'université, le sexe du superviseur, le réseau scientifique du
superviseur, la nationalité de l'étudiant, la spécialisation du groupe
d'étudiants et le financement sont liés à la productivité des étudiants
(Baruffaldi et al., 2016 ; Conti et al., 2014 ; Gaul'e et Piacentini, 2013,
2018 ; Horta et al., 2018 ; Pez- zoni et al., 2016 ; Rossello et al., 2020 ;
Waldinger, 2010). Notre article englobe dans une analyse unique un
ensemble complet de caractéristiques biographiques et académiques
pertinentes du superviseur et des pairs, les deux acteurs les plus
importants avec lesquels l'étudiant établit des relations pendant la
période de formation (Carayol et Matt, 2004 ; Shibayama et al., 2015 ;
Stephan et al., 2007 ; Stephan et Levin, 1997).
Deuxièmement, bien que la relation étudiant-superviseur ait déjà
fait l'objet d'une attention (Paglis et al., 2006 ; Platow, 2012 ; Sinclair
et al., 2014), certaines caractéristiques pertinentes du superviseur ont
été négligées par la littérature empirique passée, comme l'expérience
de mentorat et la capacité de collecte de fonds des superviseurs. En
outre, la littérature empirique a souvent négligé l'influence des
caractéristiques des pairs pendant la période de formation de l'étudiant
(avec quelques exceptions notables comme Brostro¨m, 2019).
Néanmoins, les étudiants passent la plupart de leur temps dans les
laboratoires, interagissant fréquemment avec leurs pairs, ce qui rend la
dynamique de groupe fondamentale pour le processus d'apprentissage
de l'étudiant (Shibayama et Kobayashi, 2017). Notre article contribue à
faire avancer les connaissances sur la façon dont les caractéristiques
négligées du superviseur et les caractéristiques des pairs sont associées
à la productivité de l'étudiant.
Troisièmement, les études existantes sur la productivité des
étudiants reposent sur des échantillons sélectionnés d'étudiants affiliés
à des universités de premier plan (Pezzoni et al., 2016), travaillant dans
des disciplines spécifiques (Delamont et Atkinson, 2001 ; Gaule' et
Piacentini, 2018) ou obtenant leur diplôme au cours d'années
spécifiques (Brostro¨m, 2019 ; Shibayama et Kobayashi, 2017).
L'utilisation d'échantillons sélectionnés est parfois hautement
souhaitable permettant des stratégies d'identification solides
(Waldinger, 2010). Cependant, cela se fait au prix d'une validité
externe limitée des résultats des analyses en raison de la nécessité de
tirer des conclusions pour des disciplines, des universités ou des
périodes historiques spécifiques. Notre analyse surmonte cette
limitation en couvrant toutes les universités françaises dans tous les
domaines STEM sur une longue période de temps, y compris 15
cohortes d'étudiants.
L'étude la plus similaire à la nôtre est un article de Brostro¨m
(2019). Brosto¨m étudie comment les conditions du département sont
liées à la réussite des étudiants de doctorat en début de carrière. Il
emploie des données sur des étudiants suédois et constate qu'ils
obtiennent de meilleurs résultats au début de leur carrière lorsqu'ils
2
nous nous attendons à ce que les
NA. ne souffre pas des problèmes de représentativité des
solide profil aca- demique. Une différence essentielle avec notre caractéristiPqoulietisqudeudesurepceherrvcihsee5u1r(2e0t 2d2e) s pairs
données d'enquête, et la longue période observée nous permet de
travail est que Brosto¨m examine un échantillon sélectionné
d'étudiants interrogés qui ont obtenu leur diplôme dans une cohorte et
travaillent en groupe, alors que nous utilisons des données sur la
population entière d'un pays, y compris 15 cohortes d'étudiants
diplômés. Le fait de disposer de l'ensemble de la
4
nous nous attendons à ce que les
NA. ne souffre pas des problèmes de représentativité des
2.1. Caractéristiques dula
superviseur et productivité de nous
l'étudiant caractéristi
fait Pqoulietisqudeudesurepceherrvcihsee5u1r(2e0t 2d2e) s pairs
qu'un directeur de thèse consacre moins de temps à la recherche et à
données d'enquête, et longue période observée permet de
l'encadrement peut avoir un impact négatif sur le soutien apporté à ses
La productivité de l'étudiant dépend en grande partie du succès de étudiants de doctorat et, par conséquent, sur la productivité de ces
la collaboration entre l'étudiant et le superviseur. Comme dans toute derniers.
autre relation de collaboration, les caractéristiques des collaborateurs Alors que l'ancienneté est censée nuire à la productivité des
jouent un rôle crucial dans la détermination du succès de la étudiants, nous nous attendons à une relation positive entre l'expérience
collaboration. Dans le cas des collaborations scientifiques, les de mentorat du superviseur et la productivité de l'étudiant. L'expérience
caractéristiques biographiques et le profil académique sont des accumulée dans l'encadrement des étudiants développe différentes
éléments essentiels à considérer (Azoulay et al., 2010 ; Bercovitz et capacités, comme le conseil, le tutorat,
Feldman, 2011 ; Bozeman et Corley, 2004 ; Katz et Martin, 1997 ; Lee
et Bozeman, 2005 ; Taylor et Greve, 2006). Plus encore, dans la
collaboration étudiant-superviseur, les caractéristiques du superviseur
sont censées être cruciales pour la productivité de l'étudiant en raison
du rôle de mentor et de chef de laboratoire joué par le superviseur
(Delamont et Atkinson, 2001 ; Golde, 2005 ; Lee et al, 2007 ;
Lempriere, 2020 ; Li'enard et al., 2018 ; Ma et al., 2020 ; Mangematin
et Robin, 2003 ; Pearson et Brew, 2002 ; Shibayama, 2019 ;
Shibayama et al., 2015 ; Tenenbaum et al., 2001).
En examinant les caractéristiques biographiques du superviseur,
nous prenons en compte le sexe, l'ancienneté et l'expérience du
mentorat. Nous nous attendons à ce que les superviseurs féminins et
masculins aient des approches différentes du mentorat. Des études
ethnographiques portant sur les routines de laboratoire ont exploré ces
comportements. En enquêtant auprès de 185 étudiants de l'Université
de Californie, Tenenbaum et al. (2001) ont constaté que les
superviseurs masculins sont moins susceptibles que leurs homologues
féminins de fournir une aide psychologique aux étudiants, ce qui
diminue le niveau de satisfaction des étudiants à l'égard de l'expérience
de formation au doctorat. Cependant, les directeurs de recherche
masculins et féminins offrent la même "aide instrumentale", en
fournissant aux étudiants les mêmes connaissances techniques
nécessaires pour soutenir leur productivité en matière de publication.
Dans une autre enquête réalisée en médecine, Luckhaupt et al. (2005)
ont constaté que les superviseurs féminins perçoivent des limites liées
au sexe dans la collaboration avec leurs étudiants. Dans une expérience
de terrain portant sur le recrutement d'étudiants à des postes de chefs
de laboratoire, 127 professeurs évaluant les curriculum vitae des
étudiants ont été financés pour favoriser les étudiants masculins
(Moss- Racusin et al., 2012). Des études empiriques de plus grande
envergure ont confirmé ces différences. Dans un échantillon de 20 000
doctorants américains en chimie, Gaul'e et Piacentini (2018) constatent
que les étudiants qui se jumellent avec un conseiller du même sexe
sont plus productifs que ceux qui travaillent avec un conseiller d'un
sexe différent. Des résultats similaires ont été trouvés pour les
doctorants sud-africains par Rossello et al. (2020), qui montrent que
les étudiantes travaillant avec des superviseurs masculins sont moins
pro- ductives que les étudiants masculins. Dans le contexte d'une
université interdisci- plinaire américaine de premier plan, Pezzoni et
al. (2016) constatent que le fait d'avoir un superviseur féminin
augmente la productivité des étudiants en doctorat.
Une autre caractéristique biographique des superviseurs qui est
censée
L'ancienneté des superviseurs a une incidence sur la productivité des
étudiants pendant la période de formation. Un individu rationnel
diminue son temps de travail avec l'ancienneté (Diamond, 1984 ; Levin
et Stephan, 1991). Dans le cas des scientifiques, nous nous attendons à
ce qu'ils répartissent leur temps différemment entre les activités à
mesure que l'ancienneté augmente. En effet, les scientifiques disposent
d'une grande autonomie dans le choix du temps à allouer à différentes
activités telles que la collecte de fonds, la recherche, l'enseignement, le
conseil et les activités administratives (Libaers, 2012 ; Sabatier et al.,
2006). Nous nous attendons à ce que les jeunes superviseurs qui
souhaitent donner un coup de pouce à leur carrière consacrent plus de
temps à la collecte de fonds, à la recherche et aux activités de
mentorat. En revanche, les superviseurs seniors sont susceptibles de
consacrer plus de temps à des activités rémunératrices à court terme,
telles que le conseil et les activités administratives. Par conséquent, le
5
A. Corsini Politique de recherche 51
dynamique pourrait nuire à la productivité des grands groupes nombre de médailles Fields.
(Brostro¨m, 2019). Pour la formation des scientifiques, la France dispose d'une offre
La littérature sur le travail, qui utilise à la fois des données doctorale bien structurée. Ph.
d'observation et des données expérimentales, converge pour montrer Les bourses de doctorat sont parrainées par des universités, des
que la présence de pairs dans l'environnement de travail affecte laboratoires, l'État ou des entreprises privées. Les étudiants sont
positivement la productivité (Falk et Ichino, 2006). Cependant, nous soutenus par des bourses qui durent généralement trois ans (Pommier
nous attendons à ce que l'effet bénéfique de la présence de pairs se et al., 2022).3 Les contrats d'embauche des étudiants sont relativement
réduise lorsque le nombre de pairs augmente (Shibayama et standards, et presque tous les étudiants sont embauchés comme
Kobayashi, 2017). En effet, le temps alloué par le superviseur à chaque chercheurs professionnels à temps plein pendant toute la durée de leur
étudiant pourrait diminuer lorsque le nombre d'étudiants augmente, et doctorat (Mangematin, 2000). Un système centralisé normalise les
la recrudescence de la dynamique concurrentielle entre pairs pourrait règlements des programmes de doctorat, mais chaque université
décourager la collaboration entre étudiants (Conti et al., 2014). dispose de marges de manœuvre pour organiser les cours et les
Ce n'est pas seulement la simple présence de pairs qui affecte la activités de laboratoire. En général, les programmes présentent une
pro- ductivité de l'étudiant focal, mais aussi les caractéristiques des hétérogénéité de terrain. Par exemple, les doctorants en sciences
pairs. Comme pour le superviseur, nous analysons les caractéristiques naturelles et technologiques travaillent à plein temps dans des
biographiques et académiques des pairs. laboratoires de recherche avec leurs collègues, tandis que dans les
En tant que caractéristiques biographiques, nous nous attendons à autres disciplines, le travail des étudiants ne nécessite pas une présence
ce que le sexe et l'ancienneté des pairs soient associés à la productivité quotidienne dans les laboratoires. Au cours de leur première année, les
des étudiants. Les études précédentes ne sont pas parvenues à des étudiants en doctorat sont souvent invités à suivre des cours de base en
résultats convergents sur le genre. S'intéressant aux étudiants non théorie et en méthodologie, ainsi que des cours de compétences
diplômés, Dasgupta et al. (2015) constatent que la dynamique de supplémentaires tels que la "rédaction de pa- pers scientifiques". Les
groupe n'est pas neutre sur le plan du genre. Par exemple, la années suivantes, une partie considérable du temps de doctorat est
participation et la confiance en soi des étudiantes dans les discussions consacrée à la rédaction de la thèse, un document d'environ 200 pages
de groupe sont plus élevées dans les groupes à majorité féminine. En dans lequel l'étudiant prouve ses capacités de recherche. Le format de
s'intéressant aux doctorants, Pezzoni et al. (2016) ont constaté que, la thèse a évolué au fil du temps, passant de la production d'une
bien que le sexe de l'étudiant et du superviseur ait de l'importance, la monographie cohérente sur un sujet spécifique à la norme actuelle qui
composi- tion des sexes dans le laboratoire n'est pas associée à la consiste à produire une collection de trois articles de recherche
productivité du doctorant. En ce qui concerne l'ancienneté des pairs, on indépendants. Ce changement s'inscrit dans la volonté d'encourager les
s'attend à ce que le fait d'avoir des pairs plus anciens ayant un stock de jeunes chercheurs à publier leurs travaux de recherche de doctorat dans
connaissances plus important améliore le transfert de connaissances des revues scientifiques afin de faciliter leur future carrière.
vers l'étudiant focal (Ayoubi et al., 2017 ; Delamont et Atkinson, L'importance de la thèse finale est évidente du fait que les chercheurs
2001), ce qui pourrait augmenter la productivité des étudiants. français intervertissent souvent l'expression "être inscrit dans un
Cependant, les pairs plus anciens peuvent se trouver dans une phase de programme de doctorat" avec "faire une these" (l'équivalent anglais de
leur doctorat où les idées sont déjà arrêtées, et l'interaction avec "writing a thesis"). Les candidats doivent être jumelés avec un
d'autres étudiants peut être moins fructueuse. directeur de thèse qui accepte de les guider pour accéder au
Comme caractéristiques académiques des pairs, nous considérons programme de doctorat. La pratique de la rédaction d'une thèse sous la
la productivité des publications et des citations des pairs. La littérature direction d'un directeur assisté d'un co-directeur est autorisée.
antérieure a montré que la productivité des pairs affecte positivement
la productivité des individus pour les emplois peu qualifiés tels que les 4. Sources de données
employés de supermarché et les cueilleurs de fruits (Bandiera et al.,
2009 ; Mas et Moretti, 2009). Pour les emplois hautement qualifiés, Pour construire notre échantillon d'étude, nous rassemblons des
comme la recherche scientifique, les résultats ne sont pas convergents. données provenant de sources multiples. La première est le dépôt
Alors qu'Azoulay et al. (2010) montrent une diminution de la français des thèses de doctorat électroniques. Grâce à une autorisation
productivité scientifique des membres de l'équipe lorsque le " spéciale, nous avons obtenu l'accès à l'univers entier des fiches de
scientifique vedette " de l'équipe décède, Waldinger (2012) ne trouve thèses STEM collectées par l'Agence Bibliographique de
aucun effet de la perte d'un pair brillant. Bien que ces résultats ne l'Enseignement Sup'erieur (ABES) qui gère le dépôt depuis 1985.
soient pas convergents, dans le contexte des doctorants, nous nous Pour chaque fiche de thèse, nous disposons d'informations sur l'auteur,
attendons à ce que des pairs très productifs bénéficient à la le résumé, l'université d'obtention du diplôme, la date de soutenance, le
productivité de l'étudiant focal à travers les trois mécanismes décrits nom du superviseur, le nom du co-superviseur (le cas échéant) et le
ci-dessus : " pression des pairs " ; adoption de comportements domaine d'étude. Comme domaines, nous avons distingué les thèses en
productifs inspirés par les pairs grâce au mécanisme de comparaison Mathématiques, Ingénierie, Physique, et Médecine-Biologie-Chimie. 4
sociale, et probabilité accrue d'acquérir des connaissances auprès de Malheureusement, les dossiers n'indiquent pas l'année d'entrée de
pairs productifs. l'étudiant dans le programme de doctorat.
Le mécanisme de comparaison sociale pourrait également jouer un Nous l'approximons donc en supposant que chaque étudiant a
rôle en encourageant l'expansion du réseau de l'étudiant focal. Bien commencé le programme trois ans avant son année de soutenance de
que nous ayons soutenu que les étudiants s'appuient principalement sur thèse. Selon les statistiques nationales pour les domaines STEM, la
le réseau de leur superviseur pour créer leur réseau de collaboration, durée la plus fréquente du programme de doctorat est de trois ans.
les étudiants entourés de pairs qui investissent de l'énergie dans le La formation doctorale en France est de quatre ans, trois ans plus
développement de leur réseau de co-auteurs pendant les périodes de l'année de soutenance de thèse. 5 Par conséquent, nous fixons l'année
participation aux congrès et de visite auront probablement tendance à d'entrée de l'étudiant dans le programme de doctorat à l'année t-3, et
imiter le même comportement. Par conséquent, nous nous attendons à nous définissons la période de formation du doctorat comme la
ce que la taille du réseau de l'étudiant soit plus grande lorsque les pairs période allant de t-3 à t, où t est l'année de la soutenance.
ont un réseau plus important. Nos informations sur le sexe des étudiants et des superviseurs
résultent d'une stratégie d'appariement à itérations multiples (Gaul'e et
3. La population française des doctorants en STEM Piacentini, 2018 ; OCDE, 2012). Tout d'abord, nous faisons
correspondre les prénoms des étudiants avec la base de données
officielle française des noms de genre.6 Ensuite, pour les noms non
6
génération de nouvelles idées de
eAn. fournir un modèle et transmettre aux étudiants des
appariés, nous techniques et tacites (Brostro¨m, 2019 ; Overington, recherchPeoli(tiAquyeoduebriecheetrcahle.5, 1 2(2001272) ; Cornelissen et
connaissances
7
A. Corsini et al. Politique de recherche 51
Notre cadre empirique est représenté par la population entière
Les étudiants en doctorat STEM d'un pays européen, la France. L'excellence des
La reconnaissance mondiale dont jouissent ses chercheurs et ses 3
En 2021, 97 % des doctorants français dans les domaines de la science et de la
institutions de recherche de premier plan témoigne de la place de la technologie ont bénéficié d'un financement spécifique pour soutenir leur
France dans les domaines des STIM. Si l'on considère le nombre absolu formation doctorale (Pommier et al., 2022).
de lauréats du prix Nobel, 39 scientifiques français ont obtenu le prix
4
Nous avons également utilisé une distinction fine des champs basée soit sur la
Nobel de la paix. classification des champs Scopus des publications des directeurs de thèse, soit
sur une attribution manuelle des thèses. Les résultats des exercices de régression
la plus haute reconnaissance en chimie, en médecine et en physique. Un
à grain fin sont cohérents avec ceux présentés dans le texte principal. Les
institut d'élite français, l'E'cole Normale Sup'erieure de Paris, est classé
résultats sont disponibles sur demande.
premier ensemble 5
La durée du doctorat correspond à la durée des bourses d'études. Nous
avec le California Institute of Technology par la proportion d'anciens
avons vérifié cette statistique en interrogeant un sous-ensemble de
élèves ayant obtenu le prix. Marie Curie, la première femme à avoir l'administration des universités.
obtenu un prix Nobel et la seule femme récompensée deux fois, a reçu 6
Site web : https://www.data.gouv.fr/fr/datasets/liste-de-prenoms/.
sa formation principalement à Paris, où elle a établi son laboratoire. La
France obtient également des résultats exceptionnels en
mathématiques, puisqu'elle se situe dans le top 5 des pays pour
l'obtention du prix Nobel.
7
A. Corsini Politique de recherche 51
sexe, respectivement.
′ ′
Nous récupérons les enregistrements des publications des étudiants ′
+(Carac téristiques des pa irs
i ) 2 +(Cont rôlesi
et des superviseurs dans la base de données SCOPUS d'Elsevier. Nous β (1)
faisons correspondre la liste des étudiants d'ABES avec les auteurs ) β3 +ε
SCOPUS affiliés aux institutions françaises en utilisant les noms des
étudiants.
et les noms de famille comme critères de correspondance clés. 8 De 7
Site web : https://www.wipo.int/publications/en/details.jsp?id=4125.
même, nous faisons correspondre les noms et prénoms des 8
Nous avons éliminé de la liste initiale des étudiants fournie par l'ABES les
superviseurs avec les auteurs de SCOPUS. étudiants ayant des noms homonymes. Le fait d'avoir deux étudiants ou plus
Nous recueillons des informations sur le financement au niveau avec le même nom complet dans notre liste initiale d'auteurs de thèse de
national et européen. Au niveau national, nous utilisons la liste doctorat rendrait difficile de démêler leur identité et d'attribuer correctement
complète des subventions individuelles accordées par l'Agence les informations bibliométriques. Par conséquent, nous avons décidé de
supprimer les homonymes de notre liste originale d'auteurs de thèses de
Nationale de la Recherche (ANR), l'agence nationale française de
doctorat.
financement. En dehors de la France, nous considérons les 9
Site web : https://www.topuniversities.com.
programmes de financement au niveau européen. Nous utilisons la 10
Les 8 universités récompensées sont : Universit 'e d'Aix-Marseille, Universit'e
liste des subventions individuelles, Horizon 2020 (H2020) et les de Bordeaux, Universit'e Paris Saclay, PSL Paris Sciences et Lettres, Sorbonne
programmes-cadres (PC), accordées par la Commission européenne et
collectées dans la base de données CORDIS. Nous faisons
correspondre les superviseurs aux chercheurs principaux en utilisant
leurs noms et prénoms. Pour reconstruire la qualité du département
d'obtention du diplôme des doctorants, nous nous appuyons sur le
classement QS des universités. 9 Ce classement fournit des informations
détaillées sur la réputation académique des universités au niveau des
départements et nous permet de repérer les meilleurs départements
dans chaque domaine. Par exemple, l'Universit'e de Paris est dans le
top- 20% des universités en Mathématiques en France, mais pas en
Ingénierie. Nous intégrons les informations du classement QS aux
informations bibliométriques concernant les universités affiliées. Nous
construisons un ensemble de données bibliométriques appropriées sur
les publications et les auteurs des publications pour tous les
départements universitaires français. Pour créer cet ensemble de
données, nous faisons correspondre manuellement les noms des
universités françaises (et leurs variantes) avec les noms des affiliations
SCOPUS. Comme indicateur supplémentaire de la qualité des
départements, nous identifions les universités françaises qui, en 2011,
ont bénéficié du financement de l'Initiative d'excellence (IDEX) fourni
par le gouvernement français à un groupe sélectionné d'établissements
d'enseignement supérieur français. Le programme de financement
IDEX a été lancé en 2011 par le gouvernement français dans le cadre
d'une relance budgétaire nationale et a été attribué à huit universités.10
s'efforcent de devenir des concurrents des universités les mieux
classées au niveau mondial.
Pour créer notre échantillon d'étude, nous avons relié toutes les
informations extraites des sources de données énumérées ci-dessus
dans un ensemble de données original unique. Ce faisant, nous avons
joint les informations sur les étudiants, les superviseurs et les
départements. En outre, nous avons affiné notre échantillon d'étude en
excluant les étudiants présentant des indicateurs de productivité trop
élevés pour être crédibles. 11 Dans l'ensemble, les étudiants exclus
représentent moins de 10% de notre échantillon initial provenant de la
liste des noms d'étudiants de l'ABES. Après cet exercice de nettoyage,
nous avons obtenu un échantillon d'étude de 77 143 étudiants en
doctorat qui ont obtenu leur diplôme dans les universités françaises
entre 2000 et 2014.
5. Méthodologie économétrique
8
A. CoLrsainvi aetraial. ble de gauche de la productivité de Student dans productifs et plus susceptibles d'être supervPiosliétsiqupeadre
prend,
La valeur de la quantité et de la qualité des publications de l'étudiant rdeecsherscchiee5n1ti(f2i0q2u2e) s ayant de meilleures références
antérieures ont montré que ce problème d'endogénéité est atténué par
et la taille de son réseau scientifique. Nous mesurons la quantité de
la difficulté du superviseur à évaluer la capacité de recherche de
publications en comptant le nombre d'articles évalués par les pairs
l'étudiant lorsque celui-ci est au début de sa carrière universitaire
publiés par l'étudiant (Publications) et la qualité des publications en
(Mangematin, 2000). L'asymétrie d'information lors du processus de
comptant le nombre de citations annuelles reçues en moyenne par les
sélection de l'étudiant rend peu probable l'observation d'une corrélation
articles de l'étudiant (Citations moyennes). Nous mesurons la taille du
entre la capacité intrinsèque des étudiants et la qualité des
réseau de recherche de l'étudiant par le nombre de co-auteurs distincts
superviseurs. Belavy et al. (2020) montrent, dans une étude empirique
de l'étudiant (Co-auteurs). Les trois variables de productivité sont
portant sur 324 doctorants, que les variables habituellement utilisées
calculées pendant la période de formation du doctorat, c'est-à-dire de
comme indicateurs de l'aptitude des étudiants, telles que les résultats
t-3 à t, avec l'ajout d'une année après la soutenance de thèse pour tenir
scolaires antérieurs et les notes de formation, ne sont pas corrélées à la
compte des décalages possibles dans le processus de publication
productivité des doctorants. Dans le même ordre d'idées, des preuves
(Powell, 2016). Dans d'autres
anecdotiques montrent que les tests standardisés souvent pris en
En d'autres termes, nous calculons les résultats de la productivité dans
compte pour l'inscription au doctorat, par exemple les résultats du
la période comprise entre t-3 et t + 1, où t est l'année de soutenance
GRE aux États-Unis, ne reflètent pas entièrement les capacités
de la thèse.
Les vecteurs caractéristiques du superviseur et caractéristiques des pairs universitaires futures de l'étudiant (Aristiza'bal, 2021). Bien que la
définissent littérature précédente exclue une forte corrélation entre les capacités
l'environnement social de l'étudiant en doctorat. Les contrôles sont un académiques de l'étudiant et la qualité du superviseur, dans l'annexe E,
vecteur comprenant les caractéristiques de l'étudiant et les nous mettons en œuvre une vérification de la robustesse pour répondre
caractéristiques du département où il est inscrit. Enfin, ε est le terme au problème potentiel d'endogénéité. Plus précisément, nous répétons
d'erreur idiosyncratique. Notre intérêt est d'estimer les vecteurs de les estimations de l'équation (1) en ajoutant un proxy qui contrôle les
coefficients β1 et β2 qui relient les caractéristiques du superviseur et capacités de l'étudiant pendant sa période d'études secondaires. Nous
des pairs à la productivité de l'étudiant. signalons les étudiants ayant des capacités exceptionnelles en calculant
Une préoccupation dans l'estimation de ces coefficients concerne une variable muette égale à un si l'étudiant a participé à un concours
un problème potentiel d'endogénéité. Bien que nous incluions dans sélectif pendant ses études secondaires (Agarwal et Gaule, 2020). Nous
notre régression un large ensemble de caractéristiques variables et considérons trois concours bien connus : l'Olympiade internationale de
invariantes dans le temps identifiées par la littérature précédente mathématiques (OIM), les Olympiades Nationales de Math'ematiques
comme des facteurs affectant la productivité de l'étudiant, l'absence (l'Olym- piade nationale française de mathématiques), et le Kangourou
d'approximations pour la capacité intrinsèque de l'étudiant pourrait des math'ematiques (un concours national français de mathématiques).
biaiser nos estimations. En effet, un problème de variable omise Nous constatons que l'inclusion d'un proxy pour la capacité de l'élève
pourrait survenir si la capacité non observée est corrélée avec les n'affecte pas les coefficients estimés des variables dans les vecteurs des
variables expliquées et explicatives. Par exemple, les étudiants ayant caractéristiques du super-viseur et des caractéristiques des pairs, ce
des capacités de recherche supérieures pourraient être à la fois plus qui montre que notre modèle est efficace.
Universit'e, Sorbonne-Paris-Cit'e, de Strasbourg, Universite' de Il est peu probable que les résultats soient affectés par un problème
Universit' Toulouse. d'endogénéité.
11
Nous avons exclu les étudiants ayant plus de 20 publications, plus de 100
ci- tations reçues par article, et plus de 200 co-auteurs pendant la période de 5.1. Caractéristiques du superviseur
doctorat. Nous avons également exclu les étudiants pour lesquels leurs
superviseurs ont signalé plus de 100 publications et plus de 500 co-auteurs au Nous considérons les caractéristiques biographiques et académiques
cours des cinq années précédant l'inscription de l'étudiant. du superviseur. En ce qui concerne les caractéristiques biographiques,
nous incluons une variable fictive
9
A. Corsini Politique de recherche 51
Superviseur féminin qui est égal à un si le superviseur est une femme Pour caractériser les relations entre l'étudiante et ses pairs, nous
scientifique, zéro sinon. Comme nous nous attendons à ce que calculons des variables représentatives des caractéristiques
l'attention accordée à un étudiant en doctorat varie au cours de la biographiques et académiques des pairs. En ce qui concerne les
carrière du directeur de recherche, nous calculons l'ancienneté du caractéristiques biographiques, nous calculons la variable muette Au
directeur de recherche, mesurée par le nombre d'années écoulées entre moins un pair féminin qui est égale à un si au moins un pair pendant la
la première publication du directeur de recherche et l'année d'entrée de période de formation de l'étudiant focal est une femme, zéro sinon.
l'étudiant dans le programme de doctorat. Pour capturer les éventuels Nous calculons également l'ancienneté moyenne des pairs comme le
effets non linéaires de l'ancienneté, nous incluons un terme au carré de nombre moyen d'années passées par les pairs dans leur programme de
la variable ancienneté du directeur de recherche. De plus, l'expérience doctorat (Ancienneté moyenne des pairs). En outre, dans ce cas, les
de mentorat du superviseur peut affecter la productivité de ses pairs peuvent avoir des périodes de formation qui ne se chevauchent
étudiants de doctorat. Par conséquent, nous calculons la variable que partiellement avec celle de l'étudiant focal. Ainsi, comme première
expérience de mentorat comme le nombre cumulé d'étudiants encadrés étape de
par le superviseur qui ont soutenu leur thèse avec succès jusqu'à
l'année d'entrée de l'étudiant focal au doctorat. 12
En ce qui concerne les caractéristiques académiques du directeur de
thèse, nous calculons deux variables représentant la quantité et la
qualité des publications du directeur de thèse au cours des cinq années
précédant l'entrée de son étudiant dans le programme de doctorat, c'est-
à-dire de t-8 à t-4, où t est l'année de soutenance de l'étudiant. Nous
avons décidé de mesurer la quantité et la qualité des publications du
directeur de recherche pendant les cinq années précédant l'entrée de
l'étudiant (et non pendant la période de formation de l'étudiant) car il
est courant que l'étudiant et son directeur de recherche cosignent des
articles pendant la période de formation de l'étudiant. Dans le cas
d'articles cosignés, il est impossible de distinguer la productivité du
superviseur et celle de l'étudiant. Nous définissons la variable
Publications du superviseur comme le nombre de publications du
superviseur dans des revues à comité de lecture au cours des cinq
années précédant l'entrée de l'étudiant dans le programme de doctorat.
Ensuite, pour la même période, nous calculons le nombre moyen de
citations annuelles reçues par les articles du superviseur (Moyenne des
citations). Pour évaluer la taille du réseau scientifique du directeur de
recherche, nous reconstruisons son réseau de co-auteurs. Nous
définissons la variable Coauteurs du superviseur comme le nombre de
co-auteurs distincts que le superviseur a dans les cinq années précédant
l'entrée de l'étudiant dans le programme de doctorat. Enfin, pour
évaluer la capacité du superviseur à collecter des fonds, nous calculons
une variable muette Bourse ANR qui vaut un si le superviseur est le
chercheur principal d'une bourse ANR pendant au moins une année de
la période de formation de l'étudiant. De la même manière, nous
définissons une variable muette Bourse UE qui vaut un si le directeur
de recherche est le chercheur principal d'au moins une bourse UE
pendant la période de formation de l'étudiant.
1
Universit'e de Paris-Physique, et Universit'e dPeolPitaiqruise-dMe
PA.oCuorrsinliaet calo. nstruction de la variable d'ancienneté des 104
chim
pairs, nous calculons l'ancienneté moyenne des pairs pour chaque
années de la période de formation de l'étudiant focal. Si l'étudiant Pour contrôler la qualité du département, nous récupérons le
focal n'a pas de pairs pendant une année, nous attribuons la valeur classement de la réputation des universités à partir du classement
zéro à l'ancienneté annuelle moyenne. Ensuite, nous obtenons la mondial des universités QS.14 Nous créons une variable muette "Top-
variable Ancienneté moyenne des pairs en faisant la moyenne des 20 français" qui vaut un si le département fait partie des 20% des
quatre valeurs annuelles. Par exemple, si l'étudiant focal n'a qu'un départements ayant la meilleure réputation académique dans un
seul pair pendant les deux premières années de sa formation, cela domaine spécifique en France. Comme indicateur supplémentaire de la
signifie que le pair a soutenu sa thèse pendant la deuxième année de qualité du département, nous calculons la productivité moyenne des
doctorat de l'étudiant focal. Ainsi, nous considérons que les valeurs publications pondérées par les citations par département affilié
d'ancienneté des pairs pour les deux premières années de la formation (Citation-weighted publications per affiliate). Pour calculer cette
de l'étudiant focal sont égales à 3 et 4. La variable dernière variable, nous considérons la productivité moyenne des
L'ancienneté moyenne des pairs est égale à 1,75 (1,75 = (3 + 4 + 0 + 0) affiliés du département pendant les cinq années précédant l'entrée de
/ 4) pour les l'étudiant dans le programme de doctorat. Plus précisément, nous
étudiant focal. identifions les publications des affiliés du département au cours des
En ce qui concerne les caractéristiques académiques, nous cinq années précédant l'inscription de l'étudiant ; ensuite, nous
calculons le nombre de publications par an des pairs (publications des pondérons chaque publication par les citations reçues chaque année.
pairs). Cette variable est calculée selon une procédure en deux étapes. Enfin, nous calculons le nombre moyen de publications des affiliés
Dans la première étape, nous comptons le nombre d'articles publiés pondérées par les citations pour chaque département. Nous calculons
par les pairs au cours de chacune des quatre années de la période de également la variable IDEX comme troisième contrôle de la qualité du
formation de l'étudiant focal. Dans le cas où l'étudiant focal n'a pas de département. Cette variable est une variable muette qui vaut un après
pairs pendant une année, nous attribuons la valeur zéro au nombre 2011 si le département de l'étudiant a été sélectionné pour recevoir le
annuel d'articles publiés. Ensuite, nous obtenons les publications des financement du programme d'investissement national IDEX. Pour
pairs en faisant la moyenne des quatre valeurs. Par exemple, si contrôler la taille du département, nous calculons la variable Taille du
l'étudiant focal a deux pairs qui publient un article chacun 13 pendant la département en comptant le nombre de scientifiques affiliés au
première année de sa période de formation, la valeur de département pendant au moins un an au cours des cinq années
Les publications des pairs sont égales à 0,5 (0,5 = (2 + 0 + 0 + 0) / 4). précédant l'entrée de l'étudiant dans le programme de doctorat. Nous
En appliquant le rééchelonnons le nombre d'affiliés en le divisant par 100, ce qui
Selon la même procédure en deux étapes que pour les publications des signifie que chaque unité d'augmentation de la variable Taille du
pairs, nous calculons la variable "citations moyennes des pairs", qui département
représente la qualité du travail des pairs, et la variable "co-auteurs des
pairs", qui représente la taille du réseau des pairs.
13
En cas de publications conjointes entre deux ou plusieurs pairs d'un même
doctorant focal, nous comptons la publication une fois.
5.3. Autres contrôles 14
https://www.topuniversities.com/university-rankings. Nous avons recueilli
les informations relatives au classement en 2020, mais le classement des
Pour atténuer un biais potentiel de nos coefficients estimés, nous universités a connu des variations mineures au fil des ans lorsque l'on
contrôlons les caractéristiques du département et de l'étudiant. Nous considère les meilleures universités. L'avantage d'utiliser le classement
définissons un département comme la paire université-champ mondial des universités QS est la disponibilité d'un classement détaillé par
domaine.
d'études. Par exemple, l'Universit'e de Paris compte quatre d'entre
eux : Universit'e de Paris-Mathématiques, Universit'e de Paris-
Engineering,
12
Nous avons récupéré des données sur la carrière de mentor des superviseurs à partir de 1980.
1
A. Corsini Politique de recherche 51
1
Universit'e de Paris-Physique, et Universit'e dPeolPitaiqruise-dMe
PA.oCuorrsinliaet calo. nstruction de la variable d'ancienneté des 104
Ces deux variations sont statistiquement significatives et ont une chim
pairs, nous calculons l'ancienneté moyenne des pairs pour chaque
pertinence économique, correspondant à
1
A1.5CDorasninsi uetnael. spécification alternative du modèle, nous incluons les Étudiant Variable muette égPaolleitàiquune
sdiel'réetuchdeiarncht een51 (2022)
effets fixes du département. Nos résultats sont inchangés et sont disponibles Co-supervision Variable muette égale à un en présence d'un
co- superviseur.
Mathématiques Variable muette égale à un si la thèse
de doctorat porte sur les
mathématiques.
Ingénierie Variable muette égale à un si la thèse
de doctorat porte sur l'ingénierie.
Physique Variable muette égale à un si la thèse
de doctorat porte sur la physique.
16
Nous ne disposons pas d'informations sur l'âge des étudiants en doctorat, Médecine-biologie- Variable muette égale à un si le doctorat a été obtenu.
chimie la thèse porte sur la médecine, la biologie ou la
cependant en chimie.
Les étudiants français ont tendance à s'inscrire au programme de doctorat peu Année d'entrée L'année d'entrée de l'étudiant dans le
après leurs études de master, nous ne nous attendons donc pas à une grande programme de doctorat, c'est-à-dire t-3.
hétérogénéité d'âge parmi les étudiants. a
t est l'année de soutenance de la thèse de doctorat ; t-3 est l'année d'entrée de
l'étudiant dans le programme de doctorat ; les quatre années allant de t-3 à t
définissent la formation de doctorat.
1
A. Corsini Politique de recherche 51
Les cinq années allant de t-8 à t-4 sont les années qui précèdent l'entrée de
Tableau 3
l'étudiant dans le programme de doctorat.
Résultats de la régression.
Estimations MCO.
Tableau 2 (1) (2) (3)
Statistiques descriptives pour notre échantillon de 77 143 étudiants en doctorat. Publications Moyenne Coauteurs
citations
77 143 étudiants en doctorat Moyenne ET Min Max Caractéristiques du
Variables dépendantes superviseur Superviseur -0.0051 0.074** 0.31**
Étudiant en doctorat féminin (0.025) (0.030) (0.13)
Publications 2.37 2.99 0.00 20.00 0.037*** 0.0071 0.11***
Moyenne des citations 2.11 3.51 0.00 98.14 Ancienneté du (0.0072) (0.0085) (0.036)
Co-auteurs 8.93 15.37 0.00 200.00 -0.0019*** -0.00096** -0.0067***
Variables indépendantes superviseur Ancienneté (0.00034) (0.00040) (0.0017)
Caractéristiques du superviseur Expérience de mentorat -0.018*** -0.0072*** -0.037***
Superviseur féminin 0.21 0.41 0.00 1.00 du superviseur2 (0.0019) (0.0023) (0.0097)
Ancienneté du superviseur 11.49 5.24 0.00 21.00 Publications du superviseur 0.027*** 0.0070*** -0.10***
Expérience de mentorat 3.08 6.22 0.00 184.00 la publication est calculée à l'aid ents(0e.0s0ti1m5) la (0c.o0l0o6n2n
(d0e.0s01co2)efés dans )e 1 du
ficie
Publications du superviseur 13.59 14.31 0.00 100.00 0.031*** 0.20*** 0.21***
tableMauocyie-
dnensuperviseur
sesoduess.citations du
Moyenne des citations du 2.36 3.03 0.00 127.87 Tableau 3, et en appliquant le calc(u0l.0s0u3i6 0,0(03.070/ 9).(0.018)
superviseur
19
La valeur -0.11 est obtenue env)ant : - (423*) -0,001 ntorat
multipliant le co efficient du Me
Coauteurs du superviseur 37.28 50.82 0.00 499.00 estimCoéaeudteaunrss dleu ne01.0,0e2t8*l' typ0e.0d01e4l*'e* ce0d.0e91***
s u pe rv i se u r * * *
ta b le a u 3 , colon é( cart
0 .0 0 0 3 4x périen
(0 .0 0 0 4 ( 0. 0 0 1
Subvention de l'ANR 0.06 0.25 0.00 1.00 Expérience de mentorat rapportéed a n s l) e t 2 0 )(- 0 ,1 1 18*7) 6 , 2 2 ) .
a bleau = -0,0
subvention de l'UE 0.02 0.16 0.00 1.00 Subvention de l'ANR 0.0048 0.54*** 0.22
Caractéristiques des pairs (0.043) (0.050) (0.21)
Avec des pairs 0.80 0.40 0.00 1.00 subvention de l'UE -0.19*** 0.33*** -1.28***
N. pairs 1.76 2.14 0.00 30.00a (0.065) (0.077) (0.33)
Au moins un pair féminin 0.52 0.50 0.00 1.00 Caractéristiques des pairs
Ancienneté moyenne des pairs 1.61 1.04 0.00 3.56 Avec des pairs 0.13*** 0.24*** 0.25
Publications des pairs 0.81 1.76 0.00 41.00 (0.041) (0.048) (0.21)
Citations moyennes des pairs 2.71 8.11 0.00 353.15 N. pairs -0.12*** -0.042*** -0.39***
Coauteurs de leurs pairs 4.21 10.28 0.00 190.75 (0.0071) (0.0083) (0.036)
Autres contrôles Au moins un pair féminin -0.028 0.073** 0.21*
Top-20 français 0.39 0.49 0.00 1.00 (0.025) (0.030) (0.13)
Publications pondérées par les 7.37 4.43 0.38 35.05 Ancienneté moyenne des pairs -0.14*** -0.13*** -0.63***
citations
par affilié (0.017) (0.020) (0.086)
IDEX 0.18 0.38 0.00 1.00 Publications des pairs 0.13*** -0.15*** -0.64***
Taille du département [100 affiliés] 29.25 30.28 0.04 114.46 (0.014) (0.016) (0.070)
N. d'étudiants en doctorat dans les 1042.07 800.94 1.00 2973.00 Citations moyennes des pairs 0.0065*** 0.056*** 0.049***
programme (0.0020) (0.0024) (0.010)
Étudiante 0.39 0.49 0.00 1.00 Coauteurs de leurs pairs 0.0029 0.0017 0.21***
Co-supervision 0.31 0.46 0.00 1.00 (0.0023) (0.0027) (0.011)
Mathématiques 0.15 0.36 0.00 1.00 Autres contrôles
Ingénierie 0.21 0.41 0.00 1.00 Top-20 français -0.0082 0.068** -0.36***
Physique 0.18 0.39 0.00 1.00 (0.023) (0.028) (0.12)
Médecine-biologie-chimie 0.45 0.50 0.00 1.00 Pondéré par les citations 0.012** 0.026*** 0.14***
Année d'entrée 2005.12 4.20 1997.00 2011.00 publications par affilié
a
Bien que le nombre maximum de pairs puisse sembler élevé, nous avons
vérifié le cas de l'étudiant avec 30 pairs pendant la période de formation.
L'étudiant était supervisé par un chercheur en physique, ayant annuellement
30(+1) étudiants en doctorat.
pendant la période de formation de l'étudiant focal.
1
A1.5CDorasninsi uetnael. spécification alternative du modèle, nous incluons les Étudiant Variable muette égPaolleitàiquune
sdiel'réetuchdeiarncht een51 (2022)
17
effets fixes du département.
Ce pourcentage est calculéNos résultats la
en divisant sont inchangés
variation des etcitations
sont disponibles
moyennes de
l'étudiant associées au fait d'avoir un superviseur féminin par la valeur moyenne
des citations moyennes de l'échantillon, rapportée dans le tableau 2 (2.11).
18
L'ancienneté correspondant à l'effet marginal maximal sur la productivité de
1
A. Corsini Politique de recherche 51
Note : Niveaux de signification à ***p < 0,01, **p < 0,05, *p < 0,1. Les
erreurs standard sont indiquées entre parenthèses. Dans un exercice
supplémentaire, nous calculons les p-values
en appliquant un ajustement d'inférence multiple pour corriger les éventuelles
in- ferences erronées dues au nombre élevé d'hypothèses testées. Plus
précisément, nous calculons les valeurs p en appliquant la correction pour
hypothèses multiples de Romano-Wolf (Romano et Wolf, 2005a,b ; Romano et
Wolf, 2016). La signification statistique des coefficients reste cohérente avec
les résultats principaux, avec seulement deux exceptions notables. Plus
précisément, le coefficient de la variable Au moins sur les pairs féminins est
plus élevé que celui de la variable Au moins sur les pairs féminins.