Vous êtes sur la page 1sur 45

Spéculum

Un journal des études médiévales

Volume 92, numéro S1 | Octobre 2017

Le moyen âge numérique: une introduction


David J. Birnbaum​ , ​Sheila Bonde​ et ​Mike Kestemont

David J. Birnbaum, Université de Pittsburgh ( ​djbpitt@pitt.edu​ )


Sheila Bonde, Université Brown ( ​sheila_bonde@brown.edu​ )
Mike Kestemont, Université d'Anvers ( ​mike.kestemont@uantwerp.be​ )
https://doi.org/10.1086/694236

Nos objectifs dans ce supplément de ​Speculum​ sont franchement impudiques. En


organisant une série de sessions consacrées au numérique pour la réunion annuelle de
l'Académie Médiévale en 2016, nous espérions, en réunissant une diversité de projets,
présenter aux membres de l'Académie les nombreuses possibilités excitantes offertes
par les humanités numériques (DH). Les documents rassemblés ici sont en grande
partie tirés de ces sessions, avec plusieurs ajouts. Nous voulons remercier Sarah
Spence et William Stoneman, coorganisateurs des sessions, pour leur inspiration et leur
aide. Ce supplément est le premier numéro de ​Speculum​ consacré aux projets
numériques médiévaux, et il est proposé dans un format en ligne, en accès libre, qui
renforce l'ouverture à laquelle aspire le numérique et qu'il encourage.

Busa

L'avènement des études médiévales numériques est souvent attribué au travail de


Roberto Busa (1913-2011). Le prêtre jésuite italien était un philosophe et un théologien
spécialisé dans l'analyse lexicale des œuvres de Thomas d'Aquin. ​1​En raison de la taille
massive de l'œuvre d'Aquinas, Busa a rapidement besoin d'une méthode d'indexation
pour fouiller le corpus, une technique qui pourrait surpasser le système laborieux de
fiches manuscrites avec lesquelles il a commencé son travail. Busa ne tarda pas à
reconnaître les possibilités des premiers systèmes informatiques développés au cours
de sa vie et, vers 1949, il s'adressa à Thomas J. Watson Sr., le fondateur d'IBM. Watson
et son équipe d'IBM ont été impressionnés par les aspirations du jésuite italien (ils l'ont
appelé "plus américain que les Américains"), mais IBM a été persuadé de participer à
une initiative de recherche conjointe seulement après que le prêtre a signalé un dépliant
dans le Nouveau. Le bureau d'IBM d'IBM a déclaré: «Le difficile que nous faisons tout de
suite, l'impossible prend un peu plus de temps.» ​2
Au cours des trente années suivantes, IBM et Busa créèrent le projet ​Index Thomisticus
, le premier corpus lisible au monde, contenant un index des 118 œuvres d'Aquin,
totalisant environ 11 millions de mots. ​3​ Le projet a nécessité un personnel
administratif et d' organisation qui était sans précédent pour une initiative de recherche
en sciences humaines à l'époque, comme toute l' œuvre de saint Thomas devait être
numérisé sur des cartes perforées (et bandes plus tard magnétiques), qui étaient les
supports de données primaires utilisées dans le milieu du XXe siècle. Au fil des ans,
Busa embaucherait un grand nombre de jeunes dactylographes locales pour cette tâche
spécialisée (voir couverture de ce numéro).

Un jour, le père Busa m'a dit qu'il avait l'habitude de choisir délibérément des
jeunes femmes pour perforer des cartes, parce qu'elles étaient plus prudentes que
les hommes. De plus, il choisit des femmes qui ne connaissaient pas le latin, car la
qualité de leur travail était supérieure à celle de ceux qui la connaissaient (ce
dernier se sentait plus en sécurité en tapant les textes de Thomas d'Aquin et donc
moins prudent). Ces femmes travaillaient sur l'Index Thomisticus, perforant les
textes sur des cartes fournies par IBM. Busa avait créé une sorte d '«école de
cartes à poinçonner» à Gallarate. Cette expérience de travail a donné à ces
femmes une compétence professionnellement transférable et documentée attestée
par le père Busa lui-même. ​4
Ces dernières années, ces aspects du projet Index Thomisticus ont fait l'objet de projets
de recherche dans les domaines de l'histoire orale et des études de genre, et l'indice
nous aide à comprendre que les femmes ont joué un rôle fondamental dans les débuts
de l'informatique et du numérique. études médiévales. ​5
Le prêtre ouvert d'esprit n'a jamais vu un conflit entre les objectifs de son travail et son
appel religieux, voyant l'ordinateur "comme le fils de l'homme, et donc petit-fils de
Dieu." ​6​ Busa a salué la rapidité et la précision des analyses informatiques .
Aujourd'hui, l'un des prix les plus estimés dans le domaine des humanités numériques
est nommé d'après le jésuite italien: le prix triennal Roberto Busa délivré par l'Alliance
des organisations de Digital Humanities (ADHO). Busa lui-même a été le premier
récipiendaire du prix en 1998 et il est resté un contributeur actif dans la communauté
jusqu'à sa mort.

Dans les décennies qui ont suivi le début du projet Index Thomisticus, les médiévistes
ont souvent été les premiers à adopter le numérique, et continuent à jouer un rôle
important dans le développement d'un domaine plus large, qui a fini par être appelé
humanités numériques. ​7​ Ce champ a pris d' autres formes et noms lors de son
émergence et le développement ultérieur: informatique, sciences humaines,
informatique humaniste informatique littéraire et linguistique, des ressources
numériques en sciences humaines, eHumanities, et d' autres. Ces alternatives
concurrentes, parmi lesquelles «l'informatique des humanités» a longtemps dominé,
n'ont fait que récemment place au terme nouvellement canonique «humanités
numériques», qui est aujourd'hui rarement contesté. ​8​«Humanités numériques» est
généralement destiné à se référer à un domaine plus large que «humanités
informatiques». Alors que ce dernier est restreint à l'application des ordinateurs en
sciences humaines et avait des objectifs techniques plus étroits, le premier intègre
également une «humanités du numérique» y compris l'étude (potentiellement par des
moyens traditionnels) de sources numériquement créées, telles que l'art et la
littérature. ​9​ DH est donc profondément pluridisciplinaire et attire des contributions de
chercheurs et de scientifiques à l'intérieur et à l'extérieur des humanités et des sciences
sociales humanistes. ​dix
Les humanistes numériques ont pris soin de se définir de manière inclusive plutôt
qu'exclusive. En conséquence, le terme «humanités numériques» connote un plus grand
sens de l'intégration que la diversité des approches qui sont abritées dans la «grande
tente» de DH et qui se reflètent également dans le contenu de ce supplément. ​11​ Ainsi,
alors que la définition de DH a fait l'objet d'anthologies dédiées, ​12​ tables rondes
innombrables, et même des sites entiers ( ​http://whatisdigitalhumanities.com​), une
meilleure question pourrait être de savoir s'il existe encore des humanistes non
numériques aujourd'hui, puisque la plupart des chercheurs s'appuient au moins dans
une certaine mesure sur des outils de calcul, aussi basiques que les moteurs de
recherche en ligne ou les traitements de texte. Même les objets «originaux» de notre
recherche sont le plus souvent véhiculés par le texte imprimé ou en ligne ou par la
diapositive ou l'image numérique. ​13​ La différence entre les humanités numériques et
leurs homologues moins numérique est devenu plus une question de degré que de
nature.
Il est clair que les humanités numériques (et en son sein, les études médiévales
numériques) sont une communauté orientée vers la pratique. Il se peut que ce soit une
prise de conscience méthodologique pragmatique qui relie cette communauté, bien que
l'autoréflexion théorique et la méta-analyse soient devenues plus importantes
récemment. ​14​ Un certain nombre de théoriciens, dont Willard McCarthy, récipiendaire
du Prix Busa 2013, et John Unsworth, ont souligné la nécessaire disjonction entre
«l'objet étudié et la représentation de cet objet dans l'analyse numérique» ​15.​ McCarthy
a soutenu que le concept de «modélisation» est une caractéristique centrale des
humanités numériques. ​16​Par un modèle, il signifie «une représentation de quelque
chose à des fins d'études ou d' une conception pour réaliser quelque chose de nouveau
» Après Clifford Geertz, il établit une distinction entre les modèles ​de​ choses (par
exemple, une grammaire, une carte géographique) et des modèles ​pour​ les choses (par
exemple, un plan d'architecture). Selon les traditions disciplinaires, les modèles
scientifiques sont connus sous différents noms (représentation, diagramme, carte,
simulation, etc.). Ce que ces modèles ont en commun, c'est qu'ils offrent une
représentation condensée et souvent simplifiée des choses. Par conséquent, les modèles
sont plus facilement manipulés que les objets qu'ils représentent, ce qui permet
l'expérimentation.
Selon McCarthy, la «modélisation», le processus heuristique dans lequel les modèles
sont construits et manipulés, est au cœur des humanités numériques. Bien sûr, les
modèles et les pratiques de modélisation existent depuis longtemps dans les sciences
humaines: l'appareil critique des éditions imprimées des œuvres médiévales n'est qu'un
exemple classique d'un modèle d'édition bien connu, qui tente de représenter de façon
condensée le phénomène complexe d'un texte médiéval. tradition. Ce qui différencie les
humanités numériques, c'est une sensibilisation accrue et un intérêt explicite pour les
stratégies de modélisation, en conséquence de l'interaction intense du domaine avec les
ordinateurs. Mais les ordinateurs ne peuvent traiter que des modèles totalement
explicites et cohérents, ce qui signifie que si les ordinateurs doivent analyser les
données des sciences humaines, nos hypothèses doivent être pleinement explicites et
cohérentes. Le besoin d'explicitation et de cohérence peut être aliénant pour les
chercheurs dans les domaines des sciences humaines où l'exceptionnel est souvent
adopté. Les érudits des paradigmes poststructuralistes pourraient également confondre
le besoin d'explicitation pour le positivisme scientifique.

Les modèles et la modélisation fournissent un cadre pour présenter le travail en cours


dans le domaine des études médiévales et pour expliquer les façons dont une grande
partie de ce travail pourrait s'écarter de ce qui se passait auparavant. Tout d'abord, de
nombreux nouveaux travaux sont en cours dans les études médiévales numériques. Des
fac-similés de manuscrits électroniques à haute résolution sont produits en grande
quantité par des institutions patrimoniales du secteur GLAM (galeries, bibliothèques,
archives et musées) du monde entier. Le lien vers les manuscrits numérisés de la
British Library et la bibliothèque de la cathédrale de Cologne (Codices Electronici
Ecclesiae Coloniensis) en sont deux bons exemples. ​17​À l'avenir, on peut s'attendre à
ce que des initiatives comme le Cadre international d'interopérabilité des images
améliorent notre capacité d'inspecter et de comparer les sources primaires à une
échelle - et avec une immédiateté - qui aurait été inimaginable pour les générations
précédentes. (Nous devons nous rappeler que certaines bibliothèques n'autorisent
même pas les visiteurs à inspecter plusieurs objets physiques en même temps!) Des
institutions telles que l'Institut Schoenberg d'études manuscrites ouvrent la voie à cet
égard, avec son directeur visionnaire Will Noel honoré House Champion du changement
en 2013 pour son engagement à l'ouverture des sciences. ​18
D'excellents exemples de bibliothèques numériques enrichies comprennent le Online
Froissart (où les télécopies haute résolution sont souvent accompagnées de
transcriptions et d'informations historiques) ​19​ ou ​Monasterium.net​ , une archive
virtuelle qui offre un accès centralisé à plus de cinq cent mille sources diplomatiques
primaires, telles que les chartes , de plus de cent archives européennes. ​20​ De même
représentant est la base de données et une interface supportant le projet DigiPal, qui a
remporté le premier prix Digital Humanities de l' Académie médiévale au printemps
2017 (voir la contribution à ce supplément de cette plate - forme pour l'étude
paléographique des manuscrits anglais par le chercheur principal du projet, ​Peter A.
Stokes​ ).
Les choix de modélisation se présentent même aux étapes de recherche les plus
élémentaires. Avec la création de télécopie de base, par exemple, les choix de
modélisation critiques doivent prendre en compte les limitations de bande passante et
de mémoire, qui imposent des limites pratiques à la résolution à laquelle les manuscrits
peuvent être photographiés, stockés et distribués. À partir de quelle résolution une
photographie offre-t-elle une représentation fiable de la source immédiate? Peut-on
raisonnablement s'attendre à ce que certains utilisateurs aient besoin de reproductions
à 3 000 DPI ou plus? Johanna Drucker a donc correctement souligné que ce que nous
pourrions considérer comme des ​données​ brutes («données») dans les sciences
humaines est déjà le produit d'une forme de modélisation, même modeste; ​21​ et elle
propose que nous utilisons le terme ​capta​("Pris") pour refléter la nature construite de
ces données. Les métadonnées suscitent des préoccupations similaires, car de
nombreuses collections sont actuellement numérisées à un rythme plus rapide que les
institutions GLAM peuvent annoter manuellement avec des métadonnées. Encore une
fois, des choix difficiles doivent être faits: comment pouvons-nous (re) publier de
manière responsable des fichiers numériques pour lesquels aucune métadonnée,
incomplète ou seulement périmée n'est disponible? Devrions-nous permettre aux
utilisateurs du monde entier de publier des annotations de crowdsourcing pour ces
objets nouvellement numérisés, ou cela devrait-il rester du domaine des experts
qualifiés? L'autorité est une question complexe à cet égard et actuellement en pleine
renégociation. Beaucoup d'efforts sont déployés pour fédérer l'accès à des flux de
données hétérogènes grâce à la création de référentiels d'informations qui collectent
des informations liées. Des normes de métadonnées descriptives, telles que Dublin Core
ou les vocabulaires Getty,​22​ La contribution de​ Toby Burrows​ dans ce supplément jette
un nouvel éclairage sur la façon dont les métadonnées structurées peuvent être
exploitées dans le domaine des études manuscrites.
L'édition scientifique numérique est l'une des parties prenantes majeures de la
communauté des humanités numériques, et une grande partie de l'activité dans ce
domaine tourne autour de l'Initiative d'Encodage de Texte (TEI, ​http://www.tei.org​ ).
23​ Le TEI définit un ensemble de lignes directrices influentes pour enrichir les textes
avec des annotations interprétatives et descriptives en utilisant un langage de balisage
appelé XML. La contribution de Franz Fischer offre un large aperçu du type d'éditions
numériques et d'archives qui existent actuellement sur le web. ​24​ La reconnaissance
optique de caractères (ROC) nous a permis de transformer (numériser) des éditions
existantes en textes lisibles à la machine et consultables, qui servent souvent de base à
de nouvelles éditions numériques. Le projet électronique Beowulf (
http://ebeowulf.uky.edu​) est un projet fondateur qui a permis un meilleur accès à un
important texte médiéval. ​Beowulf​ est conservé dans un seul manuscrit du XIe siècle,
qui a été endommagé par le feu en 1731. Les transcriptions faites à la fin du XVIIIe
siècle montrent que beaucoup de lettres alors visibles le long des bords calcinés ont
ensuite été perdues. En 1845, chaque feuille était montée dans un cadre en papier. Des
discussions savantes sur la date, la provenance et la création du poème se poursuivent
dans le monde entier et les chercheurs ont régulièrement besoin d'accéder au
manuscrit. La numérisation de l'ensemble du manuscrit apporte une solution aux
problèmes d'accès et de conservation. Les corpus immenses sont aujourd'hui
disponibles pour les linguistes médiévaux; Des exemples bien connus du monde
anglo-saxon comprennent l' ​Atlas linguistique du début de l'anglais médiéval​(environ
650 000 mots) ou York-Toronto-Helsinki Corpus d'Old English Prose (environ 1,4 million
de mots), et les ressources sur cette échelle ont permis aux chercheurs de vérifier des
questions de longue date dans les études médiévales en utilisant des moyens
quantitatifs. ​25​ Les contributions de Maxim Romanov, Jeroen De Gussem et David
Joseph Wrisley dans ce supplément illustrent le type de macroanalyse que permettent
les grands corpus.
Bien que beaucoup de progrès aient été réalisés au niveau de l'OCR, l'étude
computationnelle et la transcription semiautomée des matériaux manuscrits restent une
application beaucoup plus insaisissable. ​Mike Kestemont, Vincent Christlein et
Dominique Stutzmann​ contribuent un article à ce supplément où le lecteur est introduit
dans le domaine de la vision par ordinateur et son potentiel considérable pour l'étude de
l'écriture médiévale. Beaucoup d'autres applications intéressantes de l'analyse de script
numérique sont apparues ces dernières années, telles que l'identification automatique
d'écrivain pour les documents médiévaux. ​26​ Certes, on peut s'attendre à beaucoup
plus de progrès dans le domaine des analyses visuelles pour la DH dans les années à
venir.
Dans son histoire de l'informatique en sciences humaines, Susan Hockey note que les
premiers travaux dans le domaine de la DH étaient fortement orientés vers le texte.
27​Pour les médiévistes, cela est particulièrement limitant, étant donné l'importance des
manuscrits - y compris leurs enluminures ou leurs initiales - dans la culture médiévale.
Par rapport à des fichiers image ou audio, par exemple, il est clair que les fichiers en
texte brut présentent des exigences de calcul beaucoup plus souples en termes de
stockage, d'interfaces utilisateur et de puissance de traitement. Cela aide à expliquer
pourquoi une grande partie du travail précoce a, par exemple, été de nature
lexicographique. Les analyses au niveau des mots, comme l'Index Thomisticus, se
prêtent bien à l'indexation et à la quantification informatisées. Le hockey accorde une
mention spéciale aux médiévistes comme Roy Wisbey, qui produisit un index de la
littérature Early Middle High German dès les années 1960. Mais Hockey met également
l'accent sur les sérieuses limites du matériel et des logiciels (en ce qui concerne la
mémoire) avec lesquels les adopteurs précoces ont lutté. (Il est facile d'oublier que les
smartphones modernes sont dotés de plus grandes capacités de mémoire que
l'ordinateur de bord de la mission Apollo 11 en 1969.) Même ce qui est maintenant
considéré comme des problèmes relativement triviaux, tels que l'affichage des glyphes
médiévaux sur un écran d'ordinateur. les caractères germaniques communs thorn (þ) et
eth (ð), sont restés un défi jusqu'à la fin du XXe siècle. Aujourd'hui, la norme Unicode
(​http://unicode.org​ ) cherche à fournir un soutien dans les systèmes d'exploitation et
les applications pour tous les systèmes d'écriture humaine, y compris ceux du Moyen
Age, et l'Initiative Unicode polices médiévale (MUFI, ​http://folk.uib.no/hnooh / mufi /​ )
favorise une micro- ​normalisation​ de la zone d'utilisation privée Unicode (PUA)
spécifiquement pour l'écriture médiévale occidentale.
La stemmatologie est un autre domaine typiquement médiévaliste dans lequel nous
trouvons des adopteurs précoces de méthodes computationnelles. Le logiciel de
collation a été en mesure d'aligner les variantes de lectures de manuscrit, qui
pourraient servir d'intrants à l'identification assistée par ordinateur d'un stemma
codicum. Le logiciel Collate de Peter Robinson a été utilisé pour gérer les variantes dans
le Canterbury Tales Project et ailleurs et a maintenant été remplacé par le CollateX
open-source ( ​http://collatex.net​ ) pour l'assemblage textuel. Le projet Tree of Texts de
Caroline Macé à la KU Leuven (Katholieke Universiteit, Leuven), qui fut le point de
départ du projet StemmaWeb de Tara Andrews: Outils et techniques pour la
Stemmatologie Empirique ( ​https: // stemmaweb. net /​ ).​28
Dans le domaine de l'analyse textuelle, la stylistique computationnelle (ou
«stylométrie») a également joué un rôle précoce dans le développement des humanités
numériques. L'article de ​Jeroen De Gussem​ dans ce supplément décrit une application
de cette technologie à la littérature latine du XIIe siècle. Les phénomènes stylistiques
appartiennent au domaine de la poétique tangible et ont l'avantage d'être plus
facilement quantifiables que les traits herméneutiques, c'est-à-dire ceux qui ont trait à
l'interprétation. Cela a conduit à des progrès dans l'attribution d'auteurs de textes
médiévaux, tels que les nombreux romans médiévaux qui (prétendument) résultaient
de formes collaboratives d'auteurs. Les résultats incluent l'étude précoce par John R.
Allen sur l'authenticité de l'épisode Baligant dans la ​Chanson de Roland ​29​et l'enquête
plus récente du ​Walewein​ du Moyen- O
​ rient​ par Karina van Dalen-Oskam et Joris van
Zundert, qui jette un nouvel éclairage sur les interférences complexes entre les aspects
autoritaires et scribes des textes médiévaux. ​30​ De même, la double paternité bien
connue du ​Roman de la Rose​ est maintenant souvent utilisée comme un cas de test
générique dans le développement de logiciels d'analyse de texte. ​31​ Dans des
contributions plus ciblées, les résultats d'analyses stylistiques ont été liés à des
problèmes de critique de genre. ​32​ Les analyses métriques, telles que les travaux de
Friedrich Dimpel sur le moyen-haut-allemand, sont un autre domaine où l'on peut
s'attendre à ce que les méthodes de calcul commencent à fonctionner. ​33

Bien que, historiquement, les humanités numériques aient été dominées par des
paradigmes axés sur le texte, la communauté s'engage de plus en plus avec des objets
et des méthodes de recherche multimodale. ​34

Le virage visuel
DH a adopté des visualisations dans de nombreux domaines de recherche. Graphiques,
diagrammes, diagrammes et autres interprétations visuelles étaient courants dans les
études antérieures à DH, mais avec DH a eu l'intérêt et la capacité de s'engager avec de
grands ensembles de données et de les représenter visuellement, par exemple, les
visualisations variées dans ​Maxim Romanov​ contribution à ce supplément. ​Les
visualisations de réseau sont aussi fréquemment utilisées, non seulement pour
l'exploration textuelle (article de De Gussem), mais aussi pour des analyses
géographiques, par exemple dans les articles de Romanov et Toby Burrows. ​36​ Un autre
article récent souligne la possibilité que l'analyse visuelle produise des résultats dans le
domaine de l'analyse d'images-caractéristiques, de la construction de taxonomie et des
méthodes de regroupement pour les manuscrits médiévaux; ​37​voir aussi l'article de
Kestemont, Christlein et Stuzmann​ sur les approches computationnelles pour identifier
les scripts dans ce supplément. Un certain nombre de projets récents ont investi des
efforts dans des reconstitutions virtuelles de bibliothèques médiévales à Chartres,
Lorsch et ailleurs. ​38​ Manuscriptlink, une nouvelle initiative en sciences humaines
numériques, vise à reconstruire des bibliothèques médiévales «virtuelles» en
collaborant avec des collections du monde entier pour réagréger des volumes
médiévaux précédemment perdus. ​39​ ​ La​ contribution ​de Burrows​ au présent
supplément aborde des questions connexes.
Le virage spatial
L'utilisation stratégique de la cartographie numérique est une émanation de la
visualisation, qui est souvent orientée vers l'analyse graphique de la localisation, de la
propriété et de la distribution à l'intérieur des frontières géographiques. Les ensembles
de données offrant un meilleur accès à de plus grands ensembles de données spatiales
ont fait l'objet d'une recherche améliorée dans ce domaine. Par exemple, l'application
Atlas numérique des civilisations romaines et médiévales​ (DARMC) de Harvard fournit
des cartes SIG et des géodatabases qui sont ouvertement disponibles et consultables en
ligne. ​40​ L'application des manuscrits médiévaux numérisés (DMMapp) fournit des
ressources de carte d' origine en ligne, ​41​ tandis que le mappemondes numérique
permet de rechercher entre les cartes médiévales et les sources textuelles. ​42
Les technologies du Système d'information géographique (SIG) offrent des moyens de
cartographier et de comparer les données spatiales. ​43​ Par exemple, le SIG a été utilisé
pour étudier l'histoire des paysages ruraux et urbains médiévaux. City Witness (
http://www.medievalswansea.ac.uk/​ ), un projet de recherche multidisciplinaire, a créé
une carte interactive en ligne de Swansea, c. 1300, montrant ses principales
caractéristiques topographiques et paysagères, à côté d'une édition électronique de
textes du XIVe siècle. Ensemble, la carte et les textes offrent de multiples points de vue
sur la ville et les significations attachées aux endroits dans la ville par divers groupes
sociaux et ethniques (y compris anglo-normands et gallois, laïcs et religieux, hommes et
femmes). L'objectif du projet Mapping Medieval Chester
(​http://www.medievalchester.ac.uk/index.html​ ) sont les identités que les habitants de
Chester ont formé entre c. 1200 et 1500. À l'instar de City Witness, le projet intègre
des cartographies géographiques et littéraires de la ville médiévale en utilisant des
sources cartographiques et textuelles afin de comprendre comment les paysages
urbains ont été interprétés et navigués par les habitants locaux.
Le SIG a également été utilisé pour «cartographier» des objets individuels comme la
page manuscrite. La cartographie des textes à travers le SIG est au cœur de ​la
contribution de ​David Wrisley​ au supplément; et le projet Lancelot-Graal (
http://www.lancelot-project.pitt.edu/lancelot-project.html​ ), présenté dans l'article d'
Alison Stones​ dans ce supplément, est l'un des leaders de cette adaptation du SIG.
Dans le projet de carte de Gough ( ​http://www.goughmap.org/​ ), le SIG a été utilisé
pour analyser la représentation relationnelle de l'espace dans les cartes médiévales et
contemporaines, nous permettant de comprendre que la carte du quatorzième siècle a
été conçue pour être fonctionnelle et démontré un haut degré de précision spatiale.
44​La cartographie des lieux au sein de chartes ou même de textes hagiographiques
peut permettre une meilleure compréhension de la construction d'un paysage
sociopolitique. La cartographie des lieux et des types de miracles au sein de la ​vie de
Sainte Foy de Conques​ fournit des preuves de l'étendue spatiale de l'influence du
monastère et des différences qui s'y trouvent. ​45

Reconstructions tridimensionnelles
Les reconstitutions séminales tridimensionnelles des bâtiments et des espaces passés
ont inclus les reconstructions de l'église de Cluny par le laboratoire de l'université de
Darmstadt; ​46​ site Web de la cathédrale d'Amiens dirigé par Stephen Murray à
l'Université Columbia; ​47​ et le site Web de MonArch, avec ses reconstructions
tridimensionnelles, curseur de temps, et sources textuelles liées pour
Saint-Jean-des-Vignes, Soissons, produit par Sheila Bonde et Clark Maines. ​48​ Voir
aussi la contribution de ​Sheila Bonde, Alexis Coir et Clark Maines​sur l'abbaye
d'Ourscamp dans le supplément actuel. Un projet récent ambitieux exploite les résultats
d'une étude archéologique et de sources historiques pour créer une reconstruction
tridimensionnelle complète de l'architecture de toute la ville médiévale de Montieri, en
Italie. Cette reconstruction 3D a aidé les chercheurs dans leur analyse de l'architecture
et de l'aménagement de la ville et contribuera également au patrimoine et au tourisme.
49

Le tour sonique
Les avancées numériques qui nous permettent de recréer des manuscrits médiévaux ou
de voir des reconstitutions tridimensionnelles de structures médiévales ont apporté
d'importantes contributions à la compréhension du passé médiéval. Avoir une
compréhension complète de la façon dont les gens ont fait l'expérience de ces objets et
bâtiments renforce encore cette compréhension.
Des études sérieuses ont été fortement liées au patrimoine et à la conservation, se
concentrant souvent sur la capture de chansons, de musique et de sons de notre
environnement culturel. ​50​ Pour les médiévistes, la reconstitution de musique et de
paysages sonores passés relie ces efforts aux reconstructions architecturales
tridimensionnelles. Une ressource numérique est fournie par DIAMM (l'archive d'images
numériques de la musique médiévale) à l'Université d'Oxford, qui présente des
informations sur des milliers de manuscrits, ainsi que près de quinze mille images et
métadonnées associées. Le forum en ligne ​Sounding Out! ​fournit un espace pour la
publication, les publications, la discussion et les enregistrements. ​51​Le Centre de
recherche informatique en musique et acoustique de Stanford (CCRMA) est un
établissement multidisciplinaire où la technologie numérique est utilisée comme outil
artistique et outil de recherche. ​52​ Une récente reconstitution du paysage sonore
médiéval de la cathédrale de Santiago de Compostela, dirigée par Rafael Suárez de
l'Université de Séville, a révélé que les conditions acoustiques des pèlerins de la nef
étaient compromises, tandis que les conditions acoustiques du chœur étaient idéales
pour les deux. plain-chant et polyphonie. ​53​ Voir aussi la contribution à ce supplément
de ​Bissera Pentcheva et Jonathan Abel​ , qui explore l'acoustique de Sainte-Sophie; et
l'article de ​Spyridon Antonopoulos, de Sharon Gerstel, de Chris Kyriakakis, de
Konstantinos T. Raptis et de James Donahue​ décrivant les aspects acoustiques des
églises byzantines à Thessalonique.

Environnements immersifs et patrimoine

La possibilité de faire une visite virtuelle des sites médiévaux est une émanation du
travail numérique avec une application du patrimoine, et Google et l'UNESCO ont
collaboré pour offrir des visites virtuelles à plusieurs endroits importants. ​54​IIVE
(Environnements Virtuels Immersifs Interactifs) fournit un engagement interactif pour le
«spectateur» dans le cadre d'un musée ou d'un affichage du patrimoine. Second Life et
son homologue open-access, OpenSimulator; Myo; Lunettes Google; et Oculus VP sont
toutes des applications potentielles. Ces mondes virtuels, où les utilisateurs sont
représentés par des avatars, permettent une interaction entre les utilisateurs et
l'environnement et sont donc appropriés pour simuler des environnements (passés) en
temps réel. Ils peuvent (bien qu'ils n'incluent pas toujours) inclure des sens au-delà du
visuel, en particulier du harnais. Un de ces sites, centré sur la cathédrale de Saint
Andrews en Écosse, combine la reconstruction en trois dimensions des bâtiments de la
cathédrale, le mouvement des processions, de la musique et d'autres sons,
expérimentés à travers un avatar. ​55​Alors que les musées de brique et de mortier sont
coûteux à construire et à entretenir, et que le déplacement vers un site archéologique
peut ne pas être praticable (surtout après la fin d'une fouille), une expérience simulée
de visite peut être créée grâce à la technologie numérique. Deux projets archéologiques
du monde romain, les projets Rome Reborn et Portus, ont fourni ces technologies à des
visiteurs virtuels. ​56​ Une application médiévale récente a été réalisée pour une banlieue
musulmane du dixième au douzième siècle de Sinhaya, en dehors de Saragosse. La
visualisation de Sinhaya était basée sur les preuves archéologiques des fouilles ainsi
que des documents d'archives. Des algorithmes d'éclairage photoréalistes ont été
développés par le Grupo de Informática Gráfica Avanzada (GIGA), et l'animation
virtuelle peut être visualisée dans un système de type CAVE à faible coût.​57

Études médiévales ouvertes

Dans les humanités numériques, les formes traditionnelles de publication imprimée


n'ont pas cessé d'exister, mais elles sont souvent complétées et soutenues par des
formats électroniques. De nombreux humanistes numériques sont attirés par le faible
seuil et l'immédiateté des plateformes de communication électronique, de sorte que les
communications savantes se produisent de plus en plus dans des articles de blog moins
officiels, des sections de commentaires et des plateformes en ligne ou de
micromessagerie. De nombreux humanistes numériques s'inspirent du mouvement de la
science ouverte, qui préconise une distribution électronique la plus large possible via
des référentiels et des revues à accès libre, non seulement des résultats de recherche,
mais aussi des données de recherche primaires (par exemple, éditions) et des
brasseries maison. logiciel qui a permis la recherche.
Des propositions aussi ambitieuses sont parfois opposées à une érudition plus
conventionnelle dans les sciences humaines, où les chercheurs sont supposés assis
seuls et méditant sur leur travail pendant une période prolongée, jusqu'à ce que la
recherche soit finalement perfectionnée et diffusée dans un format qui, ils espèrent,
durera longtemps. âge. Ces projets conventionnels à plus long terme - généralement
entrepris par des individus plutôt que par des équipes - sont aujourd'hui sous la
pression des humanistes numériques, qui soutiennent que des formes plus
traditionnelles d'érudition et la culture de publication associée conduisent à des
recherches moins durables. points de vue.
La création et la publication d'une édition imprimée traditionnelle de documents
médiévaux ne permettent pas facilement aux générations futures d'affiner ce travail et
d'ajouter des couches d'annotation et d'analyse, en particulier si les données sources
d'origine ne sont pas libérées avec les volumes d'impression. Avec la publication
électronique, la fourniture des données primaires signifie également que les futurs
universitaires n'auront pas besoin de passer par un processus de numérisation lourd et
sujet aux erreurs. L'utilisation de plates-formes de gestion de versions, telles que
GitHub ( ​http://github.com​), sont utiles à cet égard, car ils permettent aux chercheurs -
et à leurs pairs - de suivre, commenter et distinguer les versions de l'œuvre en temps
réel. Ainsi, les commentaires des pré-publications peuvent être pris en compte par les
chercheurs, et les corrections post-publication mineures n'ont pas besoin d'attendre
l'intégration de la prochaine édition imprimée.
La facilité avec laquelle le travail intellectuel numérique dans les études médiévales
peut être modifié au fil du temps le rend plus fluide que les formats imprimés. Umberto
Eco n'était qu'un parmi de nombreux penseurs contemporains à lier l'instabilité des
ressources électroniques modernes à la culture médiévale des textes. Internet est un
média jeune et encore fragile qui lutte contre le phénomène bien connu des «liens
morts» qui compromet naturellement la citabilité des sources. La crédibilité des sources
d'information et de données est un «problème de démarrage» évident de la DH et, par
conséquent, une préoccupation importante dans de nombreux projets. ​58​Les livres ne
sont pas copiés et distribués aussi facilement que les fichiers numériques, mais nous
avons des livres utilisables après des siècles, alors que les fichiers informatiques
peuvent devenir illisibles en une décennie sous forme de systèmes d'exploitation, de
formats de stockage, d'encodages et de logiciels. se démoder. Dans de nombreux cas,
la fragilité d'une édition numérique réside non seulement dans les données, mais
également dans l'application que nous utilisons pour interagir avec les données. Par
exemple, une concordance numérique peut avoir des avantages pratiques par rapport à
une concordance papier, mais seulement si elle n'est pas enfermée dans un
environnement matériel ou logiciel qui n'est plus à la mode.
Les droits de propriété intellectuelle, les coûts économiques et les questions de respect
de la vie privée font également obstacle à la réalisation naïve de l'objectif ambitieux
d'une étude médiévale complètement ouverte. ​59​ L'ensemble de Patrologia Latina, par
exemple, peut aujourd'hui être trouvé dans des versions numérisées en ligne. Tandis
que la qualité de ces textes librement disponibles est généralement plus faible (ils
abondent en erreurs d'OCR) que ce qui peut être trouvé dans les bases de données
d'abonnement établies telles que la bibliothèque des textes latins de Brepols (
http://www.brepolis.net/​ ), il est un intéressant, mais aussi inquiétant, le
développement que la simple «disponibilité» d'une version textuelle particulière devient
rapidement un critère de sélection qui rivalise avec l'importance séculaire attachée au
critère de la qualité. ​60​De nombreux sites de sciences humaines numériques exigent
déjà que les chercheurs soumettent leurs données sources avec leurs documents, ce qui
est impossible dans le cas des éditions protégées par le droit d'auteur. Alors que pour
de nombreuses applications en data mining, les différences minuscules entre les
éditions du même texte importent peu, il est frustrant que les matériaux de haute
qualité produits par les générations précédentes soient parfois sérieusement
sous-utilisés en DH pour des raisons d'accessibilité et de partage. " problèmes.
En ce qui concerne l'aspect économique, les revues à accès libre, telles que le ​Digital
Medievalist Journal​ ( ​https://journal.digitalmedievalist.org/​), sont des initiatives
courageuses car elles ne peuvent pas compter sur un flux de revenus stable sous forme
de cotisations pour garantir leur pérennité. De nombreuses revues en libre accès
factureront à l'auteur une «taxe de traitement des articles» (APC) substantielle, ce qui
soulève des inquiétudes quant à l'indépendance financière des chercheurs sans soutien
institutionnel, en particulier les chercheurs retraités ou ceux en alternance (# alt-ac) .
Un avantage majeur des revues imprimées traditionnelles est donc qu'elles sont en
grande partie gratuites pour les auteurs. La communauté open-access travaille
actuellement à surmonter ce défi: les académies nationales prendront probablement de
nouvelles responsabilités, et des initiatives telles que l'Open Library of Humanities (
https://www.openlibhums.org/​) - qui vise à couvrir entièrement les CPA pour les revues
de leurs collections - devrait jouer un rôle plus important dans un proche avenir.
Dans l'ensemble, le droit d'auteur demeure une question largement non résolue dans
les sciences humaines aujourd'hui et, sans doute, trop peu de médiévistes, aussi bien
numériques que non numériques, sont correctement informés sur les diverses
possibilités de licences. Les licences d'accès libre, telles que Creative Commons (CC),
permettent aux auteurs d'imposer une attribution au créateur original d'une œuvre (par
exemple, CC-BY) ou d'ajouter des restrictions en ce qui concerne l'utilisation
commerciale de leur travail (par exemple, CC -NC) ou réutilisation ultérieure (CC-SA,
CC-ND). Le fait que ce supplément numérique à ​Speculum​ soit publié en libre accès,
sous une licence libérale qui encourage une large diffusion, reflète ces préoccupations
dans la communauté DH. Nous sommes reconnaissants à l'Université de Chicago Press
et à la Medieval Academy of America pour leur ouverture à ce projet ainsi que pour leur
soutien.
Une lecture panoramique du ​spéculum

D'un point de vue méthodologique, il est vital que les nouvelles approches de la culture
médiévale ne perdent pas de vue les méthodes savantes traditionnelles et plus
conventionnelles. Néanmoins, des tensions suscitant la réflexion ont émergé entre les
sciences humaines numériques et traditionnelles. En 2010, par exemple, Google a
collaboré avec un grand nombre de scientifiques pour publier un article ​scientifique
influent sur le célèbre projet Google Livres. ​61​ Dans ce projet, le géant technologique
californien affirme avoir numérisé environ 4% de tous les livres jamais imprimés - et
l'expansion de l'ensemble de données est toujours en cours. Parce que cet ensemble de
données est facilement consultable en ligne, ​62​il offre une ressource pratique, que les
chercheurs interrogent aujourd'hui plus souvent qu'ils ne veulent l'admettre. Dans cet
article, Jean-Baptiste Michel et al. discuter d'un domaine de recherche émergent appelé
«culturomics», l'étude des données culturelles à haut débit par l'analyse lexicale, et ils
se concentrent sur l'analyse diachronique des fréquences des mots dans les livres
anglais (1800-2000). Bien que leur stratégie de comptage de mots soit simple, leur
recherche a démontré que l'utilisation des mots dans les grands corpus est en
corrélation avec les développements culturels. La fréquence relative du mot
«esclavage», par exemple, a atteint un sommet dans leurs données pendant la guerre
civile américaine et plus tard pendant le mouvement des droits civiques. En plus d'un
large éventail d'analyses linguistiques, leur compte de mots a même démontré la
censure active d'artistes juifs, tels que Marc Chagall, dans l'Allemagne nazie.
En décembre 2010, les deux principaux auteurs du document ont présenté leur travail
stimulant lors de la réunion annuelle de l'American Historical Association. Le président
de l'association, Anthony Grafton, proposera plus tard un compte-rendu fascinant de cet
événement: «Malgré tout leur panache - et tout le plaisir que leur permet leur outil -
Lieberman-Aiden et Michel ont aussi inspiré un peu d'inquiétude. le statut de notre
discipline. " ​63​Grafton a regretté que la liste d'auteurs du journal, bien que
considérable, n'incluait pas un seul historien, et que ce manque d'expertise historique a
parfois montré dans leur présentation. Il a déclaré, déçu, que «[p] ablitentiellement, les
historiens n'ont pas établi, aux yeux de beaucoup de leurs collègues des sciences de la
nature, qu'ils possèdent des connaissances spécialisées qui pourraient être précieuses,
voire cruciales.» Lieberman-Aiden et Michel Ils contrediront plus tard ce point de vue en
soulignant qu'ils ont reçu des commentaires d'historiens universitaires, bien que leurs
noms n'aient pas été inclus dans la liste finale des auteurs. ​64​Ils ont déclaré que, même
si les «connaissances spécialisées» sont importantes, les paradigmes partagés, un
langage partagé et des valeurs intellectuelles communes constituent une grande partie
de ce qui fait qu'une équipe réussie se réunit. Cela suggère que les départements
d'histoire doivent faire face à plusieurs responsabilités nouvelles: pour encourager la
connaissance des méthodes quantitatives, avec des techniques de calcul, et comme
vous l' avez écrit de façon éloquente avec la collaboration à grande échelle « . ​65
L'initiative de recherche à la base de l'article de culturomics est une instanciation
typique de ce que l'on appelle communément la «lecture lointaine» dans les humanités
numériques, une notion vaguement définie, introduite par Franco Moretti dans une série
d'essais. ​66​ À l' heure actuelle, la lecture à distance (parfois aussi connu sous le nom
macroanalyse, critique algorithmiques, lecture panoramique, et d' autres termes) joue
un rôle dans une variété d'approches de l' analyse de texte dans les sciences humaines
où les grands corps de textes sont interrogeables et analysées à l' aide d' une
combinaison de techniques de la technologie du langage, de la recherche d'information
et de la science des données. ​67​Le point commun à toutes ces approches est la
stratégie selon laquelle une partie importante du processus de lecture classique est en
fait délibérément sous-traitée à une machine; l'intervention humaine est largement
reportée à l'interprétation du modèle simplifié que les algorithmes donnent. Comme l'a
noté Moretti, la distance du lecteur par rapport au texte original en tant que tel devient
une fonction de la portée accrue de l'effort de lecture.
Le mélange de fascination et d'inquiétude de Grafton est probablement représentatif de
l'attitude que de nombreux chercheurs entretiennent aujourd'hui envers de telles
formes de lecture lointaine. Le fait qu'une partie cruciale du processus de lecture soit
sous-traitée à une machine remet en question la qualité du modèle textuel que les
méthodes computationnelles de pointe peuvent offrir. Comme moyen d'interroger ces
questions, il sera illustratif de discuter d'un petit, mais représentatif et critique, lecture
à distance. ​68​ Pour cela, les Presses de l'Université de Chicago nous ont accordé l'accès
à une version numérique du ​Spéculum​ archives couvrant l'ensemble de la période de
soixante-dix années entre l'édition inaugurale de la revue en 1926 et décembre 2016.
Comme dans tout corpus important de nos jours, la qualité du texte numérique varie
énormément: pour la partie jusqu'au volume 84, nous devons travailler la sortie de la
reconnaissance optique de caractères, alors que nous pouvons travailler avec des
données natives et numériques à partir du volume 85 et au-delà.

Comme peut être glané de la parcelle de barre sur la ​Fig. 1​, où le nombre de jetons a été 
agrégé sur une base annuelle, l'ensemble de données complet s'élève à plus de 65 millions de 
jetons (mots, mais aussi signes de ponctuation et autres symboles), bien que les chiffres 
montrent de fortes fluctuations au cours des années. Néanmoins, la taille impressionnante 
des archives soulève la question intrigante de savoir si de précieux modèles pourraient être 
extraits de ces données, ce qui pourrait donner une «vue panoramique» du contenu et des 
biais thématiques de la revue ainsi que son développement au fil des ans. Quels auteurs et 
textes médiévaux se classent le plus haut, par exemple, dans ​Speculum​la liste de popularité 
de popularité; et quelles approches savantes ont évolué dans ou hors de la mode au fil des 
ans? Pour cet effort, nous avons utilisé une gamme de techniques de calcul, qui sont 
représentatives de l'état de l'art dans les stratégies de modélisation textuelle dans les 
humanités numériques de nos jours. Espérons que cet ensemble de méthodes nous permettra 
de présenter, dans un langage non technique, les opportunités et, peut-être plus important 
encore, les défis qui découlent d'une telle application «vanille» de la lecture à distance. 

Fig. 1. Le​ mot compte pour les données de l' archive ​Speculum​ , agrégées au niveau de 
l'année (1926-2016). 
Une étape courante de prétraitement dans l'analyse textuelle consiste à appliquer un 
soi-disant étiqueteur au matériau, une procédure établie dans le traitement du langage 
naturel. Dans cet exercice, nous avons segmenté le flux brut original de caractères dans un 
article ​Speculum​ en unités de jetons significatives. Par exemple, clitic "do not" sera restauré 
en "do" et "not". ​69​ Nous avons appliqué la suite logicielle Stanford CoreNLP à l'archive, 
qui offre une multitude de procédures de base et qui est maintenue par l'un des principaux 
groupes de recherche dans le domaine de la technologie du langage. ​70​ Ci-dessus, nous 
montrons un exemple dans le ​tableau 1​ pour la sortie de la suite pour une phrase 
sélectionnée au hasard à partir d'un ​spéculum​ 1955contribution. Comme on peut le voir dans 
cet exemple, le logiciel tentera de déterminer pour chaque jeton lemme (ou dictionnaire 
fléchie mot - clé, c'est passé ​a​ devient ​prendre​ ), la partie du discours ( ​titre​ , tel qu'il est 
utilisé dans cet exemple, est un NN, ou nom singulier) et une indication de si le jeton est une 
entité nommée ( ​1066​ est une date, mais ​Raimond​ est catégorisé comme une personne). Le 
logiciel prend ces décisions sur la base d'une évaluation statistique de l'apparence d'un jeton 
(par exemple, le jeton est-il capitalisé?) Et du contexte lexical dans lequel il apparaît (par 
exemple, le jeton est-il précédé d'un adjectif?). 

 
Tableau 1.​ Exemple d'une phrase (tirée au hasard d'un problème de ​spéculum de​ 1955
), étiquetée par la suite Stanford CoreNLP

Index  Token  Lemma  Part of speech  Named entity 


1  This  this  DT  O 
2  Raimond  raimond  NN  PERSON 
3  took  take  VBD  O 
4  the  the  DT  O 
5  title  title  NN  O 
6  of  of  IN  O 
7  Baron  Baron  NNP  PERSON 
8  de  de  IN  PERSON 
9  Saint-Gilles  Saint-Gilles  NNP  PERSON 
10  in  in  IN  O 
11  1066  1066  CD  DATE 
12  .  .  .  O 
En raison de la nature ambiguë du langage humain, un tel enrichissement automatique du 
matériau produira naturellement de nombreuses erreurs, notamment dans le cas des données 
OCR avec ses orthographes instables, mais il offre néanmoins déjà de nombreuses 
possibilités d'interrogation créative du corpus. Une question intéressante pourrait être quelles 
dates médiévales ont été les plus fréquemment mentionnées dans ​Speculum au​ cours des 
années. Pour cela, nous avons retracé la fréquence cumulée de tous les nombres de 
l'ensemble de données qui avaient été marqués comme une date dans la colonne d'entité 
nommée et qui se situait dans la fourchette «médiévale» de 500-1500. Dans le nuage de 
points de la ​figure 2​, on trace les vingt-cinq dates avec la fréquence cumulée la plus élevée 
du corpus en fonction de leur coefficient de variation sur les documents du corpus, pour 
suivre leur dispersion sur le matériau. 

Fig. 2.​ Diagramme de dispersion montrant les années les plus communément mentionnées 
(500-1500) dans le ​spéculum​ . 
Plus haut dans l'intrigue une date peut être trouvée, plus la date est fréquente; plus il
est positionné vers la gauche (et plus sa taille de police est grande), mieux il est réparti
sur les documents individuels du corpus. Le sommet de la liste est clairement dominé
par des dates rondes (1300, 1200, 1000). Cela reflète le fait que les médiévistes ont
généralement préféré penser aux frontières conventionnelles décennales, millénaires et
millénaires. Néanmoins, il est tentant de relier un certain nombre de dates plus haut
dans cette liste à des événements bien connus dans la période médiévale, y compris
1066 (la bataille de Hastings) ou 1204 (le limogeage de Constantinople dans la
quatrième croisade). Pour une date emblématique telle que 1430, il est intéressant que
l'on puisse être tenté de la lier à plusieurs événements, ce qui aide à expliquer son
importance: on peut penser au siège de Compiègne et à la capture de Jeanne d'Arc,
mais aussi au mariage de Philippe le Bon et à l'installation de l'Ordre de la Toison d'Or.
Fait intéressant, les années 1000 et 1348 (éclosion de la peste noire) ont une dispersion
plus faible que leur fréquence élevée pourrait nous rendre suspect.

De telles agrégations de fréquences au niveau du corpus sont un jouet intéressant pour nous 
aider à caractériser les études médiévales d'un point de vue panoramique, mais le marquage 
de notre matériel nous permet également d'interroger ​Spéculum​ d'une manière plus 
spécifique. Pour les graphiques linéaires des Fig. ​3a-b​Par exemple, nous avons calculé la 
fréquence relative de tous les noms (pluriels ou singuliers) dans le matériau au cours de la 
période 1926-2016. En utilisant un test statistique commun ( ​tau​ de Kendall ), nous avons 
interrogé les résultats pour les cinq noms qui ont montré la diminution (a) ou l'augmentation 
(b) la plus stable dans l'utilisation de ​Speculum​ . Les résultats de la ​Fig. 3a​ne sont pas 
particulièrement excitants, et montrent simplement que les styles de citation traditionnels 
(Latinate) (op.cit., ff., loc.) se développent à la mode chez les auteurs ​Speculum​ . ​Fig. 3b​, 
d'autre part, suggère une augmentation de fréquence propre et étonnamment linéaire des 
mots "rôle" et "contexte": ce phénomène suggère fortement que les études médiévales, telles 
que représentées par les articles ​Speculum​ , ont été marquées au XXe siècle par une 
transition vers une approche plus fonctionnaliste et contextualisée du Moyen Âge, ce qui a 
déjà été souvent observé dans les études littéraires. Le changement dans l'utilisation des 
mots «aperçu», «focus» et «potentiel» semble d'autre part être de nature métascholar et 
pourrait signaler une tendance vers une plus grande professionnalisation et spécialisation 
savante dans le domaine plus large des études médiévales. 

Fig. 3.​ (a) La fréquence relative des noms avec la chute de fréquence la plus linéaire. (b) La 
fréquence relative des noms avec l'augmentation la plus linéaire de la fréquence. 
Nos analyses jusqu'ici ont été purement lexicales ou réalisées au niveau des mots
individuels. Le problème avec une telle approche brute de comptage de surface est
qu'elle dissimule le contexte réel dans lequel les mots sont utilisés. Si un mot a été
fréquemment utilisé dans ​Speculum​, cela semblerait en effet témoigner de la saillance
culturelle du mot dans le monde des médiévistes, mais cette approche sans contexte ne
peut pas nous dire si le terme a des connotations principalement positives ou négatives,
ni indiquer le contexte savant dans lequel il est généralement utilisé. Pour remédier à
cette situation, les humanités numériques utilisent de plus en plus des méthodes
empruntées à la sémantique distributive, un domaine de recherche passionnant dans le
traitement du langage naturel (ou la linguistique computationnelle). Dans ce domaine
d'étude, les chercheurs s'appuient sur l'idée générale que les mots dérivent
principalement du contexte lexical dans lequel ils apparaissent. ​71​ Par exemple, dans
une phrase telle que "J'ai fait le * ​blarf​ chercher le bâton" ou "j'ai pris le * ​blarf​pour sa
promenade du soir, «le contexte dans lequel le terme inexistant * ​blarf​ apparaît
fortement suggère un animal domestique - peut-être un chien.
Dans la sémantique distributive, les chercheurs tentent de modéliser les modèles de
répartition dans les occurrences de mots trouvées dans les grands corpus, tels que l'
archive ​Speculum​ . L'hypothèse sous-jacente est que le vocabulaire peut être modélisé
en un ensemble de champs ou de sujets sémantiques; ces sujets sont constitués de
groupes de mots qui coexistent généralement dans des documents ou des paragraphes
et qui sont donc plus susceptibles d'appartenir au même sujet que des mots qui
n'apparaissent jamais dans le même contexte. ​72​Chacun des thèmes d'un tel "modèle
de sujet" peut être supposé porter un certain poids, ou score de sujet, sur chaque
document dans un corpus: un article de journal sur le transfert d'un footballeur célèbre
au Real Madrid, par exemple, pourrait être caractérisé Nous avons soumis l' archive
Speculum​ à un exercice de modélisation de sujet en utilisant la méthode bien connue
NMF (factorisation matricielle non négative). ). Nous avons demandé à la méthode
d'extraire les 250 sujets les plus saillants à partir de segments consécutifs de 500 mots,
qui n'incluaient pas de mots vides (tels que des articles, des signes de ponctuation ou
des prépositions).

Nous avons choisi une sélection représentative de ces sujets et les avons visualisés comme 
une série de nuages ​de mots dans la ​Fig. 4​. Cette sélection démontre clairement la variété 
internationale et thématique des contributions de ​Speculum au​ cours de l'histoire de la revue. 
Dans ces nuages, la taille de la police des mots individuels reflète leur importance relative 
pour le sujet. Notez que le modèle de sujet lui-même ne produit pas un "label" net pour un 
sujet, mais ses mots les plus significatifs donnent généralement une indication solide quant à 
la portée sémantique d'un thème particulier. Ces sujets forment des clusters de mots 
relativement nets, même si cette analyse ne dépend pas de ressources externes, telles que les 
dictionnaires: le modèle dérive ses connaissances sémantiques d'une manière entièrement 
basée sur les données uniquement à partir des statistiques d'utilisation des mots dans un 
grand corpus. 

Fig. 4.​ Nuages ​de mots représentant une sélection de thèmes sélectionnés parmi nos modèles 
thématiques (250 sujets au total). Seuls les mots les plus saillants sont tracés pour chaque 
sujet; la taille de la police des mots individuels donne une indication de leur importance 
relative pour le sujet en question. 
Cette vue d'ensemble des sujets témoigne de la dominance des sujets insulaires, y
compris ceux qui capturent les domaines thématiques entourant les ​Contes de
Canterbury​ , ​Beowulf​ , Monmouth's Arthuriana, ​Piers Ploughman​ et ses collègues
allitératifs, ou la domination du monachisme clunisien et de l'architecture de la
cathédrale. Néanmoins, la diversité topique est assez riche pour inclure la littérature
latine du XIIe siècle de France, telle que la grappe de littérature cistercienne autour de
Bernard, et aussi le monde des sagas scandinaves et de la ​Commedia​ de Dante.. Un
certain nombre de sujets reflètent aussi clairement des intérêts thématiques de plus
haut niveau, tels que l'amour courtois, ainsi que des thèmes au sein de l'architecture
médiévale, des études islamiques et des études de genre. De nombreux sujets semblent
également aborder les principaux conflits culturels qui ont caractérisé la période
médiévale, notamment la confrontation de la culture chrétienne avec l'arabe dans
l'Espagne médiévale ou la tension entre le christianisme et le judaïsme - notez la
présence de termes polaires tels que accusation, violence , et assassiner dans le dernier
sujet.

Fait intéressant, ce modèle de sujet nous permet également d'étudier l' archive ​Speculum​ de 
façon plus diachronique. Si nous devions calculer la présence moyenne d'un sujet spécifique 
dans tous les problèmes de ​spéculum​ qui ont été publiés au cours d'une année donnée, tracer 
ces scores sur un calendrier pourrait fournir un aperçu de l'évolution thématique. Dans les 
Figs. 5a-d​, nous avons tracé un certain nombre de lignes de tendance pour une sélection de 
sujets qui semblent révéler des modèles évolutionnistes intéressants. Le sujet lié au genre 
156 ( ​femmes​ , ​femmes​ , ​hommes​ ), par exemple, semble avoir seulement gagné en 
importance dans les années quatre - vingt, et va de même pour l'approche socio - culturelle, 
fonctionnaliste à la littérature ( ​sociale​ , ​culturelle​ , ​culture​ ), qui semble être capturé dans le 
sujet 231. l' une des plus évidentes tendances « vers le bas » est l'utilisation décroissante du 
latin dans toute l'histoire de la revue (sujet 3) -notre analyse suggère également des 
tendances similaires pour d' autres langues, comme le français et l' allemand-ce qui suggère 
que ​Speculum​devient un journal plus monolingue. D'autres sujets sont caractérisés par des 
pics plus locaux, comme le sujet 48, qui reflète un nombre élevé de citations dans le 
domaine de l'aristotélisme médiéval ( ​averrois​ , ​aristotelem​ , ​commentariorum​ ) dans la 
période 1950-1970. 

Fig. 5.​ Quatre graphiques illustrant la présence diachronique des sujets sélectionnés dans les 
questions sur le ​spéculum​ sur une base annuelle. 
Alors que la modélisation de sujets offre des perspectives qui ne sont pas disponibles à
partir d'approches de comptage de mots plus simples, elle soulève également de
nouveaux problèmes. Est-ce que le mot ​Bernard​ , par exemple, fait référence à l'auteur
médiéval Bernard de Clairvaux ou au savant actuel Bernard McGinn (ou les deux)? Le
problème qui se pose ici est que même les entités nommées peuvent être ambiguës, et
pour parvenir à une approche plus holistique de la lecture automatique des machines,
ces entités doivent être désambiguïsées. "Wikification" est un terme utilisé
familièrement pour désigner le processus de désambiguïsation d'une entité nommée
entre documents dans le traitement du langage naturel. ​73​De nombreux outils logiciels,
tels que la suite Stanford CoreNLP utilisée ci-dessus, sont disponibles aujourd'hui pour
étiqueter automatiquement les entités nommées dans un texte libre, tel que les noms
d'individus ou de lieux. Alors que ce processus de reconnaissance d'entités nommées
est déjà un pas crucial vers l'extraction des connaissances, l'ambiguïté des entités
nommées constitue un obstacle majeur sur la voie de la compréhension autonome
d'une machine. Dans une phrase comme "Clinton a pris la scène", il n'est pas clair si
l'entité nommée se réfère à Hillary Clinton, Bill Clinton, ou le musicien funk éponyme,
George Clinton.
Dans les études de wikification, les chercheurs tentent d'extraire des indices du
contexte sémantique dans lequel une entité nommée se produit pour aider à
désambiguïser ces mentions. Si la phrase se lit comme suit: «La secrétaire Clinton est
entrée en scène», l'apposition «secrétaire» suggère fortement que la phrase se réfère à
Hillary, puisqu'elle est la seule candidate à l'homonymie à occuper ce poste spécifique.
De plus, les systèmes de wikification peuvent exploiter le fait que les entités nommées
mentionnées dans un texte forment généralement un ensemble sémantiquement
cohérent: dans la phrase «Clinton a pris la scène avec Bob Marley», l'identification
relativement univoque du musicien Bob Marley suggère que le Clinton dans cette phrase
est l'artiste George Clinton.

Les chercheurs se tournent souvent vers Wikipédia comme une ressource pour 
l'extraction des identifiants uniques et fixes pour les entités nommées. En reliant les 
entités nommées à l'entrée unique et pertinente d'une entité nommée dans 
l'encyclopédie bien connue, l'algorithme exécute efficacement une résolution d'entité 
nommée inter-documents. De plus, Wikipédia est construit au-dessus d'une structure 
ontologique riche, de sorte que différentes sortes de métadonnées peuvent être récoltées 
pour chaque entité, sous la forme d'étiquettes descriptives indiquant si un individu était, 
par exemple, un philosophe ou un roi. Wikipédia a une portée impressionnante, mais en 
même temps l'utilisation d'un wikifier introduit de forts biais. Les entités nommées 
inhabituelles qui n'ont pas encore reçu de page Wikipedia identifiable seront ignorées 
par nécessité. Également, le fait que nous utilisions un wikifier pour la langue anglaise 
pourrait biaiser notre analyse vers des entités relativement plus saillantes, 
culturellement parlant, dans la partie anglo-saxonne du monde. Lorsque nous 
appliquons le wikifier de l'Illinois​74​ à l'archive de texte en clair de​ Speculum​ , une 
lecture superficielle de la sortie du wikifier suggère anecdotiquement que le wikifier se 
débat avec la mauvaise qualité OCR des premiers volumes, mais est néanmoins capable 
de produire des annotations intéressantes: 
 

Il y a longtemps <a class="wiki" href=" ​http://en.wikipedia.org/wiki/John_Rhys


"cat="person écrivain académicien écrivain membre des celticists principal"> Sir
John Rhys </a> a offert une interprétation solaire de <a class="wiki" href="
http://en.wikipedia.org/wiki/Matter_of_Britain​ "cat="legend"> savoir-faire
arthurien </a>, mais, selon <a class =" wiki "href = "
http://en.wikipedia.org/wiki/Roger_Sherman_Loomis​ " cat = "universitaire savant
alumnus"> Loomis </a>, il n'a pas travaillé sur le système mythologique celtique à
partir des preuves du <a class = "wiki "href ="
http://en.wikipedia.org/wiki/Irish_language​ "cat =" langue "> irlandais </ a> et
<a class="wiki" href=" ​http://en.wikipedia.org/wiki/Welsh_language​ "chat
="language"> gallois </a> légendes eux-mêmes.
Notez que les offres de wikifier bien dans cet exemple avec abstraire sur les synonymes 
superficielles: dans les textes qui mentionnent ​Bernard​ , ​Bernardine​ , ou ​Bernard de 
Clairvaux​ , les entités seront mises en correspondance avec le même identifiant unique que 
leurs équivalents latins, tels que ​Bernardus Clarevallensis​. Par conséquent, un tel outil offre 
des capacités de recherche beaucoup plus puissantes que les données textuelles brutes. 
Néanmoins, les "désambiguïsations" ne sont certainement pas irréprochables, et parfois 
tragiquement hilarantes - toutes sortes de célébrités américaines, y compris des lutteurs 
célèbres et des artistes pop, sembleraient avoir apporté une contribution beaucoup plus 
importante à l'érudition médiévale que nous aurions pu le prévoir. Néanmoins, lorsqu'elle est 
agrégée à un niveau supérieur, la sortie du wikifier est suffisamment précise pour dresser des 
listes de résultats encore plus perspicaces que celles que nous avons montrées jusqu'à 
présent. Dans la ​Fig. 6​, nous avons exploité les métadonnées que le wikifier attache à chaque 
entité pour dresser une liste des auteurs (a), des poèmes (b) et des saints (c) les plus saillants 
- ou, au moins, les plus fréquemment mentionnés - dans ​Speculum​ . 

 
Fig. 6.​ Subplots montrant les auteurs (a), les poèmes (b) et les saints (c) les plus 
fréquemment cités dans ​Speculum​ sur la base de l'homonymie de l'entité nommée du 
wikifier. 
Bien que ces listes de résultats soient intéressantes en elles-mêmes, l'examen de la simple 
fréquence ne révèle pas les relations complexes qui peuvent exister entre elles et avec 
d'autres mots auxquels ces entités sont généralement associées. Pour étudier et visualiser 
ceux-ci, nous nous tournons vers une dernière technique, à partir de la sphère des 
plongements distributionnels: les plongements de mots. Tout comme les techniques de 
modélisation de sujets, les intégrations de mots reposent sur l'hypothèse distributionnelle 
selon laquelle des mots ayant un sens similaire auront tendance à apparaître dans des 
contextes similaires. Cependant, alors que les techniques de modélisation de sujet visent à 
trouver de bonnes représentations pour les sujets et les documents, l'incorporation de mots 
peut produire des représentations beaucoup plus fines pour des mots individuels. Les 
incorporations de mots représenteront les éléments d'un vocabulaire en utilisant un vecteur 
numérique, ou une liste de nombres qui visent à caractériser le sens du mot. L'avantage d'un 
tel modèle de niveau de mot est que nous pouvons appliquer une simple arithmétique à ces 
représentations vectorielles et demander au modèle, par exemple, de renvoyer les cinq mots 
qu'il juge les plus proches d'un certain terme de requête. Si nous appliquons un modèle 
populaire de mot-embeddings (word2vec) à notre corpus wikified, nous pouvons inspecter le 
voisinage sémantique immédiat des termes suivants listés dans​Tableau 2​ . ​75​ Utilisation de 
la représentation vectorielle que nous pouvons extraire pour nos auteurs wikified, nous 
pouvons également utiliser ces incorporations pour visualiser les relations entre nos auteurs 
dans un dendrogramme ou un diagramme d'arbre. Dans la ​Fig. 7​, les liens wikified prennent 
la forme de feuilles dans un arbre, qui sont finalement joints dans de nouveaux noeuds dans 
une structure de branche. Les branches reflètent les distances entre les représentations que 
nous avons obtenues pour ces auteurs. Notez comment la structure qui découle de cet arbre a 
du sens (monarques se regroupent avec des monarques, philosophes avec des philosophes, 
etc.) mais offre aussi des résultats surprenants: Ovide et Virgil, par exemple, se regroupent 
avec Boccace, Pétrarque et Dante, au lieu de avec d'autres auteurs de l'Antiquité, tels que 
Cicéron ou Platon. Notez, également, comment l'arbre réalise au niveau supérieur ce qui 
semble être une répartition assez nette entre les auteurs vernaculaires et les autorités 
non-vernaculaires. 

 
Tableau 2.​ Les voisins les plus proches pour une sélection d'entités canoniques à l'aide
d'un modèle Word-Embeddings

King_Arthur  Chrétien_de_Troyes  Geoffrey_Chaucer  Charlemagne 


Matter_of_Britain  Perceval,_the_Story_o The_Canterbury_TalesLouis_the_Pious 
f_the_Grail 
Round_Table  Yvain,_the_Knight_of General_Prologue  Pepin_the_Short 
_the_Lion 
Gawain  Cligès  The_House_of_Fame  Charles_the_Bald 
Mordred  Erec_and_Enide  Troilus_and_Criseyde  Clovis_I 
Round_Table_(Camel Erec  Troilus  Carolingian_dynasty 
ot) 
 

Fig. 7.​ Un dendrogramme représentant le résultat d'une analyse de cluster, où les (dis) 
similitudes entre les auteurs sont visualisées comme une structure arborescente. Les 
dissemblances ici sont basées sur les plongements que nous avons obtenus pour ces auteurs 
et qui capturent le contexte sémantique dans lequel ces auteurs sont typiquement mentionnés 
dans ​Speculum​ . 
Ces plongées de mots ont attiré beaucoup d'attention récemment, principalement parce 
qu'il a été démontré que ces modèles sont capables de résoudre indépendamment une 
forme intéressante de problème de raisonnement analogique. Par exemple, lorsqu'on lui 
demande quel mot est «femme» comme «roi» est «homme», un modèle formé sur le 
texte de Wikipédia en anglais produira le mot «reine». ​76​ La tâche est simplement 
résolue par l'équation suivante: ​roi​ - h​ omme​ + ​femme​ . L'idée est que le modèle prenne 
sa représentation vectorielle pour le mot ​roi​ , «soustrait», ou supprime, toutes les 
propriétés abstraites qu'il associe au mot ​homme​ , puis ajoute toutes les propriétés qu'il 
associe au mot ​femme​. Le modèle renvoie ensuite le mot le plus proche du résultat de 
l'opération. D' autres sorties culturelles intrigantes du modèle original étaient les 
suivants : ​Japon​ - ​sushi​ + ​new_york​ → ​Pizza​ et ​Belgique​ - ​Bruxelles​ + ​France​ → ​Paris 
. En tant que ​Spielerei​ intéressant , notez qu'un tel modèle est capable de résoudre des 
questions qui ​suscitent la​ réflexion telles que "Qui est le Chaucer des Français?" En le 
modélisant simplement sous la forme de l'équation ​Geoffrey_Chaucer​ - 
English_language​ + ​French_language​. Un certain nombre de résultats concrets tirés 
d'une analogie délibérément provocante de notre modèle ​Speculum​ sont donnés 
ci-dessous: 

Geoffrey_Chaucer - English_language + French_language → Jean_de_Meun


Geoffrey_Chaucer - English_language + Latin → Ovide
Geoffrey_Chaucer - English_language + Italie → Giovanni_Boccaccio
Si le résultat d'un modèle aussi naïf doit naturellement être pris avec un grain de sel, de
tels exercices sont néanmoins utiles car les modèles sont construits de manière
purement informatisée, et les chercheurs ont noté que ces modèles tendent
généralement à reproduire les biais culturels. qui sont présents dans le matériel sur
lequel ils ont été basés.
Conclusion: Le "Canon" des études médiévales

Les partisans de la lecture lointaine ont souvent loué la capacité des techniques
informatiques à élargir notre champ de lecture au-delà du canon obligatoire des
Chaucer, des Dantès et des Chrétiens. Moretti, par exemple, a suggéré que les
techniques informatiques nous permettraient enfin de nous attaquer à ce que Margaret
Cohen a appelé la «Grande Non- ​Lire​ », l' o
​ ubliëtte​ de la littérature historique.
77​Jusqu'à présent, cependant, les résultats à cet égard ont été limités, et de nombreux
projets de numérisation se concentrent autour du panthéon confortable et bien connu
des auteurs canonisés - l'attention disproportionnée pour une figure comme Chaucer
dans les études médiévales traditionnelles, par exemple, a été remarquablement
parallèles dans l'univers numérique jusqu'à présent. Ce n'est qu'un cas où les études
médiévales numériques peuvent probablement mieux tenir leurs promesses et
détourner notre attention d'un canon médiéval déjà surexposé vers les périphéries
moins connues de la culture médiévale.
Néanmoins, il est troublant qu'une grande partie de l'œuvre médiévale numérique
réponde plus étroitement aux questions et aux préoccupations de l'érudition médiévale
du dix-neuvième siècle que celles des vingtième et vingt et unième siècles. Dans le
domaine de l'analyse de textes, par exemple, les praticiens ont jusqu'ici montré peu
d'intérêt pour la théorie littéraire moderne, et en particulier pour les approches
poststructuralistes. Le rejet postmoderne - et le manque d'intérêt pour la paternité des
textes - peut aussi expliquer pourquoi les spécialistes du numérique peuvent se tenir à
l'écart d'un domaine qui n'accorde pas de valeur aux questions centrales de la plupart
des études médiévales numériques. Les humanistes numériques influents, tels que
Geoffrey Rockwell ou Stephen Ramsay, pourraient interpréter cette observation à la
lumière de leur - comme ils l'admettent eux-mêmes - une vision plutôt polémique des
humanités numériques en tant que communauté de «constructeurs»:​78​ -et, nous
pourrions ajouter, peutêtre aussi une communauté oùbourse est souvent si
expérimental qu'il est plus comme « jouer » que « travailler ».​ 79
Les frères Grimm ont redécouvert la littérature médiévale dans l'Allemagne du
dix-neuvième siècle et ont pris la peine d'entreprendre l'étude savante d'un phénomène
culturel étrange d'un passé lointain, encore fondamentalement nouveau pour eux à
l'époque. Ils se sont retrouvés confrontés à la nécessité de cataloguer, décrire et éditer
une masse non structurée de nouvelles sources, et ils ont lutté pour appliquer les
modèles savants existants qu'ils avaient hérités de leurs prédécesseurs humanistes. En
raison des dimensions européennes de nombreux phénomènes médiévaux, ils étaient
également impliqués dans des négociations constantes à travers leur correspondance
scientifique internationale, par exemple, sur l'authenticité de certaines versions de
textes ou sur les directions des échanges culturels dans l'Europe médiévale. Il ne serait
pas exagéré d'assimiler la condition des humanistes numériques actuels à leurs
précurseurs du XIXe siècle. Les humanistes numériques modernes, eux aussi, sont
confrontés à l'étude savante d'un héritage médiéval qu'ils doivent souvent numériser à
partir de rien, même s'ils définissent une pratique numérique érudite sans une tradition
de modèles existants qui peuvent être facilement appliqués à l'étude computationnelle
et diffusion de ces artefacts et de nouvelles idées à leur sujet. En travaillant en tant que
communauté, de nombreux humanistes numériques réinventent actuellement des
aspects importants des études médiévales dans ce processus, à travers des discussions
fondamentales sur le but et la signification du domaine. même s'ils définissent une
pratique scientifique numérique sans une tradition de modèles existants qui peuvent
être facilement appliqués à l'étude informatique et à la diffusion de ces artefacts et de
nouvelles idées à leur sujet. En travaillant en tant que communauté, de nombreux
humanistes numériques réinventent actuellement des aspects importants des études
médiévales dans ce processus, à travers des discussions fondamentales sur le but et la
signification du domaine. même s'ils définissent une pratique scientifique numérique
sans une tradition de modèles existants qui peuvent être facilement appliqués à l'étude
informatique et à la diffusion de ces artefacts et de nouvelles idées à leur sujet. En
travaillant en tant que communauté, de nombreux humanistes numériques réinventent
actuellement des aspects importants des études médiévales dans ce processus, à
travers des discussions fondamentales sur le but et la signification du domaine.
Cette situation conduit à une relation complexe, opaque et fascinante entre les études
médiévales numériques et leur contrepartie conventionnelle. Sur le plan anecdotique,
les humanistes numériques sont inspirés par la relative liberté dont ils jouissent dans le
terrain de jeu expérimental qu'est la DH, où les chercheurs peuvent opérer largement
en dehors du regard et de la critique des humanités conventionnelles. Selon certains,
DH peut être considéré comme un champ délibérément «sous-théorisé» ​80,​ où les
jeunes chercheurs ne sont pas gênés par les mécanismes d'intimidation et d'exclusion
qui sont souvent liés au concept de «théorie» ​81.​D'autres ont prétendu que DH est en
fait beaucoup plus théorique que les humanités traditionnelles, en raison de la place
centrale qui est attribuée aux débats méthodologiques fondamentaux sur la
modélisation dans les sciences humaines. Dans un article de blog célèbre, "Qui vous
appelez Untheoretical?", Jean Bauer cité Susan Smulyan, qui a crié à une occasion, "La
base de données ​est​ la théorie!" ​82
Bien que la présence de débats théoriques et méthodologiques de haut niveau ne soit
pas remise en question, la relation entre les écoles traditionnelles et non traditionnelles
dans les études médiévales mérite d'être examinée de plus près. Les chercheurs en
sciences humaines numériques justifient généralement leur existence par une affiliation
active avec les sciences humaines disciplines plus anciennes ​83​ -En fait, on pourrait dire
que c'est avant tout cette affiliation qui sépare les sciences humaines numériques de la
science informatique. Dans les études médiévales aussi, le lien entre les praticiens
traditionnels et numériques est crucial si l'on veut que le domaine médiéval progresse
dans son ensemble. Surtout, cela exige un intérêt mutuel des deux parties et une
volonté fondamentale d'apprendre les uns des autres, tout en ne négligeant pas la riche
tradition de l'érudition médiévale.
Alors que nous nous attendons à ce que les études numériques médiévales deviennent
de plus en plus courantes dans le futur, il restera important de maintenir des points de
vente dédiés pour les médiévistes numériques afin de réfléchir sur les aspects plus
techniques de leur travail. Un certain nombre de revues spécialisées récemment
inaugurées, telles que le ​Digital Medievalist Journal​ (
https://journal.digitalmedievalist.org/​ ) et ​la Philologie numérique: un journal des
cultures médiévales​ (Johns Hopkins University Press) méritent d'être regardées, en plus
de des revues pluridisciplinaires établies en DH, telles que ​LLC: Digital Scholarship in
the Humanities​ (Oxford University Press, anciennement connu sous le nom de ​Literary
and Linguistic Computing​ ) et ​Digital Humanities Quarterly​, tous deux publiés au nom
d'ADHO. De même, le livre des résumés de la conférence annuelle mondiale en DH
organisée par ADHO ( ​http://adho.org/​ ) permet de suivre les développements actuels
dans le domaine.
Les plates-formes plus pédagogiques sont également importantes pour le
développement ultérieur du domaine. Des tutoriels pratiques sont proposés pour aider
les débutants à acquérir des compétences numériques qui ne font peut-être pas encore
partie des programmes de formation dans l'enseignement supérieur. Sites Web tels que
l'historien de la programmation ( ​http://programminghistorian.org​), par exemple,
offrent un large éventail de tutoriels évalués par des pairs sur les compétences
techniques. D'autres ressources pédagogiques populaires pour les novices sont les
nombreux événements de formation de longue date qui sont organisés chaque année
dans la communauté DH, tels que le Digital Humanities Summer Institute de l'Université
de Victoria, l'Université d'été européenne en sciences humaines numériques de
l'Université de Leipzig, et les Digital Humanities à Oxford Summer School (DHOxSS) à
l'Université d'Oxford. Les «non-conférences» THATcamp (Le Humanités et la
Technologie Camp) qui ont eu lieu à divers endroits ont également fait connaître les
méthodes et les approches numériques à un large public. ​84​ Outre une exposition plus
longue aux pratiques des humanités numériques, de tels événements ont une
dimension sociale importante en permettant aux nouveaux arrivants de constituer un
réseau en DH.

Ce supplément numérique

Ce supplément est divisé en quatre sections qui visent à représenter plusieurs des
tendances que nous avons tracées ci-dessus. Dans la première section, «Manuscripts
and Images», quatre articles traitent des approches de l'analyse des manuscrits. ​Toby
Burrows​introduit un projet qui rassemble les manuscrits anciennement dans la
collection de Sir Thomas Phillipps et explore les défis de l'analyse des grands corpus.
L'énorme collection de manuscrits rassemblés par Phillipps au XIXe siècle a ensuite été
dispersée auprès d'institutions et de collectionneurs privés du monde entier. Parce que
les preuves relatives à la provenance et à l'histoire de ces manuscrits sont vastes et
variées, l'élaboration d'un cadre d'analyse cohérent a nécessité la mise en œuvre d'un
nouveau modèle de données pour la provenance des manuscrits. En plus d'examiner les
processus techniques impliqués dans ce travail, Burrows présente les résultats de
l'application de cette approche à deux questions de recherche spécifiques: les histoires
du groupe de manuscrits qui appartenaient à Thomas Phillipps et Alfred Chester Beatty,
Bien qu'il soit bien connu que de nombreux scribes avaient plusieurs scripts et même
des alphabets à leur disposition, il y a eu peu de discussions sur le phénomène d'un
point de vue paléographique, et encore moins sur les méthodes pour y remédier. Dans
sa contribution sur le multigraphisme dans les manuscrits anglo-saxons tardifs, ​Peter A.
Stokes​ examine en détail le travail de deux scribes multigraphiques, s'inspirant du cadre
DigiPal et explorant les capacités qu'il offre pour la communication et l'analyse du script
et les idées qu'il fournit sur pratique scribe anglo-saxon tardive et écriture
multigraphique en général.
Mike Kestemont, Vincent Christlein et Dominique Stutzmann​proposent ce qu'ils
appellent la «paléographie artificielle», basée sur l'adaptation de la technologie du
champ de la vision par ordinateur et de l'intelligence artificielle à l'étude paléographique
des manuscrits médiévaux. Leur article se concentre sur l'identification automatique des
types de manuscrits dans les manuscrits médiévaux, ce qui constitue une étape
importante sur la voie de la «lecture automatique» de ces documents, entièrement
automatisée. Le travail est présenté dans le contexte d'un concours organisé
récemment, ou «tâche partagée», sur ce sujet, qui est un format scientifique de plus en
plus commun dans le monde du savoir numérique. En plus d'une introduction de haut
niveau aux modèles informatiques qu'ils utilisent, l'article se concentre sur
l'interprétation de ces systèmes complexes dans le contexte de la paléographie
traditionnelle.
Murray McGillivray​ et Christina Duffy font briller la nouvelle lumière de la spectrométrie
pour voir sous les illuminations du célèbre manuscrit de Gawain. Leur article s'intéresse
aux techniques de l'imagerie multispectrale pour examiner les illustrations de Londres,
la British Library, MS Cotton Nero Axe, le manuscrit unique de ​Sir Gawain et du Green
Knight​ et trois autres poèmes importants du Middle English. L'imagerie révèle les
dessins à l'encre sous la peinture ultérieure et détecte les différences par rapport aux
objectifs illustratifs, aux portions endommagées et fanées des images qui ont été
restaurées et au déploiement intentionnel de pigments chimiquement différents qui ont
fini par ressembler au fil du temps.
La deuxième section, intitulée «Cartographie», comprend deux articles qui illustrent
l'utilisation des systèmes d'information géographique (SIG) dans les études médiévales.
David Joseph Wrisley​ explore la cartographie numérique pour des études médiévales à
des échelles multiples pour des lectures proches et lointaines. Son article distingue la
cartographie de l'information géographique du SIG historique et présente plusieurs
résultats du projet Visualizing Medieval Places (VMP) pour l'étude de textes français
médiévaux. Wrisley soutient la nécessité d'étendre le projet dans une architecture de
recherche qui permet la co-création de données sociales et explore les affordances des
données ouvertes liées. M. ​Alison Stones​ décrit l'évolution du projet Web
Lancelot-Graal, qui adapte le SIG à la géographie de la page manuscrite, en l'utilisant
dans le cadre d'un examen comparatif des différences dans le choix, le placement et le
traitement des sujets dans les illustrations manuscrites.
La troisième section, "Textes et éditions", rassemble quatre articles. ​Jeroen De
Gussem​retrace le "sentier de secrétariat" de Bernard de Clairvaux en utilisant les
techniques de la stylométrie. Le style littéraire de Bernard de Clairvaux (vers
1090-1153) était d'une telle grandeur qu'il était imité par les plus grands théologiens de
son temps, fournissant une «architecture» pour une écriture cistercienne. Les meilleurs
imitateurs de Bernard se retrouvent, en effet, à ses côtés, dans le scriptorium de
Clairvaux. Ces scribes ont été formés pour imiter la formulation préférée de leur abbé et
sa maîtrise des rebondissements rhétoriques, et bien que Bernard ait pris l'habitude de
relire, corriger et repolir ses œuvres, il est souvent difficile de savoir comment ses
secrétaires son oeuvre. Le personnage central du scriptorium de Bernard était Nicholas
de Montiéramey, qui servit l'abbé du c. 1138-41 à c. 1151-52, et dans cet article, la
dynamique de la parenté entre les œuvres de Bernard et de Nicolas est mise à nu par
des méthodes stylométriques. La familiarité stylistique entre leurs textes peut nous en
apprendre plus sur la nature de la collaboration dans le scriptorium de Clairvaux ainsi
que permettre une meilleure lecture attentive des textes les plus douteusement
attribués à Bernard.
Maxim Romanov​ présente une analyse algorithmique des collections biographiques
médiévales arabes, une collection de données unique dont la taille a entravé un
traitement holistique jusqu'à présent. Son article illustre le type de macroanalyse que
permettent les corpus de grande taille et peu étudiés, en mettant l'accent sur la
distribution géographique et temporelle des entités dans ses données. Romanov discute
des complexités du marquage, de la structuration et de la pérennisation de ces données
et offre des indications précieuses sur des outils pratiques et des méthodologies
réalistes.
Mark Cruse​ effectue une analyse quantitative des toponymes dans un manuscrit du
Devisement du monde​ de Marco Polo(Londres, British Library, MS Royal 19 D 1). Les
chercheurs ont depuis longtemps noté que le compte de Marco Polo présente de
nombreux problèmes textuels, et pas seulement aux érudits modernes. Les toponymes
du texte posent également un défi particulièrement important aux scribes qui ont copié
les premiers manuscrits parce que beaucoup étaient inconnus, et l'analyse quantitative
des toponymes dans la plus ancienne version française du compte (Royal 19 D 1)
confirme l'incertitude scribe qui a suivi. la copie de ces mots. En distinguant les
toponymes familiers et non familiers, en attribuant les occurrences à des scribes
spécifiques et en quantifiant le nombre de variantes et le degré de variance
orthographique et phonétique pour chaque toponyme, l'article soutient que nous
pouvons identifier les mots et les contextes qui se sont révélés difficiles à scribes. Plutôt
que de considérer ces variantes comme des erreurs, soutient Cruse, nous devrions les
analyser comme des formes de réponse du lecteur. Une analyse de ces toponymes dans
leur contexte manuscrit comme des marqueurs sémantiques dépourvus d'annotation
moderne nous permet de rencontrer le texte de Polo comme l'ont fait ses premiers
lecteurs - comme la description d'un monde encore inconnu regorgeant de lieux
exotiques riches en significations. En fin de compte, les façons dont les scribes ont
répondu aux toponymes dans le compte de Polo reflètent non seulement la pratique
scribale, mais aussi les processus par lesquels la nouvelle information géographique a
été absorbée par les lecteurs médiévaux.
L'article de Franz Fischer​étudie une série d'éditions scientifiques numériques en mettant
l'accent sur les options et les exigences pour le développement de corpus textuels
numériques. D'une part, la pluralité textuelle ou plutôt éditoriale semble être l'une des
principales caractéristiques des éditions numériques; d'autre part, l'utilité d'un corpus
dépend essentiellement de l'uniformité et de la représentativité des textes qu'il
comprend. Basé sur une définition claire mais flexible des éditions critiques numériques,
Fischer fait plusieurs propositions pour résoudre le conflit entre une variété d'approches
éditoriales et une homogénéité souhaitable au sein d'un corpus. Par l'inclusion d'éditions
numériques dans un sens large et critique dans un sens étroit, mettant l'accent sur les
œuvres plutôt que sur les documents, et le lien avec les ressources externes, ou leur
intégration, il soutient qu'il est possible de créer un corpus précieux et véritablement
numérique d'éditions critiques. L'utilité de ses caractéristiques et le cadre technique
d'un tel corpus seraient basés sur un modèle de données élémentaire pour les
métadonnées, le texte, l'annotation et les paratextes.
La quatrième section, intitulée «Multimédialité: espace et son», présente trois articles
qui explorent les reconstructions de l'espace architectural médiéval et des sons dans les
bâtiments médiévaux. ​Sheila Bonde, Alexis Coir et Clark Maines​utiliser la technologie de
conception (CAO) assistée par ordinateur pour reconstruire, représenter et étudier
processus architectural à l'église cistercienne de Notre-Dame d'Ourscamp, en se
concentrant sur la fin du XIIIe siècle, lorsque les travailleurs démantelés extrémité est
romane de l'église et l'a remplacé par un nouveau chœur gothique. Ils soutiennent que
la représentation numérique a le potentiel d'encourager les spectateurs à s'engager
dans le cycle de vie plus complet d'un bâtiment, et qu'elle encourage les chercheurs à
analyser l'application tridimensionnelle de leurs interprétations du changement de
construction. Le but de leur projet numérique a été de promouvoir une compréhension
plus complète du processus par lequel les constructeurs médiévaux ont démantelé des
parties de bâtiments plus anciens pour y ajouter de nouvelles extensions.
Les deux autres articles de cette section examinent les sons de Byzance. L'équipe
internationale de ​Spyridon Antonopoulos, Sharon Gerstel, Chris Kyriakakis,
Konstantinos T. Raptis et James Donahue​ étudie les aspects acoustiques des espaces
liturgiques byzantins dans les églises de Thessalonique. Leur projet unit l'analyse
scientifique de l'acoustique avec la considération du cadre architectural et de l'imagerie
de la performance chorale. Leur projet vise à identifier et préserver les signatures
acoustiques des églises étudiées et à capturer l'expérience multisensorielle du fidèle
byzantin.
Bissera Pentcheva et Jonathan Abel​ présentent la méthode et les résultats du projet
multidisciplinaire Icons of Sound de l'Université de Stanford. Ils soutiennent que la
technologie numérique nous permet de transcender une rencontre textuelle avec la
musique liturgique byzantine et restaure les aspects performatifs du rite chanté, et
qu'ils se concentrent sur Hagia Sophia: son acoustique, son esthétique et sa musique.
L'article détaille les effets de la structure en dôme sur l'expérience du chant chanté en
son sein: l'amplification des sons ainsi que le chevauchement des notes et une "cascade
acoustique" produisent à la fois une brillance auditive et une brillance optique. En
utilisant la technologie numérique, Icons of Sound a imprimé avec succès la signature
acoustique du bâtiment sur la performance en direct du chant de la cathédrale
byzantine.
Les articles de ce supplément se combinent donc pour offrir une fenêtre sur la richesse
des approches et des expériences que les médiévistes ont apportées au domaine des
humanités numériques. On espère que cette contribution à ​Speculum​ suscitera (encore
plus) un nouvel intérêt et une nouvelle activité dans ce domaine prometteur.

Remarques

1​ Pour un excellent​souvenir​à l'occasion du centenaire de sa naissance, voir Marco


Passarotti, «Cent ans plus tôt: en mémoire du père Roberto Busa SJ»,​Actes du
troisième atelier sur l'annotation des corpus pour la recherche en sciences humaines
(ACRH) -3)​, éd. Francesco Mambrini, Marco Passarotti et Caroline Sporleder (Sofia,
2013), 15-24.
2​ Passarotti, "Il y a cent ans", 17.
3​ Le corpus peut maintenant être consulté en
ligne,​http://www.corpusthomisticum.org/it/​.
4​ Cité dans "For Ada Lovelace Day" de Melissa Terras, le 15 octobre
2013,​http://melissaterras.blogspot.be/2013/10/for-ada-lovelace-day-father-
busas.html​.
5​ Voir, par exemple, Julianne Nyhan et Andrew Flynn,​Computation and the Humanities:
Vers une histoire orale des sciences humaines numériques​, Série Springer sur
l'informatique culturelle (Cham, 2016),​https://link.springer.com/book/10.1007%
2F978-3-319-20170-2​.
6​ Passarotti, "Il y a cent ans", 20.
7​ John Unsworth, «Les médiévistes en tant qu'adoptants de la technologie de
l'information»,​Digital Medievalist​7
(2011),​https://journal.digitalmedievalist.org/articles/10.16995/dm.34/​.
8​ Selon Kirschenbaum, la montée du terme «humanités numériques» peut être
attribuée à «un ensemble de circonstances étonnamment spécifiques»: (1) la
publication du Blackwell​Companion to Digital Humanities​2006, (2) l'inauguration de
l'Alliance of Digital Humanities Organizations (ADHO), (3) l'inauguration du programme
Digital Humanities du NEH. Voir Matthew Kirschenbaum, «Qu'est-ce que Digital
Humanites et que font-ils dans les départements d'anglais?», Dans​Définir les sciences
humaines numériques: un lecteur​, éd. Melissa Terras, Julianne Nyhan et Edward
Vanhoutte (Farnham, 2013), 247-53, à 197-98 en particulier.
9​ Alan Liu, «Le sens des sciences humaines numériques»,​PMLA​128 (2013): 409-23.
10​ Cette nature multidisciplinaire est considérée comme centrale dans la plupart des
introductions générales aux humanités numériques, y compris​A Companion to Digital
Humanities​, éd. Susan Schreibman, Ray Siemens et John Unsworth (Oxford, 2004);
et​Digital_Humanities​, éd. Anne Burdick, Johanna Drucker, Peter Lunenfeld, Todd
Presner et Jeffrey Schnapp (Cambridge, MA, 2012).
11​ Dans la discussion sur la «grande tente», voir Matthew Jockers et Glen Worthey,
«Introduction: Bienvenue dans la grande tente», dans​Digital Humanities 2011​, éd.
Alliance des organisations des sciences humaines numériques (Stanford, 2011), vi-vii.
Geoffrey Rockwell a noté avec humour: "Ayant erré dans la nature sauvage des
sciences humaines depuis la fin des années 1980, je trouve ça ironique de faire partie
de quelque chose qui est soudainement" populaire "ou perçu comme exclusif quand
pendant tant d'années nous avons partagé une rhétorique d'exclusion. »Voir la
réimpression anthologisée, Geoffrey Rockwell,« Inclusion in the Digital Humanities »,
dans Terras, Nyhan, et Vanhoutte,​Defining Digital Humanities​, 247-53, p. 248.
12​ Consulter Terras, Nyhan et Vanhoutte,​Définir les sciences humaines numériques​.
13​ Voir, par exemple, Matthew Battles et Michael Maizels, «Collections et / ou de l'art et
du musée d'art dans le mode DH», dans​Débats dans les Digital Humanities 2016​, éd.
Matthew K. Gold et Lauren F. Klein (Minneapolis, 2016), 325-44.
14​ La question de la «théorie» en DH a fait l'objet du premier volume de la section
«Conversations» du​Journal of Digital Humanities​en ligne en hiver 2011
(​http://journalofdigitalhumanities.org/1-1​), dans lequel un des séries d'écrits plus
spontanés (par exemple de la blogosphère) sur le sujet ont été collectées.
15​ Voir Julia Flanders et Fotis Jannidis, «Data Modeling», dans Schreibman, Siemens et
Unsworth,​Companion to Digital Humanities​, p. 229-37.
16​ Ces opinions ont été résumées dans Willard McCarthy, «Modelling: A Study in Words
and Meaning», dans Schreibman, Siemens, et Unsworth,​Companion to Digital
Humanities​, 254-70.
17​ http://www.bl.uk/manuscripts/​et​http://www.ceec.uni-koeln.de/​.
18​ http://dla.library.upenn.edu/dla/schoenberg/index.html​.
19​ Peter Ainsworth et Godfried Croenen, éd.,​The Online Froissart, Version 1.5​(Sheffield,
2013),​http://www.hrionline.ac.uk/onlinefroissart​.
20​ http://monasterium.net/mom/home​.
21​ Johanna Drucker, «Humanities Approaches to Graphical Display»,​Digital Humanities
Quarterly​5 (2011),​http://www.digitalhumanities.org/dhq/vol/5/1/000091/000091.html​.
22​ Seth Van Hooland et Ruben Verborgh,​Données liées pour les bibliothèques, les
archives et les musées: comment nettoyer, lier et publier vos métadonnées​(Londres,
2014).
23​ Elena Pierazzo,​Édition numérique savante: théories, modèles et méthodes​(Farnham,
2015).
24​ Voir aussi Greta Franzini, Melissa Terras et Simon Mahony, «Un catalogue d'éditions
numériques», dans Éditions​scientifiques numériques: Théories et pratiques​, éd. Elena
Pierazzo et Matthew James Driscoll (Cambridge, Royaume-Uni, 2016).
25​ Un exemple pertinent est Jacob Thaisen, «Position initiale dans la ligne de vers du
milieu anglais»,​English Studies​95 (2014): 500-13. Dans cet article, Thaisen utilise la
modélisation statistique du langage pour montrer que le début (et, dans une moindre
mesure, la fin) des lignes de vers du milieu anglais sont relativement plus stables dans
la transmission des textes.
26​ Par exemple, pour les manuscrits Chaucer, Marius Bulacu et Lambert Schomaker,
«Identification automatique de l'écriture manuscrite sur les documents médiévaux»,
dans​Actes de la 14e Conférence internationale sur l'analyse et le traitement des
images​(Modena, 2007), 279-84.
27​ Susan Hockey, «Une histoire de l'informatique des sciences humaines», dans
Schreibman, Siemens et Unsworth,​Companion to Digital Humanities​, 3-19.
28​ Tara L. Andrews et Caroline Macé, «Au-delà de l'arbre des textes: construire un
modèle empirique de la variation scribale à travers l'analyse graphique des textes et des
stemmata»,​Digital Scholarship in the Humanities​28 (2013): 504-21.
29​ John R. Allen, «Sur l'authenticité de l'épisode Baligant dans la​Chanson de Roland​»,
dans​Computers in the Humanities​, éd. John L. Mitchell (Edimbourg, 1974): 65-72.
30​ Karina van Dalen-Oskam et Joris van Zundert, «Delta pour le moyen néerlandais:
distinction d'auteur et de copiste à​Walewein​»,​Littérature et linguistique​22 (2007):
345-62.
31​Maciej Eder, Jan Rybicki, and Mike Kestemont, “Stylometry with R: A Package for
Computational Text Analysis,” ​R Journal​ 8 (2016): 107–21.
32​Examples include Jan Ziolkowski, “Lost and Not Yet Found: Heloise, Abelard and the
Epistolae duorum amantium​,” ​Journal of Medieval Latin​ 14 (2004): 171–202; Mike
Kestemont, Sara Moens, and Jeroen Deploige, “Collaborative Authorship in the Twelfth
Century: A Stylometric Study of Hildegard of Bingen and Guibert of Gembloux,” ​Digital
Scholarship in the Humanities​ 30 (2015): 199–224.
33​Friedrich M. Dimpel, ​Computergestützte textstatistische Untersuchungen an
mittelhochdeutschen Texten​ (Tübingen, 2004).
34​Susan Hockey, “History of Humanities Computing.”
35​S. Jänicke, G. Franzini, C. Faisal, and G. Scheuermann, “Visual Text Analysis in
Digital Humanities,” ​Computer Graphics Forum​ 35 (2016), doi:10.1111/cgf.12873.
36​David Hadbawnick, “The Framing Narrative and the Host: Two Kinds of Anxiety in the
Canterbury Tales​,” in ​Open Access Companion to the Canterbury Tales​,
http://www.opencanterburytales.com/open-review-home/the-framing-narrative-and-the
-host/​.
37​Dominique Stutzmann, “Clustering of Medieval Scripts through Computer Image
Analysis: Towards an Evaluation Protocol,” ​Digital Medievalist​ 10 (2015),
https://journal.digitalmedievalist.org/articles/10.16995/dm.61/​.
38​For Chartres,
http://www.biblissima-condorcet.fr/fr/a-new-life-medieval-libraries-chartres​; for Lorsch,
https://www.uni-heidelberg.de/presse/news2012/pm20120323_lorsch_en.html​.
39​A description of the Manuscriptlink project is available on Vimeo
(​http://vimeo.com/98052555​) and YouTube (​http://youtu.be/B9r7F0PAeYQ​).
40​http://darmc.harvard.edu/​.
41​http://digitizedmedievalmanuscripts.org/​.
42​https://ihr.asu.edu/research/seed/digital-mappaemundi-resource-study-medieval-ma
ps-and-geographic-texts​.
43​Ian Gregory, Christopher Donaldson, Patricia Murrieta-Flores, and Paul Rayson,
“Geoparsing, GIS, and Textual Analysis: Current Developments in Spatial Humanities
Research,” ​International Journal of Humanities and Arts Computing​ 9 (2015): 1–14.
44​Christopher D. Lloyd and Keith Lilley, “Cartographic Veracity in Medieval Mapping:
Analyzing Geographical Variation in the Gough Map of Great Britain,” ​Annals of the
Association of American Geographers​ 99 (2009): 27–48.
45​Faye Taylor, “Mapping Miracles: Early Medieval Hagiography and the Potential of
GIS,” in ​History and GIS: Epistemologies, Considerations and Reflections​, ed. Alexander
von Lünen and Charles Travis (Heidelberg, 2012), 111–25.
46​Manfred Koon and Horst Cramer, ​Cluny: Architektur als Vision​ (Heidelberg, 1993).
47​http://www.learn.columbia.edu/Mcahweb/Amiens.html​.
48​http://monarch.brown.edu/monarch/index.html​.
49​Daniele Ferdani and Giovanna Bianchi, “3D Reconstruction in Archaeological Analysis
of Medieval Settlements,” in ​Archaeology in the Digital Era​, vol. 2, ​e-Papers from the
40th Annual Conference of Computer Applications and Quantitative Methods in
Archaeology (CAA), Southampton, UK, 26–29 March, 2012​, ed. Philip Verhagen
(Amsterdam, 2013), 156–64.
50​See Tanya Clement, “When Texts of Study Are Audio Files: Digital Tools for Sound
Studies in Digital Humanities,” in Schreibman, Siemens, and Unsworth, ​Companion to
Digital Humanities​, 348–57.
51​https://soundstudiesblog.com/2016/04/04/17060/​.
52​https://ccrma.stanford.edu/about​.
53​Rafael Suárez, Alicia Alonso, and Juan J. Sendra, “Intangible Cultural Heritage: The
Sound of the Romanesque Cathedral of Santiago de Compostela,” ​Journal of Cultural
Heritage​ 16 (2014): 239–43,
http://www.sciencedirect.com/science/article/pii/S1296207414000788​.
54​http://whc.unesco.org/en/news/570/​.
55​S. Kennedy et al., “Exploring Canons and Cathedrals with Open Virtual Worlds: The
Recreation of St Andrews Cathedral, Saint Andrews Day, 1318,” ​Digital Heritage​ (2013),
https://risweb.st-andrews.ac.uk/portal/files/75971074/digitalheritage2013_submission_
536.pdf​.
56​Kimberly Dylla et al., “Rome Reborn 2.0: A Case Study of Virtual City Reconstruction
Using Procedural Modeling Techniques,” in ​CAA 2009: Making History Interactive; 37th
Proceedings of the CAA Conference March 22–26, 2009, Williamsburg, Virginia​ (Oxford,
2010), 62–66; S. Keay et al., “The Role of Integrated Geophysical Survey Methods in
the Assessment of Archaeological Landscapes: The Case of Portus,” ​Archaeological
Prospection​ 16 (2009): 154–66. On the use of Second Life in archaeology, see Luis
Miguel Siquiera and Leonel Morgado, “Virtual Archaeology in Second Life and Open
Simulator,” ​Journal of Virtual Worlds Research​ 6 (2013): 1–16.
57​Diego Gutierez et al., “Archaeological and Cultural Heritage: Bringing Life to an
Unearthed Muslim Suburb in an Immersive Environment,” ​Journal of Cultural Heritage​ 5
(2004): 63–74.
58​Jonathan Blaney and Judith Siefring, “A Culture of Non-citation: Assessing the Digital
Impact of British History Online and the Early English Books Online Text Creation
Partnership,” ​Digital Humanities Quarterly​ 11 (2017),
http://www.digitalhumanities.org/dhq/vol/11/1/000282/000282.html​.
59​Such issues lie at the heart of the current work by Walter Scholger, University of
Graz.
60​This issue is, for instance, raised in David Bamman and David Smith, “Extracting Two
Thousand Years of Latin from a Million Book Library,” ​Journal on Computing and Cultural
Heritage​ 5 (2012): 2–13.
61​Jean-Baptiste Michel et al., “Quantitative Analysis of Culture Using Millions of
Digitized Books,” ​Science​ 331 (2011): 176–82.
62​https://books.google.com/​ and ​https://books.google.com/ngrams​.
63​https://www.historians.org/publications-and-directories/perspectives-on-history/marc
h-2011/loneliness-and-freedom​.
64​http://www.culturomics.org/Resources/faq/thoughts-clarifications-on-grafton-s-loneli
ness-and-freedom​.
65​Ibid.
66​For example, Franco Moretti, “Conjectures on World Literature,” ​New Left Review​ 1
(2000): 54–68. These essays were later brought together and commented on in Franco
Moretti, ​Distant Reading​ (London, 2013).
67​Relevant references for these terms include Matthew Jockers, ​Macroanalysis: Digital
Methods and Literary History​ (Lincoln, 2013); Stephen Ramsay, ​Reading Machines:
Toward an Algorithmic Criticism​ (Lincoln, 2011); Thomas Crombez, “Het onbehagen in
de digitale cultuur: De opkomst van Digital Humanities,” ​Meta: Het Vlaamse tijdschrift
voor bibliotheek en archief​ 4 (2013): 8–13.
68​All software used for this exercise is made available on
https://github.com/mikekestemont/panorama​.
69​For an introduction to basic methods in NLP, consult, for instance, Dan Jurafsky and
James Martin, ​Speech and Language Processing​, 2nd ed. (Upper Saddle River, 2009).
70​Christopher Manning et al., “The Stanford CoreNLP Natural Language Processing
Toolkit,” in ​Proceedings of the 52nd Annual Meeting of the Association for
Computational Linguistics: System Demonstrations​ (Baltimore, 2014), 55–60.
71​A classic reference (among many others) is Zellig S. Harris, “Distributional structure,”
Word​ 10 (1954): 146–62. An interesting recent opinion piece about distributional
methods in language technology is Chistopher D. Manning, “Computational Linguistics
and Deep Learning,” ​Computational Linguistics​ 41 (2015): 701–7.
72​On topic modeling, consult for instance David M. Blei, “Probabilistic Topic Models,”
Communications of the ACM​ 55 (2012): 77–85.
73​Xiao Cheng and Dan Roth, “Relational Inference for Wikification,” in ​Proceedings of
the 2013 Conference on Empirical Methods in Natural Language Processing​ (Seattle,
2013): 1787–96.
74​Lev Ratinov, Dan Roth, Doug Downey, and Mike Anderson, “Local and Global
Algorithms for Disambiguation to Wikipedia,” in ​Proceedings of the 49th Annual Meeting
of the Association for Computational Linguistics: Human Language Technologies​, vol. 1
(Portland, 2011), 1375–84.
75​Tomas Mikolov, Wen-tau Yih, and Geoffrey Zweig, “Linguistic Regularities in
Continuous Space Word Representations,” in ​Proceedings of the 2013 Conference of the
North American Chapter of the Association for Computational Linguistics: Human
Language Technologies​ (2013), 746–51.
76​Ibid.
77​Some of his seminal essays on the matter have been reproduced in Moretti, ​Distant
Reading​.
78​See, for example, their polemic pieces reprinted in Terras, Nyhan, and Vanhoutte,
Defining Digital Humanities​: Stephen Ramsay, “On Building,” 243–45; and Geoffrey
Rockwell, “Inclusion in the Digital Humanities,” 247–53.
79​On less targeted research methods facilitated by the digital, see Stephen Ramsay,
“The Hermeneutics of Screwing Around,”
http://quod.lib.umich.edu/d/dh/12544152.0001.001/1:5/--pastplay-teaching-and-learni
ng-history-with-technology?g=dculture;rgn=div1;view=fulltext;xc=1#5.1​.
80​Rockwell, “Inclusion in the Digital Humanities.”
81​For “theory” as a source of intimidation, see Jonathan Culler, ​Literary Theory: A Very
Short Introduction​ (Oxford, 1997), 15.
82​ Jean Bauer, «Qui vous appelez unthorique?»,​Journal of Digital Humanities​1/1
(2011),​http://journalofdigitalhumanities.org/1-1/who-you-calling-untheoretical-by-jean
-bauer/​.
83​ Cf. Liu, "Le sens des sciences humaines numériques."
84​ http://thatcamp.org/​.
© 2017 par l'Académie Médiévale d'Amérique. Tous les droits sont réservés. Ce travail est sous 
licence Creative Commons Attribution-NonCommercial 4.0 International License (CC BY-NC 4.0), 
qui permet la réutilisation non-commerciale du travail avec attribution. Pour un usage commercial, 
contactez journalpermissions@press.uchicago.edu. 

 
INTRODUCTION
Le moyen âge numérique​ : une introduction

MANUSCRITS ET IMAGES
L'histoire et la provenance des manuscrits de Sir Thomas Phillipps​ : nouvelles approches
de la représentation numérique
Attribution scribale à travers plusieurs scripts​ : une approche assistée numériquement
Paléographie artificielle​ : Approches informatiques pour identifier les types de script dans
les manuscrits médiévaux
Nouvelle Lumière sur le Sir Gawain et le Manuscrit du Chevalier Vert​ : l'imagerie
multispectrale et les illustrations de la hampe Nero

CITATION D'ARTICLE

David J. Birnbaum , Sheila Bonde et Mike Kestemont , «Le moyen âge numérique: une
introduction», Speculum 92, no. S1 (octobre 2017): S1-S38.
https://doi.org/10.1086/694236

LES PLUS LUS

Parmi tous les articles publiés, les articles suivants ont été les plus lus au cours des 12 derniers
mois

● Le moyen âge numérique: une introduction


Birnbaum et al.
● Analyse algorithmique des collections biographiques arabes médiévales
Romanov
● Corpus numériques et éditions savantes de textes latins: caractéristiques et exigences de la
critique textuelle
Fischer