Comment allier sources médiévales et informatique ?

09/04/2021

L’informatique fonctionne avec des normes strictes alors que dans le domaine médiéval les données ne sont pas fixées. Pour harmoniser les pratiques et tenter de trouver des solutions, le Consortium sources médiévales (Cosme) a été créé en 2012. L’unité de recherche Arts civilisation et histoire de l’Europe (Arche) figure parmi ses fondateurs.

Regroupant informaticiens et médiévistes, Cosme compte actuellement dans ses rangs des chercheurs d’une dizaine de laboratoires français rattachés à la Très grandes infrastructures de recherche des Humanités numériques (TGIR Huma-num). Coordonné par l’historien belge Paul Bertrand, le consortium connaît un financement de transition de deux ans (2020-2022) après deux phases de 2012 à 2016 et de 2016 à 2020.

« La tradition des bases de données débute dès les années 70, l’idée de Cosme est de mettre au point des convergences et des bonnes pratiques pour la création de ces bases de données, d’échanger autour des difficultés rencontrées. Les parchemins médiévaux, caractérisés par une forte variance, ne sont pas toujours conformes à l’informatique qui fonctionne avec des normes strictes », précise Thomas Brunner, chercheur au laboratoire Arche.

Eviter les bases de données fossiles

Pour travailler sur ces problématiques et harmoniser les pratiques en vue de produire un livre blanc, différents groupes de travail ont été constitués. Par exemple sur la question des dates : comment faire en sorte que les dates médiévales, pas toujours arrêtées, correspondent à la datation informatique ? (cf encadré) Ou les noms : les graphies n’étant pas figées, un même personnage peut apparaitre sous différentes appellations, comment alors le retrouver dans les bases de données ?

Autre objectif affiché : favoriser la mise en ligne des corpus et faciliter l’accès à la documentation. « Les ouvrages connus sont déjà numérisés par les bibliothèques mais les chartes présentes notamment dans les archives des petites communes restent difficilement accessibles à tous », explique Guillaume Porte, ingénieur d’études en humanités numériques au laboratoire Arche qui évoque également le problème des bases de données fossiles. « Réalisées par exemple sur Excel, elles demeurent à jamais perdues une fois le chercheur à la retraite. »

Un moteur de recherche commun

Cosme fonctionne ainsi comme un réseau. La plateforme recense et héberge parfois les dizaines de bases de données créées par les chercheurs du consortium. « Cela permet de favoriser les échanges et créer des passerelles entre laboratoires », ajoute l’ingénieur. « C’est aussi un partage d’expérience », complète Olivier Richard, chercheur à Arche qui travaille avec Thomas Brunner à la constitution d’une base de données sur les sceaux du Rhin supérieur, volet régional de la base nationale Sigilla.

Prochaine étape : créer un moteur de recherche commun qui permettra de croiser les informations. « Nous avons encore eu deux ans de prolongation pour terminer les projets entamés et régler la problématique du passage à des bases de données accessibles à tous, suivant le principe FAIR (Findable, Accessible, Interoperable, Reusable) des sciences ouvertes », conclut Thomas Brunner.

Marion Riegert

Le casse-tête des dates

Thomas Brunner revient sur la problématique de la datation au Moyen Age

Le système de datation médiévale amène souvent à des incertitudes qui ne permettent pas à l’historien de pouvoir donner une date unique (AAAA/MM/JJ) à un document. Ainsi à partir du 13e siècle se diffuse dans le nord de la France le « style de Pâques » : le changement de millésime n’a pas lieu au 1er janvier, comme pour nous, mais le jour de Pâques. Il y a un décalage de quelques mois qui implique une conversion de la date. Mais ce n’est pas le seul problème, car cette fête chrétienne est mobile. Ainsi, un document qui porte la mention « fait en avril 1223 », remonte soit à la période comprise entre le 23 et le 30 avril 1223 (Pâques était le 23 avril cette année-là, la veille on était encore en 1222 pour les médiévaux), soit à celle comprise entre le 1er et le 14 avril 1224 (Pâques tombait le 15 avril et on passait seulement alors en 1224).

La base de données doit-elle se contenter de renseigner la date la plus récente possible (1224/04/14) ? Dans ce cas, quelqu’un qui travaillerait sur l’année 1223 ne retrouverait pas le document. Faut-il indiquer l’intervalle large (du 1223/04/23 au 1224/04/14) ? Mais il y a onze mois impossibles dans cet intervalle, ce qui, là encore, peut fausser les analyses. L’idéal est donc de pouvoir donner une datation la plus fine possible (du 1223/04/23 au 1223/04/30 ou du 1224/04/01 au 1224/04/14), ce qui suppose de paramétrer la base avec plusieurs intervalles de dates.

Établissement associé de l'Université de Strasbourg
Fondation Université de Strasbourg
Investissements d'Avenir
Ligue européenne des universités de recherche (LERU)
EUCOR, Le Campus européen
CNRS
Inserm Grand Est
HRS4R