La paléographie digitale au service du paléographe médiéviste

Un des 12 types d’écriture médiévale, https://oriflamms.hypotheses.org/1388/b2-half-uncial

 

La paléographie est l’étude des écritures manuscrites anciennes et des modes de production et réception des objets inscrits. Elle permet d’identifier, dater et localiser des écritures (Stutzmann 2017). La paléographie digitale quant à elle utilise des logiciels informatiques, des intelligences artificielles (IA), pour analyser l’écriture classique et médiévale (Smit 2011).

A l’issue de ses recherches sur les registres de la chancellerie des contes de Hollande (période 1299-1345), l’historienne médiéviste néerlandaise Jinna Smit souhaite prouver de manière objective que son identification des différentes écritures est correcte. Elle décide de vérifier ses hypothèses grâce à l’intelligence artificielle (IA) GIWIS, un système automatique de reconnaissance d’écriture, créé par Alex Brink à l’Université de Groningen. Après avoir adapté l’IA à l’analyse de documents médiévaux, la faisant outrepasser, par exemple, les déchirures, trous et taches souvent présentes, les textes sont introduits dans l’IA pour mesurer la ressemblance des écritures. Selon Jinna Smit, les résultats sont concluants et encourageants, mais comportent des erreurs. Les experts restent indispensables. (Smit 2011)

L’utilisation de l’IA afin de confirmer une hypothèse en paléographie est intéressante. Les conclusions des paléographes sont en effet parfois difficiles à formaliser, partager ou évaluer, puisqu’elles peuvent reposer sur leur intuition acquise par l’expérience. Les paléographes pourraient donc voir en l’IA un outil permettant de légitimer leur analyse tout autant que d’améliorer leurs pratiques. (Kestemont et al. 2017)

Actuellement, dans des projets mis en place par l’Institut de recherche et d’histoire des textes (IRHT), la reconnaissance correcte des mots par une intelligence artificielle dépasse les 80%. Le taux est très prometteur, mais ne suffit de loin pas à en faire une édition (Stutzmann 2017).

Les IA sont également capables de classifier les différentes écritures manuscrites. L’IRHT a organisé en 2016 un concours dont l’objectif était de créer des systèmes pouvant répartir des manuscrits latins, datés d’entre 500 et 1600, en douze catégories d’écriture (Stutzmann 2016). Les participants ont entraîné leurs IA sur un corpus de 2’000 images, préalablement catégorisées en ces 12 types d’écriture par des paléographes (Kestemont et al. 2017). Ils ont ensuite dû tester leur IA sur un nouveau corpus de 1000 textes, méconnus par la machine. Aucun participant n’est parvenu à une classification parfaite. Cependant, les meilleurs ont obtenu plus de 83% de réponses justes (Stutzmann 2017).

Une des principales limites de cette expérience est la simplification de la réalité par les organisateurs du concours afin de faire entrer un manuscrit dans une seule catégorie d’écriture. Or, les manuscrits n’appartiennent pas forcément uniquement à un type d’écriture, plusieurs types peuvent cohabiter dans un seul texte en raison de l’évolution du style d’écriture à travers le temps.

L’utilisation d’intelligences artificielles pour indexer, transcrire ou classifier les textes anciens devient indispensable. Les manuscrits médiévaux européens contenus dans les bibliothèques numériques patrimoniales se comptent en dizaine de milliers (Stutzmann 2016). Souvent, les bibliothèques numériques comme Gallica amassent des images numérisées, mais disposent de metadata incomplets ou périmés (Kestemont et al. 2017). Employer des experts pour le faire coûterait trop cher et serait chronophage.

Des progrès technologiques ont été accomplis depuis le concours organisé par l’IRHT de 2016. Cependant, les manuscrits médiévaux restent particulièrement difficiles à décoder pour les IA. Elles peinent encore à analyser les nombreuses abréviations, les différentes graphies et la coexistence de différents types d’écriture au sein d’un même texte (Stutzmann 2017).

Bibliographie

KESTEMONT, Mike, CHRISTLEIN, Vincent et STUTZMANN, Dominique, 2017. « Artificial paleography : computational approaches to identifying script types in medieval manuscripts ». Speculum, Cambridge University Presse[en ligne]. Octobre 2017. Vol. 92, pp. 86-109, [Consulté le 8 décembre 2018]. Disponible à l’adresse : https://hal.archives-ouvertes.fr/hal-01854939

SMIT, Jinna, 2011.«The Death of the Palaeographer? Experiences with the Groningen Intelligent Writer Identification System (GIWIS)». Archiv für Diplomatik. 2011. Vol. 57, pp.413-426. 0066-6297

STUTZMANN, Dominique, 2016. Écritures médiévales et outils numériques[en ligne]. 18 Février 2016. [Consulté le 9 décembre 2018]. Disponible à l’adresse : https://oriflamms.hypotheses.org/1388

STUTZMANN, Dominique, 2017. « Paléographie : la révolution numérique ». L’Histoire [en ligne]. Septembre 2017. [Consulté le 8 décembre 2017]. Disponible à l’adresse :https://www.lhistoire.fr/irht-dans-le-secret-des-manuscrits/paléographie-la-révolution-numérique

 

 

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *