Le Big Data au service de l’histoire : The Venice Time Machine (VTM)

Et si l’on pouvait créer un Google Maps ou un Facebook du passé qui nous transporterait instantanément dans l’histoire d’un simple mouvement de curseur ? Et si la data science et le Big Data avec leurs outils nous permettaient non seulement de mieux comprendre nos sociétés contemporaines mais aussi notre passé ? Nous pouvons légitimement nous interroger sur la puissance de tels outils et leurs applications à la discipline historique. Car si le volume des données, leur variété ainsi que la vitesse à laquelle elles transitent sur internet nous offre aujourd’hui des perspectives considérables, elles contribuent néanmoins à créer un présent extrêmement dense, documenté à la seconde près alors que des milliards de données sur le passé échappent à la culture numérique et donc peut-être à moyen terme, à la culture tout court. Dans cette perspective, la création d’un système d’information digitale capable de tirer profit de toutes les données connues pour concevoir une nouvelle cartographie du passé permettrait de « réparer la continuité entre un passé méconnu et un présent hypertrophié, saturé d’informations » (Kaplan, 2018). L’ambition est formalisée, ce projet existe, il s’appelle « The Venice Time Machine ».

« Au départ, il y a un rêve, celui d’adapter les outils numériques du présent à l’exploration du passé » (Kaplan, 2013)

Le champignon informationnel
Figure 1 : Le champignon informationnel (Kaplan, 2013b)

Pour ce faire, il faut appréhender ce que Frédéric Kaplan appelle « le champignon informationnel » : l’abondance de l’information numérique durant la dernière décennie peut être représentée par un large plateau (Digital information). Selon ce schéma, plus nous remontons le temps plus cette information diminue. Afin d’utiliser les outils actuels pour analyser le passé, il est impératif de posséder une densité informationnelle suffisante. Ceci est possible en numérisant les archives publiques et privées (Digitization). Pour des données plus anciennes, il est possible d’extrapoler et de généraliser à partir des données existantes. Par conséquent, il est possible de dégager des grammaires et des structures permettant ainsi de construire des hypothèses raisonnées pour les données manquantes comme le font les historiens (Simulated information) (Kaplan, 2013b).

1 ville, 10 ans de travail, 100 millions de documents, 1000 ans d’histoire

Alors que son empire commercial et maritime s’étend peu à peu sur toute la Méditerranée, Venise développe au fil des siècles un état bureaucratique qui, non seulement lui sert à légitimer son pouvoir, mais surtout qui instaure une politique de conservation documentaire exceptionnelle : commerce, justice, urbanisme, armée, diplomatie, politique, tout le fonctionnement de la Sérénissime est consigné (De Vivo, 2013). Depuis 1815, Les Archives d’Etat de Venise sont les dépositaires de ce patrimoine documentaire unique composé de 100 millions de documents sur plus 1000 ans d’histoire. De ce fait, Venise possède une densité informationnelle exceptionnelle quant à la création du « Big Data du passé ». Prévu sur 10 ans et lancé conjointement en 2013 par l’EPFL, l’université Ca’ Foscari de Venise en collaboration avec Les Archives d’Etat de Venise et la fondation Giorgion Cini, la Venice Time Machine n’est pourtant pas qu’un projet de numérisation à grande échelle.

Hacking History
Figure 2 : Le fonctionnement de la VTM (Abbott, 2017)

«Big Data is the Information asset characterised by such a High Volume, Velocity and Variety to require specific Technology and Analytical Methods for its transformation into Value. » (De Mauro, Greco et Grimaldi 2016)

La seconde étape du projet consiste à rendre l’information contenue dans les documents « accessible par informatique, cherchables, indexables, visualisables comme les autres grandes bases de données auxquelles l’Internet nous donne accès » (Kaplan, 2015). Grâce aux nouvelles méthodes de traitement et d’analyse que sont le machine learning et le deep learning, les documents sont transcrits pour en extraire des informations structurées, indexant par exemple tous les documents identifiant un individu ou un lieu permettant ainsi soit de mettre au jour ce qui lie ces unités entre elles soit de dévoiler des relations encore inconnues.

Quel impact sur la discipline historique ?

La question n’est pas anodine et les historiens s’interrogent sur les apports d’outils comme la VTM. En effet, les possibilités qu’offre le Big Data suscitent d’ores et déjà des débats parmi eux (Rime, 2018). Pourtant, les bénéfices sont importants : rapidité de recherche, accès à la matière noire (documents peu ou pas exploités c.f. tomographie), croisement des sources à grande échelle, visualisation des données etc. Le travail de l’historien sera toujours d’expliquer et d’interpréter les sources alors que la VTM ne le peut pas (Kaplan, 2013b). Mais la création d’un « Big Data du passé » et l’utilisation de ses outils préfigure également de nouvelles synergies scientifiques. Comme le souligne ma collègue Anna Leckie, l’expertise des spécialistes de l’information et leurs connaissances dans la description, la préservation et le traitement des données, leur confèrent un rôle tout à fait légitime dans toutes entreprises qui concernent l’exploitation massives de ces dernières, et ceci tant pour le passé que pour le futur (Leckie, 2018).

Bibliographie

ABBOTT, Alison, 2017. « The ‘time machine’ reconstructing ancient Venice’s social networks ». Nature [en ligne]. 15 juin 2017. Vol 546 Issue : 7658, pp. 341-344. [Consulté le 10 décembre 2018]. Disponible à l’adresse : https://www.nature.com/news/the-time-machine-reconstructing-ancient-venice-s-social-networks-1.22147

DE MAURO, Andrea, GRECO, Marco et GRIMALDI, Michele, 2016. A formal definition of Big Data based on its essentiel features. Library Review. Vol. 65, no 3, pp. 122-135. ISSN 0024-2535.

De Vivo Filippo, « Cœur de l’État, lieu de tension. Le tournant archivistique vu de Venise (XVe-XVIIe siècle) ». Annales. Histoire, Sciences Sociales [en ligne]. 17 septembre 2013. Vol 68 Issue : 3, pp. 699-728. [Consulté le 10 décembre 2018]. Disponible à l’adresse : https://www.cairn.info/revue-annales-2013-3-page-699.htm

KAPLAN, Frédéric, 2013a. TEDxCaFoscariU – FrédéricKaplan – « How to build an information time machine ». TED [en ligne]. Juin 2013. [Consulté le 10 décembre 2018]. Disponible à l’adresse : https://www.ted.com/talks/frederic_kaplan_how_i_built_an_information_time_machine.

KAPLAN, Frédéric, 2013b. Frederic Kaplan [en ligne]. 14 mars 2013. [Consulté le 10 décembre 2018]. Disponible à l’adresse :  https://fkaplan.wordpress.com/2013/03/14/lancement-de-la-venice-time-machine/

KAPLAN, Frédéric, 2015. Quelques réflexions préliminaires sur la Venice Time Machine. In : SERVAIS, Paul, MIRGUET, Françoise (dir,). L’archive dans quinze ans. Vers de nouveaux fondements. Louvain-la-Neuve : Academia/L’Harmattan, 2015, 272 p., coll. « Archives de l’université catholique de Louvain » ISBN : 978-2-8061-0225-6. Disponible à l’adresse : https://infoscience.epfl.ch/record/207931/files/Venice-Time-Machine-reflexions-preliminaires.pdf

LECKIE, Anna, 2018. Big Data et professionnel·le·s de l’information : you can do this ! Recherche d’IdéeS [en ligne]. 12 décembre 2018. [Consulté le 13 décembre 2018]. Disponible à l’adresse : https://campus.hesge.ch/blog-master-is/big-data-et-professionnel%C2%B7le%C2%B7s-de-linformation-you-can-do-this/

RIME, Jean. 2018. « L’histoire à l’épreuve du numérique : un nouveau « goût de l’archive » ? infoclio.ch [en ligne]. 23 août 2018. [Consulté le 10 décembre 2018]. Disponible à l’adresse : http://www.infoclio.ch/de/l%E2%80%99histoire-%C3%A0-l%E2%80%99%C3%A9preuve-du-num%C3%A9rique-un-nouveau-%C2%AB-go%C3%BBt-de-l%E2%80%99archive-%C2%BB

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *