Avec le projet de recherche Ask_ArchiLab (HEG Genève), nous, Alexandra Paraschiv et Cheyenne Dubois, explorons comment des outils d’intelligence artificielle, en open access, peuvent transformer des archives vidéo en ressources enrichies et plus facilement exploitables.

Source : RTS Archives.
Les archives audiovisuelles : entre défi et opportunité
Les archives ont une valeur immense : elles racontent notre histoire à travers des manuscrits, des photos, des films, des enregistrements sonores, etc. Bref, une mosaïque de formats et de mémoires. Mais les documents audiovisuels occupent une place à part. Ils captent des voix, des gestes et des regards. Pour ainsi dire, toute l’énergie d’une époque. Et pourtant, ce sont aussi les plus difficiles à explorer.
Des milliers d’heures d’images et de sons se retrouvent souvent résumés en quelques mots dans une notice. Bien trop peu pour rendre justice à ce que l’on voit ou entend. Le format audiovisuel, par nature, est difficile à traiter, alors même que le contenu est d’une richesse incroyable. Ces documents nous parviennent bruts, sans contexte : des images sans explication, des voix sans transcription, des séquences entières qui restent muettes. Autrement dit, ce sont des données non structurées, difficiles à parcourir sans un long travail de description. Mais comment décrire, indexer et rendre visible tous ces trésors qui dorment encore dans nos bases de données ? Et comment répondre aussi à un public qui veut tout voir, tout comprendre, tout partager ?
Un chercheur a besoin de métadonnées précises pour naviguer dans ce flot :
Qui est représenté ? Où la scène se déroule-t-elle ? Quel objet apparaît ? Quelle langue est parlée ?
Même le spectateur curieux aimerait lui aussi des explications simples :
Que suis-je en train de voir ? Que veut dire ce chant ? Pourquoi ces costumes ?
Et c’est précisément là que l’intelligence artificielle entre en scène. Elle peut intervenir dans le découpage des vidéos, la détection des objets, l’analyse de sons ou l’enrichissement des métadonnées et permettre à ces documents de se raconter autrement.

Source : RTS Archives.
Un patrimoine qui se dévoile
Pour illustrer ce potentiel, prenons un exemple emblématique : une capsule vidéo en couleurs de plus d’une minute filmée à Vevey, lors de la Fête des Vignerons de 1955.
À première vue, il s’agit simplement d’un court extrait festif, témoin d’une tradition populaire. La notice fournie se limite à quelques informations : une date, un titre, une catégorie (« Fêtes, Traditions et Folklore »), et un bref résumé historique. Suffisant pour situer la vidéo, mais largement insuffisant pour en saisir toute la richesse.
Car dès les premières images, on comprend que ce document recèle bien plus : des enfants en habits colorés, des cors des Alpes qui résonnent, des vaches décorées, des visages expressifs, une foule enthousiaste… C’est une véritable fresque populaire.
Ici, les outils de l’intelligence artificielle peuvent intervenir, en révélant ce que la notice ne dit pas, mais que l’œil perçoit instinctivement.
Prenons les costumes, par exemple : robes blanches, jaunes ou bleues, habits masculins brodés, des chapeaux de paille, etc. Autant de détails qu’un outil IA bien entraîné pourrait identifier et transformer en mots-clés spécifiques. On ne parle plus de simples « costumes folkloriques », mais d’une diversité textile indexable et recherchable.
Idem pour les instruments : trois hommes soufflent dans des cors des Alpes. Un outil capable de reconnaître objets et sons pourrait associer immédiatement cette scène au patrimoine immatériel suisse.
L’IA ne s’arrête pas à l’image : elle peut transcrire et traduire les chants, isoler les paroles ou repérer les refrains. On retrouve ainsi en un clic le traditionnel « Ranz des vaches », sans revoir toute la vidéo. Ces fonctions améliorent l’accessibilité, en rendant les contenus inclusifs, compréhensibles pour tous.
En somme, ces outils ne font pas que décrire : ils restituent la densité de l’archive et la rapproche de ce que l’on voit, entend et ressent. De plus, l’alignement avec des référentiels est facilité: en connectant la notice de la vidéo à Wikipédia ou aux bases de données de l’UNESCO, on peut lier la Fête des Vignerons à son statut de patrimoine immatériel.
Pour les archivistes, c’est un gain de temps et un appui pour produire des descriptions plus précises. Pour les utilisateurs également, c’est une nouvelle façon d’entrer dans un document : retrouver un moment marquant ou explorer des détails jusque-là ignorés.
Faire dialoguer les archives
L’archive vidéo présentée ici déborde de visages, de chants et de couleurs. Pourtant, sans traitement adapté, ces détails restent invisibles. Grâce aux outils IA, ils peuvent devenir lisibles et servent de points d’entrée vers de nouvelles lectures du passé.
Bien sûr les outils IA ne sont pas infaillibles, ils peuvent se tromper. Par exemple, ils peuvent mal interpréter un symbole ou manquer une subtilité. Ainsi ils ne remplacent pas l’humain, ils l’accompagnent. Ils préparent un terrain riche que les archivistes viennent ensuite affiner et valider. C’est cette complémentarité qui change la donne.
Et demain ? Toutes ces informations relevées par l’IA ne resteraient pas seulement dans une fiche technique : elles pourraient par exemple nourrir un agent conversationnel. L’archive ne serait plus seulement un document à regarder, mais un véritable interlocuteur avec lequel dialoguer.
Bibliographie
11 Métadonnées pour la description, le catalogage, l’inventarisation des documents audiovisuels. Memoriav [en ligne]. Disponible à l’adresse : https://memoriav.ch/fr/recommandations/all/11-metadonnees-pour-la-description-le-catalogage-linventarisation-des-documents [consulté le 8 septembre 2025].
ARNOLD, Jonas et al, 2024. Livre blanc L’apprentissage automatique dans les archives : l’indexation en profondeur au service de l’accès aux archives [en ligne]. Association des archivistes suisses. Juin 2024. Disponible à l’adresse : https://vsa-aas.ch/wp-content/uploads/2024/08/MachineLearning_im_Archiv_Whitepaper_2024-08-08_fr.pdf [consulté le 9 septembre 2025].
AWESOME-AI4LAM. Awesome AI for LAM. awesome-ai4lam [en ligne]. Disponible à l’adresse : https://ai4lam.github.io/awesome-ai4lam/ [consulté le 11 septembre 2025].
BEELDEN & GELUID. AI in Audiovisual Archives [en ligne]. Disponible à l’adresse : https://www.beeldengeluid.nl/en/research/blog/ai-audiovisual-archives?query=A%20brief%20note%20about%20language [consulté le 8 septembre 2025].
HEG, 2025 Ask_ArchLab: Enhancing Archival Practice through Artificial Intelligence technologies. Haute Ecole de Genève [en ligne]. Disponible à l’adresse : https://www.hesge.ch/heg/actualites/2025/askarchilab-enhancing-archival-practice-through-artificial-intelligence-technologies [consulté le 10 septembre 2025].
L’Ina valorise 27 millions d’heures d’archives audiovisuelles sur Data.ina grâce à l’IA. Archimag [en ligne]. Disponible à l’adresse : https://www.archimag.com/archives-patrimoine/2024/10/08/ina-valorise-27-millions-heures-archives-audiovisuelles-data-ina [consulté le 10 septembre 2025].
Moments Lab lève 24 millions de dollars pour lancer son IA agentique dédiée à la valorisation des archives vidéos, Archimag [en ligne]. Disponible à l’adresse : https://www.archimag.com/archives-patrimoine/2025/06/04/moments-lab-24-millions-dollars-ia-agentique-valorisation-archives [consulté le 10 septembre 2025].
RTS.CH. La fête des vignerons. rts.ch [en ligne]. Disponible à l’adresse : https://www.rts.ch/archives/1955/video/la-fete-des-vignerons-26179889.html [consulté le 10 septembre 2025].
UNESCO, 2015. La fête des vignerons de Vevey (Winegrowers’ Festival in Vevey). UNESCO [en ligne]. 2015. Disponible à l’adresse : https://www.unesco.org/archives/multimedia/document-4353 [consulté le 10 septembre 2025].
L’intelligence artificielle (ChatGPT et Perplexity) a été utilisée à des fins de reformulation pour la rédaction de ce billet de blog.


Laisser un commentaire