Définir la curation des données numériques n’est pas une sinécure

 

Si la question d’hier était de savoir où trouver l’information pertinente et exacte, nous effectuions des recherches au niveau que j’appelais alors « macro ». Aujourd’hui, avec l’avènement des données numériques, la tendance est à la recherche au niveau « micro » : la recherche des données qui fourniront l’information qui documentera le sujet de notre recherche.

La croissance exponentielle des données numériques offre aux chercheurs des sources inestimables de matière pour nourrir leurs réflexions et leurs projets. À l’heure où les données numériques deviennent centrales en matière de recherche scientifique, comment trier, sélectionner, décrire, mettre à disposition et conserver les données destinées à un archivage sur le long terme. Comment garantir leur authenticité. Comment faire confiance, aux données et aux dépôts dans lesquels elles reposent.

C’est ici qu’entre en jeu la curation numérique.

Comme le rappelle Dallas (2015), le domaine de la curation numérique a émergé à la confluence de la gestion des données numériques, du développement de la recherche en conservation numérique et des considérations et recherches informatiques y relatives.

Pour pouvoir gérer le passage du macro au micro, ne devons-nous pas d’abord nous entendre sur ce qu’est la curation numérique ?

Le séminaire « Curation des données » présenté par des étudiants du Master en Sciences de l’information le 7 décembre dernier à la HEG-Genève a pointé l’absence de définition consensuelle[1]. Dans la pratique, l’utilisation du terme revêt parfois des sens différents pour ne pas dire contradictoires. Dallas (2015) évoque l’ambiguïté émanant du fait que l’on s’interroge encore à ce propos.

Figure 1 : Affiche du séminaire « Data curation » du 07 décembre 2018

La confusion est-elle culturelle ? Bunenan (2004) observe deux cultures de la curation numérique : celle des archivistes se distingue de celle des scientifiques. Les premiers se concentrant sur l’évaluation, l’indexation, la classification et la conservation, les seconds s’intéressant à l’organisation et à l’intégration des données collectées, à leur processus d’annotation, enfin à leurs publication et présentation.

Dallas (2015) rappelle que le débat porte également sur la convergence entre les pratiques de ces trois mondes que sont les bibliothèques, les archives et les musées. La curation muséale a, tout comme sa définition, évolué au fil du temps. Elle peut signifier la conservation, la recherche et le partage des connaissances enfin la mise en valeur.

Peut-on couper court à cette équivoque ? Dallas (2015) estime qu’elle découle du fait que la curation numérique est très souvent citée en parallèle de la discipline dont elle émane : la conservation numérique. Pour Jones et Beagrie (2001), la conservation numérique consiste en l’ensemble des activités utilisées pour assurer un accès continu aux ressources numériques dont les propriétés comprennent leur authenticité, leur intégrité et leur fonctionnalité. Cela implique le développement de dépôts fiables et durables. La curation numérique doit quant à elle permettre l’accès, la réutilisation et l’interopérabilité temporelle (Hedstrom 2001) des données numériques. Leurs futurs utilisateurs doivent pouvoir y accéder, les déchiffrer et avoir la garantie de leur authenticité (Rothenberg 2000).

Cunningham (2008) précise encore que la curation numérique est souvent confondue avec l’archivage numérique. Lord et Macdonald (2003) les distinguent de la manière suivante : la préservation est un aspect de l’archivage et l’archivage est une activité nécessaire à la curation.

Tentant de dégager une définition de ces analyses, Dallas (2015) s’accorde avec le UK Digital Curation Centre (DCC) quant au fait que les données sont au cœur de la curation numérique. Il présente ensuite douze définitions qui la caractérisent comme un concept, une activité ou un ensemble d’activités, un engagement des professionnels de l’information si elles ne tentent de la définir par ses traits distincts par rapport à l’archivage ou encore à la préservation ou par ses implications. Au terme de sa recherche, Dallas (2015) conclut que le terme est avant tout utilisé pour évoquer un domaine de pratique professionnelle qui élabore un ensemble de règles, procédures, systèmes, … destiné à garantir l’aptitude future des objets de données numériques et l’usage auquel ils sont destinés par le biais de la conservation numérique.

Celles et ceux qui souhaitent se faire une idée des défis et enjeux auxquels les institutions font face lorsqu’elles se lancent dans la curation numérique peuvent télécharger le jeu CURATE © créé dans le cadre du projet DigCurV[2].

Figure 2 : Plateau du jeu CURATE © DigCurV

 

Bibliographie :

BUNENAN, Peter, 2004. The two cultures of digital curation. In : Scientific and Statistical Database Management Conference. Proceedings. 16th International Conference on Scientific and Statistical Database Management, Santorini, Greece, 21-23 June 2004 [en ligne]. Washington DC : IEEE Computer Society, pp. 7-10. [Consulté le 24 novembre 2018]. Rapports et documents, 66. DOI 10.1109/SSDM.2004.1311188. Disponible à l’adresse : https://ieeexplore.ieee.org/document/1311188.

CUNNINGHAM, Adrian, 2008. Digital Curation/Digital Archiving: A View from the National Archives of Australia. The American Archivist [en ligne]. Fall/Winter 2008. Vol. 71, n° 2, pp. 530‑543. [Consulté le 24 novembre 2018]. DOI 10.17723/aarc.71.2.p0h0t68547385507. Disponible à l’adresse : http://americanarchivist.org/doi/10.17723/aarc.71.2.p0h0t68547385507.

DALLAS, Costis, 2016. Digital curation beyond the “wild frontier”: a pragmatic approach. Archival Science [en ligne]. December 2016. Vol. 16, n° 4, pp. 421‑457. [Consulté le 10 novembre 2018]. DOI 10.1007/s10502-015-9252-6. Disponible à l’adresse : http://link.springer.com/10.1007/s10502-015-9252-6.

HEDSTROM, Margaret, 2001. Exploring the concept of temporal interoperability as a framework for digital preservation. In : ERCIM. 3rd DELOS Network of Excellence Workshop on Interoperability and Mediation in Heterogeneous Digital Libraries. Darmstadt, Germany, 8-9 September 2001 [en ligne]. [S.l.] : [s.n.], Session 4 : Applications. [Consulté le 25 novembre 2018]. Rapports et documents, 16. Disponible à l’adresse : https://www.ercim.eu/publication/ws-proceedings/DelNoe03/10.pdf.

JONES, Maggie et BEAGRIE, Neil, 2001. Preservation management of digital materials: a handbook. London : The British Library. ISBN 978-0-7123-0886-1.

LORD, Philip, MACDONALD, Alison, 2003. e-Science curation report : Data curation for e-Science in the UK : an audit to establish requirements for future curation and provision. Prepared for the JISC Committee for the Support of Research (JCSR) [en ligne]. Twickenham, UK, The Digital Archiving Consultancy Limited. [Consulté le 25 novembre 2018]. Disponible à l’adresse : https://www.cs.york.ac.uk/ftpdir/pub/leo/york-msc-2007/information/vsr-curation/science-dc-report.pdf.

ROTHENBERG, Jeff, 2000. Preserving authentic digital information. In : CULLEN, Charles T., et al. Authenticity in a Digital Environment [en ligne]. Washington DC : Council on Library and Information Resources, p. 51-68. [Consulté le 24 novembre 2018]. Disponible à l’adresse : https://eric.ed.gov/?id=ED454883.

 

Notes :

[1] Séminaire « Curation des données » présenté par Manon Bari, Manuela Bezzi, David Roch et Irina Sokolova le 07 décembre 2018 à la Haute École de Gestion de Genève.

[2] Financé par le programme Leonardo da Vinci de la Commission européenne, le projet DigCurV (Digital Curator Vocational Education Europe) réunit plusieurs partenaires dont le DCC et a pour mission la formation professionnelle en matière de gestion des collections numériques.

 

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *