Ce Hub a plus d’une corde à son arc !

Cadre général Guisan

A l’heure où la problématique de la gestion des données est plus que jamais d’actualité, il devient indispensable de pouvoir, au niveau national, compter sur une instance générale permettant d’unifier les institutions suisses en prenant des décisions fermes et décidées, assumant le rôle de guide en matière d’identifiants pérennes (PID – persistent identifiers). L’objectif, plus que louable, de soutenir la diffusion et l’utilisation de connaissances en respectant les principes FAIR se heurte à quantité d’obstacles, dont les aspects financiers, organisationnels et techniques ne sont pas des moindres.

A l’image du Général Guisan qui a su, en son temps, fédérer et donner à l’armée confiance en elle face à l’adversité, notre projet étudie la conception d’un Hub national d’attribution logique d’identifiants pérennes au service des chercheurs helvètes, ceci dans le but de combattre l’ignorance et l’oubli. Swiss PID Hub fait ainsi office d’étude préparatoire au projet INCIPIT soumis à swissuniversities-p5 lors de l’appel à projets pour l’année 2020 (Call 192), qui prévoit la création d’une infrastructure nationale d’un complément d’identifiants pérennes interopérables et traçables.

Services qui tirent à la même corde

Il existe certains services dont l’ambition se raccorde à notre projet, tel que EZID. Cette plateforme mise en place par la California Digital Library (CDL) permet la création, l’enregistrement et la gestion de PID au service de la recherche scientifique et de la préservation du patrimoine culturel, quel que soit le type de données. Ce système peut être comparé à l’épine dorsale de l’infrastructure communicationnelle savante : il permet de rendre tout objet identifiable, partageable et citable par l’humain et par la machine. La philosophie d’EZID est donc de mettre à disposition un service d’identifiants rationalisé, peu coûteux et de haute qualité. Techniquement, EZID supporte actuellement deux types de PID parmi les plus utilisés : les Digital Object Identifiers (DOI) et les Archival Resource Keys (ARK). EZID est d’ailleurs géré par John A. Kunze, inventeur du schème ARK et initiateur du résolveur Name-To-Thing (N2T).

Architecture ARK à la CDL (Kunze 2019)
Figure 1 : Architecture ARK à la CDL (Kunze 2019)

Les DOI apparaissent également comme une solution potentielle, mais présentent le désavantage d’un investissement financier (beaucoup) plus conséquent. C’est la Bibliothèque de l’Ecole Polytechnique Fédérale de Zürich (EPFZ), avec le DOI-Desk et en collaboration avec DataCite, qui se charge de fournir aux institutions helvétiques les DOI. DataCite, au même titre que Crossref, se place en complémentarité sur le marché, le premier plutôt axé sur les institutions culturelles et scientifiques, le second auprès des éditeurs.

Pour notre projet de recherche, nous avons retenu ARK comme PID (voir billet de blog précédent).

Processus d’enregistrement des DOI via la Bibliothèque de l’EPFZ (Hirschmann 2019)
Figure 2 : Processus d’enregistrement des DOI via la Bibliothèque de l’EPFZ (Hirschmann 2019)

 

Fonctionnalités du service

Nous avons pensé les fonctionnalités d’un tel service en nous basant sur des projets antérieurs (Espasandin et al. 2018), mais également sur des études de cas issues du projet ICOPAD, de la FAQ ARK, ainsi que d’ArODES. Cela nous a permi de réaliser l’importance de bénéficier de règles communes au niveau d’une institution, d’un organisme, même si en leur sein, chaque département a des besoins différents (par exemple selon les types de données ou leur granularité).

Théoriquement parlant, imaginer un Hub de cette sorte n’est qu’une histoire d’adaptation à une échelle de grandeur différente, les processus existent déjà, la technique aussi. C’est d’un point de vue organisationnel et financier que le défi s’annonce ardu : composition et tarification des services, adaptation des procédures d’attribution et de gestion des ARK à un large panel d’organisations très différentes, sans oublier le travail de lobbying nécessaire pour rassembler et convaincre des partenaires provenant d’un pays possédant quatre langues nationales.

Nous avons dès lors imaginé le processus d’attribution d’identifiants suivant :

  1. Inscription au registre ARK ou vérification du numéro d’autorité nommante (NAAN) et du serveur d’accès de l’autorité d’adressage (NMA)
  2. Renseignement des métadonnées et création d’inférences en Linked Open Data (LOD)
  3. Constitution du nom ARK selon le type d’entité (préfixe, numéro d’identifiant et caractère de contrôle)
  4. Génération de qualificatifs de granularité et/ou de service

Si les trois premières étapes sont des fonctionnalités basiques du Hub, la génération de qualificatifs est une fonctionnalité avancée. Pour en bénéficier, une cotisation annuelle plus onéreuse devra être sollicitée aux prospects.

Modélisation du Hub

Un blueprint de service générique a été créé pour donner une vue globale du service. Celui-ci retrace le parcours utilisateur d’une institution s’inscrivant au Hub et attribuant des ARK (voir Figure 3).

Blueprint de service (les fonctionnalités avancées sont représentées en vert)
Figure 3 : Blueprint de service (les fonctionnalités avancées sont représentées en vert)

 

Lors de l’initialisation du Hub, il faudra établir une tarification selon les types d’organismes et les fonctionnalités désirées, mais également collaborer avec l’initiative mondiale ARKs-in-the-Open qui est en train de réviser la spécification et d’élaborer des procédures pour la maintenance du registre ARK.

Un pour tous, tous pour un !

Un Hub national coordonnant l’attribution d’ARK en Suisse pourrait prendre le rôle, tel notre héros national Guillaume Tell, de rassembleur d’esprits et de catalyseur de l’identité (scientifique) nationale : un pour tous, et tous pour un !

Auteurs : Matthieu Cevey et Julien A. Raemy

Bibliographie

ESPASANDIN, Kate, JAQUET, Aurélie, LEFORT, Lise et SCHNEIDER, René (dir ), 2018. Panorama et modélisation d’identifiants pérennes pour la création d’identités de confiance [en ligne]. Mémoire de recherche. Carouge, Suisse : Haute école de gestion de Genève. [Consulté le 25 novembre 2019]. Disponible à l’adresse : https://doc.rero.ch/record/309479

HIRSCHMANN, Barbara, 2019. 10 Years DOI Desk at ETH Zurich. In : Persistent Identifiers in Research – Celebrating 10 Years of DOI Desk at ETH Zurich [en ligne]. ETH Zurich. 13 septembre 2019. [Consulté le 25 novembre 2019]. Disponible à l’adresse : https://www.research-collection.ethz.ch/handle/20.500.11850/365054

KUNZE, John, 2019. ARKs @ CDL Architecture. ARKs in the Open Project [en ligne]. 15 mars 2019. [Consulté le 25 novembre 2019]. Disponible à l’adresse : https://wiki.lyrasis.org/display/ARKs/ARKs+@+CDL+Architecture

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *