Résultats du projet ICOPAD

Le projet Infrastructure Nationale d’un Complément d’Identifiants Pérennes, Interopérables et Traçables (INCIPIT) est, entre autres, basé sur les résultats du projet ICOPAD.

Contexte

Actuellement, la situation en Suisse est dominée par un seul et unique identifiant pérenne (PID - persistent identifier), à savoir le Digital Object Identifier (DOI), attribué depuis 2010 par la bibliothèque de l'Ecole polytechnique fédérale de Zurich (EPFZ), membre de DataCite. Le service PID est utilisé pour les documents et les données et n'est gratuit que pour les scientifiques travaillant pour l'EPFZ ; une contrainte que l'on peut constater pour l'utilisation assez restreinte du service.

Pour surmonter cette contrainte, certaines institutions recommandent à leurs scientifiques de publier leurs données sur Zenodo, qui est hébergé par l'Organisation européenne pour la recherche nucléaire (CERN), une organisation extraterritoriale située à la frontière franco-suisse près de Genève. En raison de la spécificité de l'extraterritorialité, d'autres institutions interdisent à leurs scientifiques d'y publier les données, car leur politique n'autorise pas la publication de données en dehors des frontières suisses. FORSbase est un troisième référentiel de données suisse, ouvert uniquement aux données des sciences sociales sans politique stricte concernant les identificateurs (certains ensembles de données ayant des DOI et d'autres n'ayant pas du tout d'identificateurs permanents).

Parallèlement à ces services bien établis, l'attribution d'identifiants ARK (Archival Resource Key) est en préparation au laboratoire numérique des humanités numériques de l'Université de Bâle dans le cadre du développement du Data and Service Center for the Humanities (DaSCH), une archive à long terme de données issues des sciences humaines (numériques). Ces identifiants ARK ne seront donc attribués qu'à un nombre restreint de données. Un autre projet suisse en cours, appelé Data Life-Cycle Management (DLCM), est toujours en cours d'élaboration et prévoit également d'attribuer principalement des DOI aux données de préservation à long terme. Ces données seront hébergées dans un avenir proche.

Pour toutes les raisons évoquées précédemment, le projet ICOPAD a été mené de juin 2017 à décembre 2018 pour réfléchir à un modèle adapté au paysage scientifique suisse et plus spécifiquement pour les données de l'art et du design. Le projet ICOPAD était aussi l'occasion de préciser toutes les exigences et les flux de travail nécessaires, notamment en recommandant la mise sur pied d'un Hub national capable d'attribuer des identifiants ARK à tous types d'entités.

Livrables

1) Etudes préliminaires


Approche d'attribution générique

2) Travail de recherche réalisé par des étudiantes du Master IS en 2017-2018


Panorama des identifiants pérennes

3) Modélisation en Linked Data


Panorama des identifiants pérennes

4) Recommandations et modèle informationnel

Cinq solutions ou approches (hypothétiques) ont été choisies pour la création et l'attribution d'identifiants ARK ou encore pour concevoir ses propres identifiants. Pour ce dernier, le PID que nous avons considéré comme étant une bonne simulation est le Research Resource Identifier (RRID) utilisé dans le cadre des données biologiques dans le format suivant : RRID:Identifier. Il est exploité, entre autres, par l'Université de Californie et ces identifiants se trouvent sur Google Scholar ou PubMed. Pour les besoins du projet ICOPAD, les auteurs et les institutions participantes ont décidé de désigner cet identificateur de type RRID comme tel : "The Arts and Design Identifier" (ADID).

Description

1.

ARK via its own means - Each organisation could ask a NAAN to the CDL and mint their own ARKs. They could decide whether they want to deploy one or several NMAH. This solution could also be conducted for some time before switching to the ones proposed by the implementation of a national Hub minting either ARKs (3) or RRID-like identifiers (5).

2.

ARK via DaSCH – As stated in the Swiss PID landscape section, the DaSCH project attributes ARK identifiers for the needs of its research data archival system. The internal structure of the system could theoretically and practically allow the minting of ARKs to third members. The NMAH (ark.dasch.swiss) and NAAN (72163) would be then the ones that DaSCH has deployed or received. Unfortunately, DaSCH does not see itself as the future national hub at the moment.

3.

ARK via a national Hub – The creation of a Swiss Hub that is able to mint ARKs and offer services to organisations that have participated or are interested in the ICOPAD project effort. This national Hub could deploy one or several NMAH.

4.

RRID-like (ADID) via its own means – Each organisation could mint their own RRID-like identifiers (ADIDs). This solution could also be conducted for some time before switching to the ones proposed by the implementation of a national Hub minting either ARKs (3) or ADIDs (5).

5.

RRID-like (ADID) via a national Hub – The creation of a Swiss Hub that is able to mint ADIDs rather than ARKs. They could also deploy one or several hostname services (the equivalent to NMAH in the ARK anatomy) to resolve PIDs.

Hostname / PID Authority Matrix :

Panorama des identifiants pérennes