1. Choix d'une licence pour la publication de données bibliographique en Linked Open Data
  2. Métadonnées de la numérisation et Linked Data
  3. Processus de transformation des données en RDF

 

1. Choix d'une licence pour la publication de données bibliographiques en Linked Open Data

Publier sans licence signifie laisser les lois actuelles protéger par défaut ses données. Choisir une licence pour ses données permet d'une part de clarifier la situation juridique quant à leur réutilisation (qui peut être opaque) et d'autre part de modifier cette situation, par exemple en libérant les données dans le domaine public.

L'adoption d'une licence préexistante est recommandée pour une meilleure interopérabilité juridique des données. Deux standards se sont imposés dans le domaine:

  1. Les licences Creative Commons (CC)
    Le standard le plus répandu, tous domaines confondus.
  2. Les licences Open Data Commons (ODC)
    Le standard prévu en particulier pour les données et les jeux de données.

Ces standards permettent de publier les données dans le domaine public (renonciation définitive à la majorité des droits). Il est également possible de choisir une clause d'attribution ou une clause de partage dans les mêmes conditions.

Si d'autres types de clauses sont retenues, la licence n'est alors plus considérée comme ouverte selon la définition de la fondation Open Knowledge.

Dans le contexte du web sémantique et d'un fort mouvement de réutilisation des données, les licences comportant des clauses d'attribution ou de partage dans les mêmes conditions peuvent mener à des difficultés techniques lors du développement d'applications web basées sur ces données. Dans cette optique, il est alors recommandé de publier dans le domaine public.

Plus d'informations sur le choix d'une licence: licences.pdf

 

2. Métadonnées de la numérisation et Linked Data

Un projet de numérisation se base sur un processus complexe composé de plusieurs étapes. L'une de ces étapes concerne l'import, la transformation et la génération de métadonnées sur les objets numérisés.

Les standards de métadonnées les plus utilisés sont actuellement:

Exprimer en RDF des données structurées ainsi nécessite de porter une attention particulière à certains points. D’une part, la modélisation doit être suffisamment précise pour distinguer un document (éventuellement un sous-ensemble de ce document tel qu’un numéro de revue), une page de ce document ainsi que les fichiers numériques disponibles à proprement parler (par opposition aux métadonnées). D’autre part, des identifiants cohérents, persistants et déréférençables doivent être attribuées à toutes les ressources décrites.

Plus d'informations sur cet aspect: numerisation_et_ld.pdf

 

3. Processus de transformation des données en RDF

Analyse des best practices

Processus de transformationPlusieurs bibliothèques ont fait le pas du web sémantique et ont documenté leur méthodologie et leur processus de transformation des données bibliographiques. Il s'agit notamment de:

Sur cette base, le processus imagé ci-contre a été conçu, synthétisant l'ensemble des quatre méthodes adoptées par les bibliothèques mentionnées.

Pour la conversion technique des données, plusieurs logiciels ont été développés pour les données de bibliothèques, notamment :

Plus d'informations sur le processus de transformation: processus_transformation.pdf