Le data-steward : le meilleur allié pour la gestion des données dans le cadre de la recherche scientifique

Pourquoi le data-steward ?

Lorsqu’on parle de curation de contenu, on parle d’un processus qui démarre avec la création des données par le chercheur, et qui va jusqu’à son but ultime, la réutilisation des données par d’autres chercheurs. Atteindre cet objectif est toutefois très compliqué, car de nombreuses étapes sont nécessaires et elles requièrent des connaissances spécifiques.

Dans le contexte de la recherche scientifique en Open Science, de nombreuses universités et haute écoles spécialisées demandent un Data Management Plan (DMP) en suivant les principes FAIR (Findable, Accessible, Interoperable et Reusable), mais un large nombre de chercheurs ne sont pas formés adéquatement à une gestion complète des données et ne sont pas conscients des risques auxquels les données sont exposées durant la recherche (Pergl 2019).

(Source : UNIL 2022 : https://www.unil.ch/openscience/fr/home/menuinst/open-research-data/new-data-stewardship.html)

De plus, selon l’article de Barend Mons, nombreux chercheurs consacrent environ 80% du temps à retravailler leurs données afin de les rendre disponibles, « wasting time and talent » (Mons 2020). Afin de combler ces lacunes dans ce contexte, la figure du data-steward émerge comme une solution possible.

Qui est le data-steward ?

Actuellement, nous sommes souvent confrontés à nombreuses professions concernant les données, data-analyst, data-scientist, data-engineer, data-journalist etc. Le data-steward s’inscrit dans ce contexte et malgré son apparition plutôt récente, nous pouvons déjà définir son champ d’action : « The responsible planning and executing of all actions on digital data before, during and after a research project, with the aim of optimising the usability, reusability and reproducibility of the resulting data » (JETTEN 2021). Il s’agit d’une figure fondamentale, qui agit durant toutes les étapes du cycle de vie des données et qui a donc la capacité de superviser la gestion de celles-ci. Le rôle du data-steward est donc concrètement lié à la gestion pratique des données, et ne doit pas être confondu avec la data-governance, qui se situe sur un plan plus théorique et supérieur à la data-stewardship.

Un bon data-steward ?

Les études portant sur la figure du data-steward montrent les caractéristiques de cette nouvelle profession et les attentes des chercheurs et des institutions. Ici, on va surtout se concentrer sur le rôle du data-steward dans le contexte de la recherche scientifique et académique.

Les chercheurs sont les personnes qui produisent les données, mais également celles qui réutilisent les données. Leur rôle est donc central, et c’est pour cette raison que les auteurs des études sur le data-steward ont demandé l’avis des chercheurs (Kvale 2021, JETTEN 2021). La caractéristique principale du data-steward qui en découle est la communication et la relation étroite que le data-steward doit avoir avec le chercheur ou l’équipe de recherche (Kvale 2021). Toutefois, le data-steward n’est pas au service du chercheur, mais il est plutôt un collaborateur et un facilitateur, en permettant d’un côté au chercheur de gagner du temps, et de l’autre de s’assurer que le traitement des données de la recherche soit bien effectué et les données réutilisables dans le futur (Geiger 2009). L’importance de cette collaboration est soulignée, par exemple, par l’Université de Lausanne qui a décidé d’allouer des fonds extraordinaires consacrés au recrutement de data-stewards pour la période 2022-2024, en donnant donc aux chercheurs un appui solide sur comment gérer les données (UNIL 2022).

D’un point de vue plus technique, la gestion des données d’un projet peut parfois s’avérer simple. Toutefois, dans plusieurs circonstances, la gestion des données demande un haut degré de spécialisation en lien avec le domaine de recherche. Par conséquent, le profil idéal du data-steward demandé par les chercheurs serait celui d’une personne ayant un degré d’instruction élevé (au moins niveau Master) avec expérience de recherche dans un domaine en lien avec la recherche menée, mais également avec une solide base d’éducation en informatique, bibliothéconomie ou sciences de l’information (Kvale 2021). Ce profil correspondrait donc à celui du scientific-steward, un data-steward avec des capacités ciblées sur un domaine précis (Peng 2016). En tous cas, il est indéniable que la compréhension du domaine de recherche demeure fondamentale, car les décisions prises par le data-steward concernant les données peuvent impacter le domaine de recherche (Geiger 2009).

Profils souhaités pour le rôle de data-steward

(Source : Kvale 2021)

Enfin, si nous prenons les articles traitant des capacités que le data-steward devrait avoir, nous remarquons l’absence de liens avec les sciences humaines ou les sciences sociales. Cela ne veut pas dire, à notre avis, que ces sciences ne nécessiteront pas de personnel travaillant sur la gestion des données. En effet, comme nous l’avons évoqué plus haut, un Data Management Plan est de plus en plus demandé, et cela aussi dans le contexte des sciences humaines, ce qui ouvrira probablement de nouvelles opportunités dans le traitement des données dans ce domaine.

Bibliographie 

GEIGER, Jonathan, 2009. The talents of a true data steward : technical, interpersonal and positional skills are required to manage data as an asset. Information management [en ligne]. 1er décembre 2009. Vol. 19, no. 8, p. 36. [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://www.proquest.com/docview/214669679/abstract/844C7A0DBE924078PQ/1

JETTEN, Mijke et alii, 2021. Professionalising data stewardship in the Netherlands. Competences, training and education. Dutch roadmap towards national implementation of FAIR data stewardship. [en ligne] Den Haag : Data Archiving and Networked Services (DANS). [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://www.narcis.nl/publication/RecordID/oai:pure.knaw.nl:publications%2F8f21a199-0e83-42cd-a34b-6eefd31a00c6

KVALE, Live Håndlykken, 2021. Using personas to visualize the need for data stewardship. College & Research Libraries. [en ligne]. 2021. [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://crl.acrl.org/index.php/crl/article/view/24914  

MONS, Barend, 2020. Invest 5% of research funds in ensuring data are reusable. Nature [en ligne]. 25 février 2020. Vol. 578, no. 7796, p. 491. [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://www.nature.com/articles/d41586-020-00505-7

PENG, Ge et alii, 2016. Scientific Stewardship in the Open Data and Big Data Era : Roles and Responsibilities of Stewards and Other Major Product Stakeholders. D-Lib Magazine [en ligne]. May/June 2016. Vol. 22, no. 5-6. [Consulté le 4 décembre 2022]. Disponible à l’adresse : http://www.dlib.org/dlib/may16/peng/05peng.print.html

PERGL, Robert et alii, 2019. “Data Stewardship Wizard” : A Tool Bringing Together Researchers, Data Stewards, and Data Experts around Data Management Planning. Data Science Journal [en ligne]. 19 décembre 2019. 18 : 59, pp. 1-8. [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://datascience.codata.org/articles/10.5334/dsj-2019-059/

UNIL, 2022. Data stewardship – soutien à la gestion des données. Université de Lausanne [en ligne]. [Consulté le 4 décembre 2022]. Disponible à l’adresse : https://www.unil.ch/openscience/fr/home/menuinst/open-research-data/new-data-stewardship.html

 

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *