Le CARE Digital ou comment prendre soin de la santé de ses données

Classé dans : Curation des données | 0

Data sana in corpore sano

Les définitions de ce concept, comme celle de la DCC (Digital Curation Centre), s’intéressent exclusivement aux données issues de la recherche, alors que, compte tenu de l’augmentation de la masse d’informations, les problématiques liées à l’accès, à la réutilisation ou au stockage de ces données touchent tous les domaines. En effet, nous nous rendons pas forcément tous.te.s compte de la quantité de données que nous générons chaque jour sans être des chercheur.euse.s aguerri.e.s. Tout le monde produit et peut prendre soin des données, tant dans sa vie privée que professionnelle. Ce soin peut être assuré à la fois par les personnes produisant les données, les Data Creators, et par des spécialistes, les Data Curators. C’est dans le contexte de la curation de données que de nouveaux métiers émergent, en lien avec la santé des données, comme une sorte de care numérique.

Évolution des données (Source: Hack 2021)

Harvey, dans son livre Digital Curation: A How-to-do-it Manual (2016), illustre les principaux.ales acteur.rice.s et les outils essentiels de la curation de données. Imaginons alors un corps où les données sont des organes : pour que chaque donnée puisse être utilisée correctement, le médecin, soit le/la Data Curator, doit s’assurer de la bonne santé de chaque organe, soit les données, en prescrivant les soins nécessaires. En mettant en place des vaccins, soit des standards de curation, il/elle s’assure que celles-ci ne soient pas corrompues et puissent être utilisées par le Data User.

Un.e curateur.rice en pleine action (Source: Lydon, 2024)

Le scalpel des curateur.rice.s de données

L’outil le plus important de la curation de données est les métadonnées, soit des données à propos de données ou plus explicitement « des informations qui décrivent les caractéristiques basiques d’une donnée ou d’un jeu de données, et ce, quel que soit le support (physique ou numérique) » (Créer des métadonnées – Research Data – UNIGE 2017). Ainsi, ces métadonnées agissent comme une sorte de dossier médical pour chaque organe. Les centres de dépôt de ces données, lorsqu’ils offrent des possibilités de curation, agissent comme des banques d’organes voire des hôpitaux. L’on peut également suivre des modèles, comme celui du DCC ou celui de l’OAIS, même si ceux-ci ne sont pas forcément imaginés pour un monsieur ou une madame Tout-le-monde. Pour filer la métaphore médicale, les différents guides peuvent ainsi correspondre aux recommandations de l’OMS. Cependant, pour certain.e.s, ces modèles ne sont plus d’actualité : par exemple, Hea Lim Rhee Elle propose un modèle qui se concentre sur l’aspect de curation, où les utilisateur.rice.s sont écouté.e.s, comme de réel.le.s patient.e.s qui attendent qu’on prenne soin de leur données (Rhee, 2024).

Quoi de neuf, curateur?

Tout comme dans le monde médical, des questions juridiques ou encore éthiques sont à relever lorsqu’il s’agit de curation de données. C’est ce que révèle l’article de Leavy et al. sur la curation de données et l’intelligence artificielle (IA) (2021) ; tout comme les biais racistes ou sexistes peuvent entraver le diagnostic des médecins, des aspects similaires peuvent se retrouver dans la manière dont les données sont traitées par les IA. Par exemple, en médecine, le syndrome du méditerranéen est un préjugé raciste qui, de nos jours, est à l’origine d’erreurs médicales pouvant causer victimes. De la même manière, les IA effectuant de la curation de données peuvent s’appuyer sur des données issues de la banalisation de certaines discriminations. Cet aspect discriminant peut être lié au fait que certains groupes minoritaires ne sont pas présents sur internet ou les données ne sont pas contextualisées. Il apparait donc crucial pour les checheur.euse.s en charge de la gestion de ces IA de les entrainer en incluant les personnes minoritaires et en tenant compte des nouvelles connaissances.

Conclusion

Ainsi, tout comme prendre soin de sa santé est important, prendre soin de ses données l’est tout autant. L’importance de la curation des données ne touche pas que le monde de la recherche, surtout lorsque l’on considère le fait que tout le monde produit des données. Aussi, nous pouvons tous.tes avoir le bon réflexe avec la santé de nos données, car, si an apple a day keeps the doctor away, quality metadata keep the data curator at bay.

Bibliographie

COLOMINES, Elsa, OBERLIN, Chloe, ROLLAND, Gabriel et VOLLERT, Nemo, 2024. Curation des données [en ligne]. 29 novembre 2024. Disponible à l’adresse : https://cyberlearn.hes-so.ch/mod/resource/view.php?id=2181579 [consulté le 02 décembre 2023].

Créer des métadonnées – Research Data – UNIGE, 2017 [en ligne]. Disponible à l’adresse : https://www.unige.ch/researchdata/fr/collecter-organiser/creer-metadonnees/ [consulté le 1 décembre 2024]. Last Modified: 2023-11-21T15:22:17Z

HARVEY, Douglas Ross, 2010. Digital curation: a how-to-do-it manual. New York : Neal-Schuman Publishers. How-to-do-it manuals no. 170. ISBN 978-1-55570-694-4.

LTD, Red Gate Software et HACK, Ulrike, 2021. What’s the real story behind the explosive growth of data? Redgate [en ligne]. 8 septembre 2021. Disponible à l’adresse : https://www.red-gate.com/blog/database-development/whats-the-real-story-behind-the-explosive-growth-of-data [consulté le 1 décembre 2024].

LYDON, Cora, 2024. Leaked NHSE review warns of ‘severe shortage’ of digital nurses. Digital Health [en ligne]. 24 juin 2024. Disponible à l’adresse : https://www.digitalhealth.net/2024/06/leaked-nhse-review-warns-of-severe-shortage-of-digital-nurses/ [consulté le 1 décembre 2024].

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *