Prendre soin des données, littéralement : Data Feminism et éthique du care

Ce vendredi matin 25 novembre 2022, le hasard du calendrier m’encourage à teinter de féminisme la séance sur la curation de données exposée devant moi. Une question, un peu étrange, voire carrément à côté de la plaque, ou au contraire absolument nécessaire, me traverse alors : de quel genre sont les données ? ou de quelle couleur ? Je tapote nonchalamment – disons simplement je googlise – ‘‘data’’+‘‘feminism’’ en m’attendant à tomber sur des manifestes cyberféministes et autres imaginaires cyborgs des espaces numériques. Si mon moteur de recherche ne répond pas directement à cette première question, il me propose une piste : derrière les données, il n’y a non seulement des machines et des algorithmes, mais il y a surtout des personnes et des enjeux de pouvoir. C’est ce que défendent les deux Data scientists états-uniennes Catherine D’Ignazio et Lauren F. Klein dans Data Feminism sorti en 2020 en papier et en open access aux presses du MIT :

« No dataset or analysis or visualization or model or algorithm is the result of one person working alone. Data Feminism can help to remind us that before there are data, there are people—people who offer up their experience to be counted and analyzed, people who perform that counting and analysis, people who visualize the data and promote the findings of any particular project, and people who use the product in the end. There are also, always, people who go uncounted—for better or for worse. » (D’Ignazio & Klein 2020, 10)
Christine Darden dans la salle de contrôle, Langley NASA 1975
Christine Darden en 1975 © NASA

Voici une première histoire, racontée dans Hidden Figures de Margot Lee Shetterly et adaptée récemment au cinéma : celle de la mathématicienne afroaméricaine Christine Darden engagée en 1967 au centre de recherche de la NASA pour calculer la trajectoire de la mission Apollo 11. Le travail d’analyse des données reposait sur des ‘‘ordinateurs humains’’, tous des femmes, diplômées en mathématiques et en physique. Elles étaient pourtant considérées comme des travailleuses temporaires non qualifiées par la NASA et par les ingénieurs, en grande majorité des hommes, qui ne prenaient la peine ni de connaître leurs noms, ni de les informer de la source des données qu’elles analysaient. Ce n’est qu’en 2016, entre autres à travers la publication de Hidden Figures, que leur travail – crucial pour la domination des États-Unis sur la Lune et sur le bloc de l’Est – et ses conditions discriminatoires ont été enfin reconnues (D’Ignazio & Klein 2020, 1-3).

Avec les outils des sciences sociales et sous le prisme des théories féministes intersectionnelles, Data Feminism met au jour les biais, sexistes et racistes entre autres, dans la production de la Data science. Il rend compte des pratiques de collecte, de traitement et de préservation des données qui répondent à des impératifs non seulement scientifiques mais avant tout et surtout économiques et politiques. Il y a bien sûr les jeux de données non représentatifs et biaisés, mais il y a aussi ceux qui ne seront tout simplement pas récoltés (D’Ignazio & Klein 2020, 33).

Pour pallier ces manquements et rendre visible les angles aveugles de la Data science, certain·es se transforment en Data scientists ou, j’y viens, en Data curators bénévoles. C’est par exemple la tâche que s’est donnée la géophysicienne mexicaine María Salguero en recensant les féminicides perpétrés dans son pays et non comptabilisés par les organes de l’État (Calmard 2021). À la croisée entre curation de contenu et curation de données, elle active dès 2016 des alertes Google pour repérer dans les journaux locaux tout ce qui touche aux meurtres de femmes et crée une cartographie sur son site Los Feminicidios en México. La carte interactive Google Maps est continuellement alimentée, complétée par des fiches descriptives des féminicides et devient un outil de référence largement consulté par les médias, les scientifiques et les autorités, mettant ainsi en évidence l’ampleur des violences sexistes et marquant « un tournant dans l’approche et la compréhension de ce problème » (Wendy Figueroa in Calmard 2021).

Cartographie des féminicides au Mexique 07.2021
Cartographie des féminicides au Mexique (juillet 2021) © María Salguero

C’est quoi, ou plutôt c’est qui, au juste, la curation de données ?

J’en viens à la Data curation, aussi appelée Digital curation. Apparue au tournant des années 2000 face au déluge informationnel et au Big Data (Lord et al. 2004 ; Mesguich et al. 2012), elle est définie par la chercheuse en Information sciences Sarah Higgins comme « the technical, administrative and financial ecology required to ensure that digital information remains accessible and usable over the long term » (Higgins 2018), soit le travail qui assure l’utilisation et la pérennité des données à travers les aléas du temps. Le Digital Curation Centre, fondé en 2004 en Grande-Bretagne et devenu depuis une institution de référence, insiste sur sa dimension circulaire et axiologique : « curation involves maintaining, preserving and adding value to digital research data throughout its lifecycle. » (DDC 2022). À la racine du mot, le nom latin cura, proche du mot care en anglais, rappelle qu’il s’agit de « prendre soin » des données.

Data Curator
© TDWI 2022

Je tente alors un saut périlleux. La curation de données est-elle un travail de care ? L’éthique du care, une éthique de la vulnérabilité, a été théorisée dans les dernières décennies par des philosophes féministes et notamment Carol Gillian et Joan Tronto. Elle cherche à revaloriser et à se réapproprier, par des actions concrètes et quotidiennes, les vertus « du soin » et de la « sollicitude » aux autres, tout en démontrant que ce travail, bien qu’essentiel aux sociétés, est dévalué et largement pris en charge par les femmes et les minorités de genre et non blanches (Laugier & Paperman 2011). On entend généralement par métiers du care les professions invisibles et mal rémunérées de l’aide aux personnes, de la santé, de l’éducation et de la petite enfance ou encore le travail social (Meyronin 2022). Sur ce plan fondamental, il est évident que les Data curators ne sont pas logés à la même enseigne : les métiers de l’IT et de la Data science sont sous-représentés par les femmes (26% aux États-Unis en 2019) (Selvaraj 2020) et bénéficient, en Suisse du moins, d’une confortable rémunération (Chavanne 2019). Toutefois, certains outils d’analyse de l’éthique du care permettent d’éclairer les données sous un nouveau jour. Le plus grand enjeu de la curation de données est d’assurer l’interopérabilité des jeux de données malgré leur variété. Dans les mots de la philosophie féministe, ça signifie reconnaître et entretenir l’interdépendance, valoriser l’unité dans la diversité (Zielinski 2010). Par ailleurs, la curation de données est aussi confrontée à une certaine résistance de la part des instances dirigeantes. Elle doit justifier son temps (Perry & Netscher 2022), son coût (Karp 2016), se faire reconnaître comme génératrice de valeur, voire nécessaire à la poursuite des activités, bref indispensable. Elle cherche à prendre soin ce qui ‘‘est là’’, des données, notamment de recherche, déjà créées, déjà compilées, et à les faire perdurer, au lieu de multiplier les efforts pour en produire de nouvelles (DCC 2022). J’y vois une idée de non-substitution des données, puisqu’elles sont produites dans un certain contexte et qu’il n’est pas certain qu’elles puissent être créées de nouveau, à un autre moment, par d’autres personnes. Reste une question : si on considère que les données non structurées sont vulnérables, faut-il et comment alors prendre soin de la grande majorité du Big Data ? work in progress…

Références et pour aller plus loin...

CALMARD, Diego, 2021. Maria Salguero à l’origine d’une carte interactive des féminicides au Mexique. Causette. [en ligne]. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://www.causette.fr/feminismes/figures/maria-salguero-a-lorigine-dune-carte-interactive-des-feminicides-au-mexique

CHAVANNE, Yannick, 2019. Les data scientists de Suisse gagnent beaucoup plus que leurs confrères européens. [en ligne]. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://www.ictjournal.ch/etudes/2019-03-04/les-data-scientists-de-suisse-gagnent-beaucoup-plus-que-leurs-confreres-europeens

DIGITAL CURATION CENTRE, 2022. What is digital curation? [en ligne]. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://www.dcc.ac.uk/about/digital-curation

D’IGNAZIO, Catherine et KLEIN, Lauren F., 2020. Data Feminism. Cambridge: MIT Press. ideas series. ISBN 978-0-262-04400-4.

HIGGINS, Sarah, 2018. Digital curation: the development of a discipline within information science. Journal of Documentation. Vol. 74, no. 6, pp. 1318‑1338. DOI 10.1108/JD-02-2018-0024.

KARP, Peter D., 2016. How much does curation cost? Database: The Journal of Biological Databases and Curation. Vol. 2016, pp. baw110. DOI 10.1093/database/baw110.

LORD, P., MACDONALD, A., LYON, Liz et GIARETTA, David, 2004. From Data Deluge to Data Curation. In: Proceedings of the UK e-science All Hands meeting. Citeseer. 1 septembre 2004. pp. 371‑375.

MESGUICH, Véronique, PIERRE, Julien, ALLOING, Camille, GALLEZOT, Gabriel, SERRES, Alexandre, PEIRANO, Richard, FROSSARD, Fabrice, DESCHAMPS, Christophe, BATTISTI, Michèle et MARTINET, Frédéric, 2012. Enjeux et dimensions. Documentaliste-Sciences de l’Information. Vol. 49, no. 1, pp. 24‑45. DOI 10.3917/docsi.491.0024.

MEYRONIN, Benoît, 2022. Métiers du « care » : « Derrière chaque personne se cache une autre personne sans l’aide de qui la première ne serait pas autonome ». Le Monde.fr. [en ligne]. 3 mai 2022. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://www.lemonde.fr/idees/article/2022/05/03/metiers-du-care-derriere-chaque-personne-se-cache-une-autre-personne-sans-l-aide-de-qui-la-premiere-ne-serait-pas-autonome_6124548_3232.html

PERRY, Anja et NETSCHER, Sebastian, 2022. Measuring the time spent on data curation. Journal of Documentation. Vol. 78, no. 7, pp. 282‑304. DOI 10.1108/JD-08-2021-0167.

LAUGIER, Sandra et PAPERMAN, Patricia, 2011. Le souci des autres: Éthique et politique du care. Éditions de l’École des hautes études en sciences sociales. ISBN 978-2-7132-3094-3.

SELVARAJ, Natassha, 2020. The Gender Gap in Data Science: What the Data Says. Medium. [en ligne]. 12 juin 2020. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://betterprogramming.pub/the-gender-gap-in-data-science-what-the-data-says-2a74892655f1

WIRTH, Assia, 2021. Data feminism : perspectives féministes sur la protection des données | LINC. [en ligne]. [Consulté le 5 décembre 2022]. Disponible à l’adresse: https://linc.cnil.fr/fr/data-feminism-perspectives-feministes-sur-la-protection-des-donnees

ZIELINSKI, Agata, 2010. L’éthique du care. Une nouvelle façon de prendre soin. Études. Vol. 413, no. 12, pp. 631‑641. DOI 10.3917/etu.4136.0631.

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *