George Eliot, Harper Lee, George Sand, les sœurs Brontë, André Léo… Autant de grandes femmes, tant autrices que militantes, qui ont choisi de porter un prénom masculin comme nom de plume afin que leurs textes soient plus facilement publiés. Leur choix n’était pas anodin : il reflétait une époque où la voix féminine dans la littérature était systématiquement minimisée, suspectée d’être moins sérieuse, moins profonde ou simplement cantonnée à des genres considérés comme « mineurs », tels que les romans sentimentaux ou domestiques (Milquet, 2012). Choisir un nom de plume masculin permettait de franchir la barrière de la crédibilité et d’être jugée d’abord sur le texte plutôt que sur son genre. Et le phénomène n’est pas qu’historique : une expérience contemporaine a montré qu’un manuscrit signé « Daniel » avait plus de chances d’être accepté que le même signé « Catherine » (Chouvelon, 2015). Ce simple changement de prénom montre à quel point celui-ci peut encore aujourd’hui influencer les jugements, révélant la persistance de biais que l’on pourrait croire dépassés.
Ainsi, les préjugés de genre attribués au prénom et au nom ont encore de beaux jours devant eux, et les études académiques sur le sujet continuent d’appuyer cette thèse (Coulmont, 2022). Ces biais, profondément ancrés, façonnent notre perception des textes avant même la lecture de ceux-ci. Ils peuvent conditionner non seulement l’accès à la publication mais aussi la réception par le public, la critique littéraire et même les opportunités de carrière. Or, la situation devient encore plus ambiguë lorsque les prénoms sont mixtes, comme « Dominique » ou « Camille », ou lorsqu’ils changent de genre selon la langue et le contexte culturel. Alexis, par exemple, est masculin en français mais féminin en anglais. D’autres prénoms, comme Andrea, Sam ou Sasha, brouillent volontairement les pistes.
De la littérature aux bases de données
Ces questions dépassent la sphère littéraire. En effet, il existe aujourd’hui des outils, tels que NameAPI ou genderize.io, capables d’associer un genre à un nom ou un prénom. Pour y parvenir, ils s’appuient sur diverses bases de données qui recensent l’usage des noms et prénoms et estiment, à partir de leur fréquence d’apparition, la probabilité qu’ils soient associés à un genre plutôt qu’à un autre. Cependant, des biais peuvent être relevés même au sein de ces outils quand la variable du contexte linguistique du prénom et du nom rentre en jeu (Pan et al., 2023). Notre projet s’inscrit dans ce contexte : il vise à évaluer la qualité de ces outils d’inférence disponibles sur le marché. Nous voulons identifier leurs forces, leurs limites et leur potentiel d’amélioration afin que les chercheur-euse-s puissent choisir celui qui répond le mieux à leurs besoins. Cette évaluation se veut à la fois technique et critique, dans une démarche tant qualitative qu’explicative.
Méthodologie
Après avoir constitué une base de données solide composée des noms, prénoms et nationalités d’un nombre conséquent d’individus, nous ferons travailler ces outils d’inférence et nous analyserons les résultats obtenus. En outre, notre évaluation ne se concentrera pas uniquement sur une base de données helvétique mais également internationale afin d’évaluer au mieux ces outils. D’autres critères d’évaluation seront ajoutés, comme le prix, l’accessibilité, les possibilités d’ajouter des alphabets autres que le latin, etc.
Pour la récolte de données, nous nous appuierons sur Wikidata, qui regorge de jeux de données structurées qui nous paraissent pertinents pour notre étude. Pour cela, nous mettrons à profit SPARQL et les technologies de graphes de connaissance pour la collecte de ces données. Aussi, nous établirons une grille d’évaluation qui pourra nous aider à mettre en place ce projet de benchmark qui se veut à la fois helvétique et international.
Et après ?
Ce projet pourra alors servir tant de référence :
- Pour les chercheur-euse-s souhaitant utiliser des outils d’inférences qui pourront ainsi trouver quel outil correspondrait le plus à leurs besoins ;
- Pour les développeur-euse-s de ces outils qui pourront mieux cerner leurs points faibles et les améliorer.
Bien sûr, notre projet comporte des limites. En effet, nous nous concentrons que sur les genres « homme » et « femme » et donc effaçons une myriade d’identités de genre qu’il serait compliqué d’évaluer dans ce travail. Aussi, si nous avions décidé de mener ce projet en nous basant sur les autrices citées plus haut, les outils d’inférence auraient très probablement échoué à les considérer comme des femmes. Ce simple constat souligne à quel point ces technologies restent imparfaites pour saisir la complexité des identités humaines.
Conclusion
Nous en sommes encore aux prémices du projet, mais l’enjeu est clair : les prénoms et les noms ne sont pas de simples étiquettes. Ils portent avec eux des attentes, des préjugés, et parfois des barrières invisibles. L’évaluation de ces outils d’inférence pourra non seulement servir à produire un guide pratique aux scientifiques, mais aussi inviter à réfléchir plus largement aux biais implicites qui continuent d’influencer notre société.
Cet article de blog a été rédigé par Claire Hoffmann et Nemo Vollert, dans le cadre de notre projet de recherche “Benchmarking des outils d’inférence du genre à partir des noms et prénoms” du Master IS, et avec M. Patrick Ruch comme directeur de recherche.
Bibliographie
CHOUVELON, Clémence, 2015. Les auteurs ont huit fois plus de chances de percer avec un nom de plume masculin. ActuaLitté.com [en ligne]. 6 août 2015. Disponible à l’adresse : https://actualitte.com/article/38336/livres-anciens/les-auteurs-ont-huit-fois-plus-de-chances-de-percer-avec-un-nom-de-plume-masculin [consulté le 26 août 2025].
COULMONT, Baptiste, 2022. Sociologie des prénoms. 3 éd. Paris : la Découverte. Repères, 582. ISBN 978-2-348-07338-0.
MILQUET, Sophie, 2012. Un autre genre d’histoire littéraire : femmes & littérature. Acta Fabula. Vol. 13, no 2. DOI 10.58282/acta.6822.
PAN, Zihao et al., 2023. For the Underrepresented in Gender Bias Research: Chinese Name Gender Prediction with Heterogeneous Graph Attention Network. Proceedings of the AAAI Conference on Artificial Intelligence. Vol. 37, no 12, pp. 14436‑14443. DOI 10.1609/aaai.v37i12.26688.
PECÁNEK, Michal, 2020. Google’s Knowledge Graph Explained: How It Influences SEO. SEO Blog by Ahrefs [en ligne]. 19 mars 2020. Disponible à l’adresse : https://ahrefs.com/blog/google-knowledge-graph/ [consulté le 31 août 2025].
George Eliot, 2025, Wikipédia [en ligne]. Disponible à l’adresse : https://fr.wikipedia.org/w/index.php?title=George_Eliot&oldid=228496816 [consulté le 31 août 2025]. Page Version ID: 228496816


Laisser un commentaire