Considérations méthodologiques
Parmi les différents projets de recherche de la cuvée 2018-2020 du Master en Sciences de l’Information, notre groupe fait partie de ceux qui se pencheront sur la question de l’Open Science. Plus particulièrement, dans notre cas, sur celle de l’Open Data. Notre objectif ? Préparer des outils pour permettre, en amont, de mesurer l’impact de l’Open Data dans les sphères académiques. Pour cela, dans un premier temps, nous récolterons et identifierons les impacts perçus de l’Open Data, puis, dans un second temps, nous mettrons au point des indicateurs permettant de mesurer s’ils se réalisent.
Concrètement, cela implique une récolte et une gestion de données. Elles seront issues d’une série d’entretiens, ainsi que des réponses obtenues suite à l’envoi d’un questionnaire. C’est à ce stade que des questions de méthodologie et de collecte de données se posent, y compris la question classique : comment obtenir une représentativité acceptable ? Par précaution, nous avons décidé d’aller mener au moins un entretien en terre germanophone, pour ne pas passer à côté d’une éventuelle perception fondamentalement différente de l’Open Data dans ces contrées.
Dans la même intention, nous enverrons nos questionnaires à des chercheurs appartenant aux facultés des Sciences de diverses institutions académiques : d’un côté, cela circonscrira la collecte de contacts, et d’un autre, cela nous permettra de toucher des chercheurs travaillant avec une intéressante variété de données. Nous avons inféré, en effet, que la perception de l’Open Data ne serait pas la même auprès d’un chercheur dont les données sont composées, par exemple, d’enregistrements des vocalisations des passereaux à gorge vineuse que d’autres récoltant trois millions de gigaoctets d’images issues d’un radar à synthèse d’ouverture. A contrario, sans vouloir critiquer gratuitement notre alma mater, les données produites par des chercheurs en Lettres seraient moins variées.
Considérations stratégiques
Quand bien même nous obtiendrions une bonne représentativité, nous nous posons tout de même des questions, et, qui plus est, des questions qui n’auraient pas leur place ailleurs que sur ce blog. Des questions classiques, une fois de plus, que tout chercheur se pose à un certain point de son travail : les résultats de notre recherche, seront-ils intéressants ? Les chercheurs perçoivent-ils l’Open Data d’une façon pertinente et exploitable ?
En effet, l’Open Data est un sujet à la mode dans les meilleurs salons, mais son impact n’est pas connu. Existe-t-il seulement ? Peut-être, à l’aboutissement de notre travail, constaterons-nous qu’une vaste majorité des chercheurs ne perçoit aucun impact aux différents projets d’Open Data en Suisse. Certains, peut-être, suggéreront que contraindre la publication des données de la recherche mettra fin aux agissements des chercheurs peu scrupuleux qui font mentir leurs données en utilisant à leur avantage écarts-types et autres tests de significativité. D’autres, de la même veine, penseront peut-être que l’Open Data permettra de jeter quelque lumière sur les recherches scientifiques mandatées, par exemple, par des multinationales de l’industrie du tabac, en rendant possible l’examen attentif des données brutes produites par ces recherches.
Ces impacts perçus, quels qu’ils soient, alimenteront notre propre jeu de données. Si l’impact de l’obstacle à la manipulation frauduleuse des données est notablement ressenti par les personnes que nous interrogerons, nous le prendrons en compte et nous lui trouverons des indicateurs, et à ceux-ci des méthodes de suivi et d’évaluation.
Bien, mais le fait est que l’Open Data aura des impacts probables. L’un d’eux, par exemple, est une certaine émulation scientifique, due à l’apparition de recherches transdisciplinaires, facilitées par l’ouverture des données. De même, il est déjà établi que des jeux de données ouvertes obtiennent un bon nombre de citations. Le problème est donc le suivant : que ferons-nous si aucun chercheur ne mentionne ces impacts ? Cela gênerait la création de nos données et leur exploitation ultérieure. Naturellement, nous pouvons induire ces réponses dans la formulation de nos questions, mais il importera alors de le faire avec toutes les précautions que la neutralité exige.
Ce sont là quelques considérations que nous avions, d’entrée de jeu, au sujet de la création et de la gestion de nos futures données. L’objectif n’est pas de les résoudre ici : nous le ferons bien assez tôt. Dans tous les cas, nous entrerons très bientôt de plein pied dans notre recherche, et nous sommes résolument curieux d’apprendre comment les chercheurs perçoivent les impacts de l’Open Data. À ce stade, nous pouvons tout entendre, et tout peut arriver.
Laisser un commentaire