The Truth is Out There: Undiscovered Public Knowledge

La phrase d’accroche de la série mythique « The X-files », maladroitement traduite en français par un « la vérité est ailleurs » m’est immédiatement venue à l’esprit lors du séminaire portant sur l’Information, les données et connaissances donné par Dugon, Meyer, Taboga et Weber lorsqu’ils ont présenté brièvement la théorie de l’Undiscovered Public Knowledge (Swanson: 1986). La traduction française est malheureuse car elle contredit partiellement l’esprit initial de la phrase telle que son personnage principal, Fox Mulder, l’emploie : « Much as you try to bury it, the truth is out there. Greater than your lies, the truth wants to be known. You will know it ». L’esprit original indique bien qu’il existe une connaissance à portée de main; quitte à la dégager du bruit et de la désinformation ambiante. Tandis que la traduction française indique que l’objet de la quête est ailleurs; hors l’ailleurs est partout sauf là où l’on se trouve. Même s’il faut reconnaître que cet quête d’un « ailleurs » colle bien avec le côté ésotérique des X-files.

Si les X-files sont connues pour présenter toutes sortes de fictions et de théories farfelues, exploitant les l’occultisme et l’ufologie, quel peut bien être le lien avec une théorie de référence dans les sciences de l’information ? Peut-être rien, justement. Il est tout à fait possible que ce ne soit qu’une association d’idées. Les humains sont particulièrement doués pour identifier des motifs significatifs, même là où il n’y en a pas. Il s’agit d’un phénomène intéressant en psychologie nommé paréidolie, pensez aux formes des nuages ou au test de Rorschach.

Pourtant, ce que Swanson explique dans son article est qu’étant donné la taille de la littérature scientifique et la spécialisation nécessaire, il est impossible pour une personne de lire une quantité suffisante pour avoir une idée globale de celle-ci dans un délai raisonnable. Sans parler de découvrir et tracer des connexions en lisant des articles éloignés de son champs disciplinaire. Pour établir cette hypothèse, Swanson se base sur la réfutation du positivisme par Karl Popper dans The Logic of Scientific Discovery (1959). Dans ce livre, Popper tente d’apporter une solution au fait de concilier connaissances et observations du monde réel. Pour ce faire, il découpe le monde en trois aspects: le monde observable, tel qu’il existe (le Monde 1; le Monde 2 est le monde subjectif: nos savoirs personnels, nos états-mentaux et sentiments, nos perceptions; et finalement un Monde 3 qui est celui du savoir objectif. C’est ce troisième monde qui compose la littérature scientifique, autant les livres, que les articles, que la totalité des données récoltées sur le Monde 1 (réalité objective), à travers le filtre d’un Monde 2 (les idées et intuitions des chercheurs).

Toute l’idée d’explorer l’Undiscovered Public Knowledge réside en une exploration large du troisième monde de Popper afin de transcender les barrières disciplinaires afin de pouvoir dégager de nouvelles hypothèses de recherche. Cela est particulièrement intéressant dans l’exploration de phénomènes de cause à effet. Un chercheur déduit que A cause B, un autre dans un champs disciplinaire assez éloigné découvre que B cause C. Plus tard, il n’est pas besoin de de recommencer le cycle de la recherche depuis 0 pour postuler l’hypothèse que A cause C; il suffit de trouver les deux articles et de tracer le lien.

Cependant, ce concept de découverte depuis la littérature n’est pas sans poser problème. Comment retrouver un article en lien avec un autre dont les auteurs ignorent tout l’un de l’autre sans pour autant lire la totalité de la littérature ? Swanson est bien conscient des limitations de la Recherche d’information.

Information retrieval is problematic solely because the quantity of published information is far larger than one person can read in any reasonable span of time. The ultimate, though unattainable, standard for insuring that no relevant information is missed is the direct inspection of all pieces of recorded information —a total exploration of World 3.

Swanson tire plusieurs conclusions de cet état de fait.  L’une est que nous avons besoin d’outils de recherche pour pouvoir explorer ce troisième monde. Une autre est que ces outils de recherche, à l’image d’une carte pour explorer le monde réel sont nécessairement réducteurs, ils sélectionnent et par là, suppriment, de l’information. Cette réduction est nécessaire de la même manière qu’une carte à l’échelle 1/1 serait trop encombrante pour être utile. Il en résulte qu’il faut trouver des moyens de sélectionner, indexer et rechercher rapidement et précisément de l’information tout en trouvant le compromis idéal entre concision et exhaustivité.

Swanson écrivait ces lignes à une époque où internet (au sens strict de protocole TCP/IP) était bien établi, mais le web n’était même pas encore au stade de projet au CERN. L’état actuel de la recherche d’information combinant Web, moteurs de recherche à indexation automatique. Et un peu plus récemment Text Data Mining, Large Language Models et Natural Language Processing et permettant d’automatiser l’extraction de sens et la recherche de liens au sein d’un vaste corpus n’étaient que des idées préfigurées dans l’imagination de quelques écrivains de science fiction. Maintenant que des ordinateurs peuvent explorer le Monde 3 et par la même occasion sont capables de produire de l’information dans ce Monde 3, une révolution est en marche. Il est encore trop tôt pour connaître préciséement l’impact de ces pratiques d’automatisation de la recherche et de la création de contenu sur nos pratiques informationnelles. Est-ce que ces outils permettront de faire émerger des connaissances nouvelles, vont-ils au contraire faire apparaître des liens qui ne sont que des hallucinations, ou encore simplement ajouter du bruit au bruit ? Ce sont des questions qu’il faut se poser maintenant pour préparer un avenir souhaitable pour la Recherche d’information.

C’est pourquoi je reviens aux X-files. Cette série nous montre que si la vérité est quelque part, les mensonges aussi. Il faut garder à l’esprit que l’illusion d’un lien produisant une explication n’est pas nécessairement valable. La paréidolie et les hallucinations touchent aussi bien les humains que les IA, et seul l’esprit critique, le dialogue, et par là la possibilité d’être contredit permettent d’avancer pas à pas vers plus de connaissances. Oublier ces principes fondateurs peuvent nous mener à ressembler à un autre personnage d’une autre série populaire: It’s Always Sunny in Philadelphia

Un homme pointe un tableau rempli de papiers et photos reliés de fils rouge. Meme représentant le conspirationniste typique tiré de la série It's Always Sunny in Philadelphia.
À vouloir chercher des liens, on finit par en trouver. Quitte à tomber dans le conspirationnisme.

D’ailleurs, avez vous remarqué que la description du consortium du World Wide Web est abrégé W3 ? Tout comme le World 3 de Karl Popper. Coïncidence ?

Références

Eco, U. (2013). Pastiches et postiches. Librairie générale française.

Ijaz, A. Z., Song, M., & Lee, D. (2010). MKEM: a Multi-level Knowledge Emergence Model for mining undiscovered public knowledge. BMC Bioinformatics, 11 Suppl 2(S2), S3–S3. https://doi.org/10.1186/1471-2105-11-S2-S3

Palsky, G. (1999). Borges, Carrol et la carte au 1/1.Cybergeo: European Journal of Geography. [En ligne], Cartographie, Imagerie, SIG, document 106, mis en ligne le 30 septembre 1999, consulté le 12 novembre 2024. URL : http://journals.openedition.org/cybergeo/5233 ; DOI : https://doi.org/10.4000/cybergeo.5233 

Popper, K. .R, & Keuth, H. (2013). Logik der Forschung (4. Bearb. Aufl.), Akademie Verl.

Swanson, D. R. (1986). Undiscovered Public Knowledge. The Library Quarterly: Information, Community, Policy, 56(2), 103–118. http://www.jstor.org/stable/4307965

Carnet d'IdéeS - blog du Master IS

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *