Interviews Diffusé le

Guillaume Cabanac, « dépollueur scientifique »

Les articles frauduleux « polluent » la science. Guillaume Cabanac veut la dépolluer. À cet effet, cet enseignant-chercheur (université Toulouse-3) a conçu un logiciel qui passe au crible les publications scientifiques à la recherche d’indices de fraude, comme la copie de passages d’articles indûment paraphrasés.

Réalisation : SapienSapiens

Production : Universcience

Année de production : 2022

Durée : 5min34

Accessibilité : sous-titres anglais, sous-titres français

Guillaume Cabanac, « dépollueur scientifique »

Moi, je vois cela comme une forme de pollution : des collègues, des enseignants, des étudiants peuvent sans le savoir se fonder sur un article problématique pour construire leurs recherches mais après échouer, car c’est une brique très friable. Cela, ça m’agace beaucoup. Guillaume Cabanac, enseignant-chercheur en informatique, a co-développé un logiciel « Problematic Paper Screener » qui permet d’identifier les articles frauduleux publiés dans les revues scientifiques. En 2021, 3 articles sur 10 000 se sont révélés non fiables. Problematic Paper Screener est un logiciel que j’ai développé, qui permet de passer au peigne fin la littérature scientifique. Tous les soirs dans mon labo, le programme tourne pour identifier des problèmes dans des articles, et trouver ceux qui ne sont pas fiables. On utilise un moteur de recherche qui prend en compte l’ensemble des articles publiés dans des revues scientifiques. Le but : trouver des empreintes, on appelle ça « finger print », qui indiquent des articles suspects. Ce sont des traces linguistiques, des phrases torturées selon le terme qu’on a utilisé, qui indiquent qu’une manipulation a été effectuée par un fraudeur. Basiquement, dans l’article, on trouve des parties qui ont été volées dans d’autres articles légitimes et fiables. Et le vol a été commis en faisant un « copier », « paraphraser, « coller », la paraphrase se faisant avec des synonymes : au lieu d’utiliser « intelligence artificielle » on trouve « conscience contrefaite ». Ou « péril de la poitrine » au lieu de « cancer du sein ». Les personnes qui ont volé le texte ne se sont même pas relues, après l'utilisation du logiciel de paraphrase, et l’article qui a été soumis a été accepté avec ces phrases qui n’ont pas de sens en science. L’article est défaillant sur le plan linguistique mais aussi sur le plan de la science. Et pourtant, cet article est publié. Il peut être lu par des étudiants, des enseignants-chercheurs ; il peut être utilisé par des IA pour créer des synthèses de la littérature. Donc il est capital d’éradiquer, de dépolluer la littérature, et de rétracter ces articles indument publiés. Guillaume est un activiste, militant d’une recherche sobre et interdisciplinaire. Lui-même utilise ses compétences en informatique, et son appétence pour les sciences humaines, pour étudier ce monde fascinant de la science, de la recherche. Et il se base sur un texte fondateur, celui d’un sociologue américain, Robert Merton, écrit en 1942. Il présente les 4 valeurs fondamentales pour faire une science valide : la mise en commun, l’universalisme, le désintéressement et le scepticisme organisé. 2 piliers sont mis à mal aujourd’hui : le désintéressement car des personnes malveillantes cherchent à faire accepter des articles qui contiennent des fraudes, pour leur propre promotion. Et le 2e pilier mis à mal est le scepticisme organisé, qui indique que les scientifiques doivent avant tout douter d’une nouvelle recherche avant de l’accepter. Et ce doute là, le scepticisme organisé, s’appelle l’évaluation par les pairs. Moi, je vois cela comme une forme de pollution : des collègues, des enseignants, des étudiants peuvent sans le savoir se fonder sur un article problématique pour construire leurs recherches et après échouer, car c’est une brique très friable. Cela m’agace beaucoup. C’est une forme de perversion. J’ai vraiment du mal à accepter cela. Quand cette recherche d’articles à problème a été médiatisée, il y a eu une réaction à laquelle je ne m’attendais pas, celle de personnes me disant : « tu vois, Guillaume, tu montres que des milliers d’articles contiennent des erreurs. Cela prouve que des articles, publiés par les meilleures maisons d’édition, sont problématiques et non fiables, et donc que l’on peut en conclure qu’il ne faudrait écouter aucun scientifique, que ce sont tous des vendus ! Ma réponse ? Ce sont seulement 3 articles sur 10 000 en 2021. Et qu’au lieu de mettre la poussière sous le tapis, mieux vaut en parler. C’est faire amende honorable et dire que parmi la dizaine de milliers d’articles publiés, certains n’auraient pas dû l’être, on les détecte, et on les rétracte. En 2021, Guillaume a été promu par la prestigieuse revue Nature comme l’un des 10 scientifiques qui ont marqué la science cette année-là. Pour lui, cette distinction, c’est avant tout la légitimité de son travail de dépollueur. Oui, j’en suis fier… mais… voila. Ce n’est pas ce que je veux mettre en avant. Cette reconnaissance de Nature indique que ce projet de recherche, cette quête de la pollution, ce besoin de dépolluer est légitime et peut servir à la société. Cela dit : continue de travailler là-dedans, c'est important, avec tous les collègues, avec tout le collectif. C’est utile !

Réalisation : SapienSapiens

Production : Universcience

Année de production : 2022

Durée : 5min34

Accessibilité : sous-titres anglais, sous-titres français