Enquête

Comment lutter contre la fraude scientifique ?

La fraude scientifique a toujours existé, mais la crise sanitaire a exacerbé ce phénomène en le rendant plus visible. Comment la communauté scientifique se mobilise-t-elle pour y faire face ?

Enquête d’Alexandra Pihen - Publié le 5 juillet 2022

La multiplication des publications durant la crise sanitaire et la pression accrue pesant sur les épaules des chercheurs ont soumis l’intégrité scientifique à rude épreuve et ce faisant, ont révélé l’ampleur et la diversité du phénomène de fraude sous ses différentes formes. Recourant souvent à de nouveaux outils numériques, les scientifiques, les éditeurs et les institutions de recherche contre-attaquent… avec une ingéniosité au moins égale à celle des fraudeurs eux-mêmes !

La fraude scientifique dans tous ses états

De l’erreur méthodologique à la fraude caractérisée, la méconduite scientifique revêt des formes diverses, de gravité variable.

Données dupliquées, textes trompeurs, résultats improbables et au final, conclusions erronées sur les moyens de réduire les risques de fracture osseuse : c’est à une opération de fraude massive que s’est livré entre 1996 et 2013 le médecin japonais Yoshihiro Sato. Non sans conséquences, puisque ses essais cliniques douteux ont nourri durant des années des recommandations médicales. Ils ont aussi fait l’objet d’articles publiés dans des revues internationales, dont une soixantaine d’entre eux « rétractés » depuis, c’est-à-dire invalidés par les éditeurs — un article rétracté restant souvent accessible en ligne… ne serait-ce que pour nourrir les études sur la fraude. Yoshihiro Sato est un exemple emblématique de fraudeur récidiviste, ayant conjugué toutes les formes de méconduite. Quelles sont-elles ? La fraude stricto sensu, tout d’abord, rassemble le plagiat, la fabrication ou la falsification de données de façon intentionnelle. Les pratiques dites contestables, ensuite, consistent à embellir ou dissimuler des données, republier un article, livrer des citations ou références erronées, s’attribuer à tort la paternité de travaux — à l’instar du directeur de département noté comme co-auteur d’un article sur la seule base de son statut hiérarchique. Enfin, la « mauvaise science », ou science de mauvaise qualité, est le plus souvent involontaire. Due à des erreurs méthodologiques ou des données mal interprétées, elle serait toutefois minoritaire parmi les motifs de rétractations d’articles. Évaluées au cas par cas, les méconduites entraînent corrections ou rétractations d’articles, voire sanctions disciplinaires, selon leur gravité. Quant aux fraudes, assimilées à la contrefaçon, elles peuvent conduire leurs responsables devant les tribunaux.

Image légendée — © Elisabeth Bik / twitter.co

Des images trafiquées

Pionnière en matière de traque à la fraude, la microbiologiste néerlandaise Elisabeth Bik a quitté ses fonctions de chercheuse pour se consacrer à sa nouvelle tâche : veiller à l’intégrité scientifique en se concentrant sur les manipulations d’images. En 2016, elle montre que 2 % environ des 20 000 articles publiés dans la revue mBio contiennent des images délibérément trafiquées — certaines parties étant parfois dupliquées, comme le montrent, ici, les rectangles de même couleur. Durant la crise sanitaire, elle révèle aussi des problèmes de méthodologie ou de manipulation de données dans des dizaines de publications du microbiologiste marseillais Didier Raoult et de ses équipes.

Les chercheurs mobilisés

La recrudescence apparente de fraudes révèle surtout la meilleure vigilance de la communauté scientifique envers elle-même.

Cent millions d’heures ! C’est le cumul du temps consacré par les chercheurs aux travaux « d’évaluation par les pairs », ou peer review, en 2020, l’équivalent de 15 000 ans de travail bénévole. Avant chaque publication, trois chercheurs sont sollicités par les éditeurs pour relire les travaux de leurs confrères : une étape fondamentale de validation. Certains chercheurs estiment que les carrières valorisent trop peu le peer review, mais d’autres y voient un pilier de la production scientifique, le temps investi à lire le travail des autres étant « compensé » par la relecture de leurs propres travaux. Mieux : des chercheurs consacrent une partie de leur temps libre à la lutte contre la fraude ; certains de ces « détectives » concevant même des outils ad hoc, à l’image du Problematic Paper Screener français.

Dans ce panorama des chercheurs engagés, le site PubPeer occupe une place particulière. Créé en 2012 par le neuroscientifique américain Brandon Stell, chercheur au CNRS, et administré conjointement avec Boris Barbour, neurobiologiste au CNRS, PubPeer se présente comme un forum de commentaires scientifiques sur des articles publiés. Il permet de soulever de manière anonyme des questions d’éthique, de déontologie et d’intégrité scientifiques, entraînant, le cas échéant, corrections ou rétractations d’articles. De quoi recruter des lanceurs d’alerte dans tous les domaines ! La base de données Retraction Watch, fondée en 2010 par deux journalistes spécialisés en santé, Ivan Oransky et Adam Marcus, constitue quant à elle la référence en matière de comptabilité des articles rétractés. De plus en plus alimentée par les acteurs de la recherche, la liste totale des rétractations a presque doublé depuis 2018 pour atteindre 32 000 fin 2021.

Des séquences d’ADN détournées

Les manipulations des gènes sont plus difficiles à identifier que celles des images. Mais dès 2016, Jennifer Anne Byrne, professeure d’oncologie moléculaire à l’université de Sydney, suspectait le caractère extravagant des propriétés de séquences génétiques dans certaines publications. Vérification faite à l’aide d’une base de données mondiale, son intuition se révèle juste : plus de 700 articles sur le cancer publiés entre 2014 et 2018 présentent des erreurs de séquences génétiques. Ils ont pourtant été cités plus de 17 000 fois ! Or un quart de ces articles problématiques peut induire en erreur le développement de thérapies pour l’Homme…

En France, un dispositif institutionnel récent

La France a récemment donné à l’intégrité une définition juridique nationale et imposé le signalement des fraudes pour suivre le phénomène.

Si elle relevait jusqu’ici de « bonnes pratiques » laissées à l’appréciation de chaque établissement, l’intégrité scientifique devient aujourd’hui, en France, une notion juridique. La loi de programmation de la recherche (LPR) de décembre 2020 l’ayant inscrite dans le code de la recherche, le décret du 3 décembre 2021 fixe des obligations claires aux organismes publics et fondations ayant pour activité principale la recherche publique. Parmi elles, la nomination d’un référent à l’intégrité scientifique (« RIS ») par établissement figure en première place. Si presque toutes les institutions de recherche possèdent aujourd’hui leur RIS, elles n’étaient que quatre en 2018. Leur rôle : participer à la définition des politiques d’intégrité scientifique, coordonner les actions de sensibilisation et de formation, instruire les dossiers relatifs aux manquements, les transmettre au chef d’établissement… Autre nouveauté, destinée à améliorer les connaissances encore lacunaires en matière de fraude : tous les deux ans, chaque établissement doit communiquer les données récoltées en matière d’intégrité scientifique (signalements, instructions, sanctions…) au ministre chargé de la recherche et à l’Office français de l’intégrité scientifique (OFIS). Créé en 2017, l’OFIS joue également le rôle d’observatoire national en tenant à jour l’annuaire des RIS. Il offre aussi des ressources et un accompagnement aux acteurs de l’intégrité scientifique tout en conduisant des travaux de prospective. Les problèmes d’intégrité scientifique quittent ainsi le cadre strict des établissements pour revêtir une dimension nationale.

L’intégrité scientifique à l’épreuve de la pandémie

Entre nécessité d’informer et garantie de qualité, la recherche a été directement confrontée aux décideurs et aux médias durant la crise sanitaire.

En pleine crise sanitaire, difficile de trouver le bon équilibre entre un accès rapide aux nouveaux résultats scientifiques et le risque de décisions cliniques discutables, car basées sur des articles erronés. Entre ces deux exigences, les fraudes scientifiques ont-elles augmenté durant la pandémie de SARS-CoV-2 ? Pour l’Office français de l’intégrité scientifique (OFIS), trancher est prématuré : les articles ont peut-être été davantage étudiés, et donc filtrés, que d’habitude. A contrario, pendant cette période, les travaux, solides ou malhonnêtes, ont été menés et partagés à un rythme sans précédent. À telle enseigne d’ailleurs que des articles déposés sur des sites de prépublications (c’est-à-dire, avant l’acceptation par le comité de rédaction d’une revue) ont été dévoilés de façon prématurée au grand public par des communicants ou journalistes friands d’actualité ; ainsi, près de 4 000 articles sur la Covid-19 ont été prépubliés sur le seul site medRxiv en juin 2020. Quant aux éditeurs de presse scientifique, ils ont dû assouplir leurs processus d’évaluation de manuscrits pour faire face à l’urgence et au nombre colossal de soumissions d’articles sur la Covid-19, par exemple en réduisant leurs délais de relecture. De quoi nuire à la qualité du processus… mais, semble-t-il, de manière limitée. Ainsi, près de 230 publications relatives au coronavirus ont été rétractées depuis le début de la pandémie — la plupart en 2021 —, mais elles ne représentent que 7 % des 3 200 rétractations recensées dans la base de données du site Retraction Watch en 2021.

Vaccin et autisme : un cas d’école

En 1998, une étude publiée dans The Lancet établit un lien entre le vaccin rougeole-rubéole-oreillons (RRO) et l’apparition du trouble du spectre autistique chez 12 enfants. En 2010, son premier auteur, le chirurgien britannique Andrew Wakefield (photo), est radié de l’ordre des médecins — et l’article rétracté. En cause : le conflit d’intérêts flagrant d’A. Wakefield, les examens imposés aux enfants sans aucune éthique et la falsification de leurs dossiers hospitaliers. Depuis, de nombreuses études ont prouvé l’absence de lien entre le vaccin RRO et l’autisme. Mais les conclusions frauduleuses de « l’affaire Andrew Wakefield » nourrissent toujours les mouvements antivaccins.

Du côté des éditeurs

En première ligne face à la fraude scientifique, les éditeurs doivent redoubler de vigilance ou envisager de nouveaux moyens d’y faire face.

Les éditeurs jouent un rôle central dans la lutte contre la fraude grâce à la relecture de manuscrits par les pairs, des chercheurs de même discipline. Les plus grandes revues, à l’instar de Nature ou Science, emploient même des salariés afin d’organiser ces relectures. Pour les autres, les sièges d’éditeur sont occupés par des chercheurs en poste. En pratique, l’évaluation des manuscrits présente parfois des lacunes : d’un côté, des chercheurs relecteurs qui délèguent la relecture à leurs subalternes (souvent les doctorants) et de l’autre, des comités de rédaction peu consciencieux. Quant aux revues de la « haute couture », selon l’expression de l’informaticien Guillaume Cabanac, elles ne sont pas infaillibles : plusieurs affaires, en pleine pandémie, ont affecté The New England Journal of Medicine ou The Lancet. Soucieuses de leur image de rigueur scientifique, ces revues rendent publiques ces rétractations d’articles dans leurs colonnes. Par ailleurs, les éditeurs recourent de plus en plus aux outils de lutte ou de recensement de la fraude (PubPeer, Retraction Watch, Problematic Paper Screener…) et pourraient même les intégrer à leurs processus de validation. Enfin, les revues « prédatrices » vendues à prix cassé, dans lesquelles les auteurs paient pour écrire, publient souvent les travaux tels quels, fraudes et/ou erreurs incluses. La liste dressée par le bibliothécaire américain Jeffrey Beall, clôturée en 2016 sous la pression de ces éditeurs malhonnêtes, en répertoriait plus de 900. Elles sont aujourd’hui sans doute plus d’un millier, un chiffre à comparer aux quelque 25 000 titres de revues scientifiques répertoriés sur le site Scopus (toutes relues par des pairs, celles-ci).

Des phrases torturées

« Détecteur de mensonges » : tel est le surnom donné au Toulousain Guillaume Cabanac par la revue Nature, qui l’a mis à l’honneur en 2021. Certains fraudeurs pillant des articles pour en fabriquer de faux à l’aide de logiciels dédiés de création de « paraphrases », cet informaticien a conçu un logiciel capable de détecter ces « phrases torturées ». Résultat, 3 papiers sur 10 000 contenaient des « phrases torturées » en 2021 — soit un total de 1 500 pour 2021 contre 416 en 2018. Elsevier, Springer Nature, Wileys… les éditeurs les plus prestigieux ne sont pas épargnés.

De nouveaux outils contre la fraude

Des algorithmes sont capables de générer automatiquement des articles… et d’autres de les identifier dans la presse scientifique.

Connaissez-vous Ike Antkare (prononcer I can’t care) ? C’est le nom d’un chercheur fictif créé par l’informaticien grenoblois Cyril Labbé en 2011, afin d’alerter sur la banalité des faux articles. En quelques mois, cet avatar est devenu l’un des scientifiques les plus cités au monde — devant Albert Einstein ou Alan Turing. Son secret ? De nombreux faux articles scientifiques produits à l’aide d’un algorithme de traitement du langage (SCIgen) développé par des étudiants du MIT* en 2005, puis leur référencement systématique par le moteur de recherche de publications Google Scholar. Générés automatiquement, ces textes sont lisibles, irréprochables du point de vue grammatical, mais dépourvus de sens, à l’image de ce titre énigmatique : « Recherche sur les changements atmosphériques côtiers et les performances des danses latines, basée sur un réseau de détection de cibles ». Ils sont pourtant publiés — et souvent vendus — par des éditeurs scientifiques peu regardants. Pour les détecter rapidement, Cyril Labbé a conçu SCIgen detection, un programme capable de décortiquer la littérature scientifique à la recherche de ce type d’articles. En collaboration avec l’informaticien français Guillaume Cabanac et le mathématicien russe Alexander Magazinov, il a également développé le logiciel Problematic Paper Screener (« radar à papiers problématiques ») qui permet d’identifier et de signaler les articles frauduleux générés par des algorithmes. Sur ce radar, 2 482 papiers étaient recensés comme « problématiques » en 2021. Étant donné les progrès réalisés ces dernières années en traitement automatique des langues et plus largement, en intelligence artificielle, ce phénomène risque de s’amplifier.

* Massachusetts Institute of Technology

L’affaire The Lancet

Le 22 mai 2020, un article de la célèbre revue britanniqueThe Lancet montre que le recours à l’hydroxychloroquine aggraverait la mortalité des patients hospitalisés pour Covid-19. En France, seize essais cliniques sont immédiatement suspendus par l’Agence nationale de sécurité des médicaments (ANSM). Moins d’un mois plus tard, la publication est officiellement rétractée par The Lancet. En cause, non pas la conclusion — l’inefficacité de ce traitement sera d’ailleurs prouvée par la suite — mais une faille méthodologique : les données utilisées pour les travaux, fournies par Surgisphere, une société spécialisée dans l’analyse de données de santé anonymisées, s’avèrent corrompues.

La science ouverte, antidote anti-fraude ?

Le libre accès aux publications scientifiques pourrait permettre de débusquer plus aisément fraudes et erreurs.

Nombreux sont les scientifiques à prôner une science ouverte (open science), c’est-à-dire offrant aux chercheurs et aux citoyens l’accès gratuit aux publications. De façon générale, la science ouverte est soutenue par le ministère de la recherche qui promeut le libre accès aux travaux financés par des fonds publics sur les sites des éditeurs ou à l’aide d’archives ouvertes publiques comme HAL. Depuis 2018, le taux de publications scientifiques en accès ouvert est ainsi passé de 41 à 56 %, l’objectif de 100 % étant fixé pour 2030. Dans un même objectif de transparence et reproductibilité des travaux, gages de fiabilité, le ministère a publié en mars 2022 un guide à destination des chercheurs pour le partage des données sources associées aux publications. Les éditeurs, eux aussi, ouvrent de plus en plus le processus de relecture par les pairs (open peer review) : ils proposent de publier, avec l’article, les commentaires des relecteurs et les réponses des chercheurs. Parfois avec succès : les auteurs de Nature Communications, qui offre cette possibilité depuis 2016, adoptent l’open peer review à 60 %. À ce titre, la crise sanitaire peut être considérée comme un test grandeur nature : l’ouverture des travaux scientifiques au grand public s’est accélérée tant sur les sites de prépublications que sur ceux d’éditeurs payants soucieux de transmettre rapidement les informations. Évaluation des chercheurs et des établissements, baisse de la quantité au profit de la qualité, économie des revues en accès ouvert… pour stabiliser les fondements de la science ouverte, c’est tout un modèle de culture scientifique qui doit poursuivre sa métamorphose.

Interviews