Obtenir une pause d’un an des soumissions en réponse à l’« IA-slop » généré sur arXiv



L’« AI-generated slop », ces contenus produits automatiquement et sans véritable valeur scientifique, a déjà fait son apparition dans des travaux présentés ou publiés. Face à ce phénomène, certains acteurs de la publication scientifique cherchent à agir plus tôt, avant même l’étape du peer review. Une sanction ambitieuse est désormais annoncée pour les dépôts jugés inappropriés sur le serveur de prépublications arXiv.

Une règle visant les dépôts problématiques sur arXiv

Selon une annonce relayée dans un échange public, arXiv mettra en place des mesures contre les soumissions considérées comme « inappropriées » lorsqu’elles proviennent de contenus générés par des systèmes d’intelligence artificielle et qu’elles ne respectent pas les standards attendus. La réponse prévue comprend une interdiction d’un an et, pour les futures publications sur la plateforme, une exigence durable : les textes devront être soumis à un examen par les pairs avant qu’arXiv les héberge.

Des standards de “communication savante” déjà invoqués

La logique de cette mesure s’appuie sur les règles existantes de modération, qui insistent sur la qualité et la rigueur des éléments fournis. Les dépôts doivent notamment présenter des sections, des figures, des tableaux et des références préparés avec soin. L’objectif est d’éviter que la forme du travail (et sa cohérence) soit réduite à une simple production automatique.

En pratique, l’enjeu n’est pas seulement de limiter les erreurs factuelles. Il s’agit aussi de détecter des cas où le contenu manque de préparation éditoriale : citations douteuses, réponses de prompts non retravaillées, schémas ou diagrammes sans signification claire, et plus largement tout matériau qui détourne les objectifs d’une prépublication.

Quelles conséquences pour l’écosystème des prépublications ?

Si la mesure est appliquée avec constance, elle pourrait agir comme un signal dissuasif pour les soumissions bâclées, y compris celles présentées avec des intentions ambigües. Elle soulève toutefois une question délicate : où placer la frontière entre assistance raisonnable à l’écriture et production “à la chaîne” destinée uniquement à remplir un calendrier de publication.

À court terme, les auteurs devront probablement accroître leur relecture et leur vérification des éléments techniques, en particulier les figures, les références et la cohérence globale du manuscrit. À plus long terme, la pression pourrait s’étendre à d’autres plateformes, notamment celles qui servent de vitrine rapide avant la publication finale.

Un besoin accru de vérification et d’assurance qualité

Dans un contexte où des contenus générés par IA peuvent passer des contrôles sommaires, la fiabilité repose davantage sur les processus de vérification. Beaucoup d’équipes renforcent déjà leurs habitudes : relecture attentive, validation des citations, cohérence méthodologique et contrôle des éléments visuels.

Pour soutenir ce travail, certains se tournent vers des outils de relecture et d’organisation, comme un gestionnaire de références afin de réduire les erreurs de bibliographie, ou vers un outil de numérisation avec OCR pour vérifier rapidement des sources et des éléments insérés dans les figures.