
Un ensemble d’assistants fondés sur l’IA a montré une capacité à accomplir des tâches de « drug-retargeting », c’est-à-dire à repérer des médicaments potentiellement réutilisables contre des maladies. Dans le cas étudié ici, l’objectif portait sur la dégénérescence maculaire, avec une approche combinant formulation d’hypothèses biologiques, propositions expérimentales et évaluation des candidats à partir de données et de critères définis par des chercheurs.
De l’hypothèse biologique à un plan d’essais
Le système baptisé « Robin » a d’abord exploité des résumés pour construire plusieurs hypothèses sur les mécanismes susceptibles d’expliquer la dégénérescence maculaire. À partir de ces pistes, il a produit un rapport structuré, décrivant les éléments disponibles en faveur de chaque mécanisme et les limites associées.
Ensuite, un « juge » basé sur un modèle de langage a comparé ces hypothèses deux à deux afin d’établir des classements relatifs, à la manière d’un tournoi. Cette étape a permis de hiérarchiser les scénarios biologiques et d’orienter les recherches vers ceux jugés les plus prometteurs.
Choisir des modèles cellulaires et des médicaments candidats
Le dispositif a ensuite été réutilisé pour proposer des lignées cellulaires et des conditions de culture susceptibles de reproduire les mécanismes retenus. À partir de là, il a généré des rapports pour environ 30 médicaments candidats. D’après l’équipe « FutureHouse », chaque proposition contenait à la fois une justification du lien entre le médicament et le mécanisme ciblé dans le modèle « in vitro », ainsi que des limites potentielles.
Ces rapports n’ont pas été considérés comme suffisants à eux seuls : des experts humains ont évalué les recommandations afin de décider quels tests poursuivre. Le système a également suggéré des essais (assays) pour vérifier l’effet des molécules, les humains validant, ajustant ou reprenant le cas échéant des variantes de ces propositions.
L’intérêt d’un outil capable d’exploiter certains types de données
La différence mise en avant par l’équipe concerne l’assistant « Robin », qui intègre un outil supplémentaire appelé « Finch ». Celui-ci est conçu pour automatiser l’évaluation de résultats provenant de certains criblages biologiques standard, comme la cytométrie en flux et l’analyse d’expression génique par RNA-seq. Autrement dit, lorsque les expérimentations impliquent des formats de données pris en charge par Finch, une étape d’analyse supplémentaire peut être réalisée par le système.
Une hypothèse ciblée et des résultats à valider
Robin a également proposé une hypothèse originale : renforcer la capacité des cellules rétiniennes à capter des débris situés en dehors des cellules pourrait apporter une forme de protection contre la maladie. Dans les expériences proposées, le système a identifié au moins un médicament susceptible d’améliorer ce mécanisme, mais la validation finale dépendait des essais retenus par les chercheurs.
Vérifier la robustesse des références et limiter les « hallucinations »
Le travail souligne aussi l’importance d’outils spécifiquement conçus pour interagir avec la littérature scientifique. Le remplacement d’un module (« Crow ») par un outil lié à OpenAI a augmenté fortement la proportion de références « inventées » ou non fiables, passant de l’absence d’erreurs à un niveau substantiel. Par ailleurs, lorsque des médicaments étaient suggérés par un système mais pas par Robin, ils échouaient systématiquement à produire un effet dans les tests sur les cellules, ce qui suggère que l’alignement du système avec le cadre expérimental comptait pour la pertinence des résultats.
Repères pratiques : comment se préparer à ce type d’exploitation des données
Dans un environnement de recherche, l’activation de pipelines analytiques dépend souvent des outils et formats de données utilisés en laboratoire. Pour des équipes qui traitent des données de type expression génique, des solutions de stockage et de traitement adaptées peuvent faciliter l’exploitation des résultats, par exemple via des ordinateurs conçus pour la manipulation de gros volumes de données, comme un ordinateur portable de type workstation avec 16 Go de RAM pour des analyses locales.
Pour la manipulation et l’export de résultats de criblage ou de jeux de données, certains chercheurs privilégient aussi des périphériques fiables de stockage à accès rapide, par exemple un SSD externe 1 To en USB-C afin de gérer les exports liés aux workflows d’analyse.

