IAjeudi 16 avril 2026·Ars Technica

OpenAI lance GPT-Rosalind : un modèle d'IA dédié à la révolutionner la biologie moléculaire

OpenAI franchit une nouvelle étape dans la spécialisation de ses modèles avec GPT-Rosalind, une intelligence artificielle conçue exclusivement pour la recherche en biologie. Nommé en hommage à la pionnière de l'ADN Rosalind Franklin, ce modèle vise à transformer la découverte de médicaments et la compréhension des mécanismes cellulaires.

Une IA au service du vivant

OpenAI vient de lever le voile sur **GPT-Rosalind**, un modèle de langage à grande échelle (LLM) qui délaisse la culture générale pour se plonger dans les profondeurs de la biologie. Contrairement aux modèles scientifiques précédents, souvent généralistes, GPT-Rosalind a été spécifiquement affiné pour maîtriser les protocoles de recherche et la compréhension des mécanismes moléculaires.

Selon Yunyun Wang, responsable produit Sciences de la Vie chez OpenAI, ce modèle s'attaque à deux défis majeurs. D'une part, l'explosion massive des données de séquençage génomique et de biochimie des protéines, devenue impossible à traiter par un cerveau humain seul. D'autre part, la fragmentation extrême des sous-domaines de la biologie, où le jargon d'un généticien peut devenir incompréhensible pour un neuroscientifique. GPT-Rosalind agit ici comme un pont, capable de synthétiser des connaissances transdisciplinaires.

Connexion entre génotype et phénotype

L'entraînement de GPT-Rosalind n'a pas été de tout repos : il a été formé sur 50 flux de travail cruciaux et a appris à naviguer de manière autonome dans les plus grandes bases de données biologiques publiques. L'objectif est clair : suggérer des voies biologiques probables et hiérarchiser les cibles potentielles pour de nouveaux médicaments.

« Nous connectons le génotype au phénotype via des mécanismes de régulation connus », explique Wang. Le modèle est capable d'inférer les propriétés structurelles ou fonctionnelles des protéines, offrant ainsi une compréhension mécanique du vivant que les LLM classiques ne peuvent qu'effleurer.

Le défi de la fiabilité et de la sécurité

Conscient de la tendance des IA à l'excès d'enthousiasme (la "sycophantie"), OpenAI affirme avoir injecté une dose de scepticisme dans le modèle. GPT-Rosalind est conçu pour être critique : il est désormais plus susceptible d'indiquer à un chercheur qu'une cible thérapeutique semble être une mauvaise piste.

Cependant, la question des hallucinations persiste. Si OpenAI vante les capacités de raisonnement "expert" de son modèle sur certains benchmarks, il reste à voir si le système évitera les erreurs factuelles grotesques qui peuvent survenir lors du décryptage de chaînes d'étapes complexes.

Enfin, la puissance de l'outil impose une prudence extrême. OpenAI limite l'accès à GPT-Rosalind aux entités basées aux États-Unis via une structure de déploiement sécurisée ("trusted access"). La crainte principale ? Que l'IA ne soit détournée pour optimiser l'infectiosité d'un virus ou créer des agents pathogènes. Pour le reste de la communauté, un plugin de recherche plus limité sera prochainement disponible.

Points clés à retenir

GPT-Rosalind est entraîné sur 50 flux de travail biologiques et les bases de données publiques majeures.
Le modèle a été 'réglé' pour être sceptique afin d'éviter de valider de fausses pistes thérapeutiques.
L'accès est restreint aux entités américaines de confiance pour prévenir les risques de biosécurité.
Un plugin 'Life Sciences Research' sera plus largement accessible au grand public.