Les chercheurs présentent MolSafeEval, un benchmark conçu pour évaluer les risques de sécurité des molécules générées par l'IA, comblant ainsi le manque actuel où les benchmarks négligent les dangers potentiels tels que la toxicité et la réactivité. Le système intègre des connaissances de sécurité hétérogènes provenant de bases de données toxicologiques et de règles de danger dans un graphe de connaissances de sécurité moléculaire structuré, permettant une détection systématique et une explication des caractéristiques non sûres via le raisonnement de grands modèles linguistiques.

  • MolSafeEval classe les modèles génératifs moléculaires en quatre types de tâches : génération inconditionnelle, optimisation de propriétés, conception basée sur la protéine cible et génération basée sur le texte.
  • Le benchmark fournit des jeux de données standardisés et des protocoles d'évaluation de sécurité pour chacune de ces catégories de tâches représentatives.
  • Il utilise un graphe de connaissances structuré pour révéler les vulnérabilités de sécurité que les prédicteurs de toxicité souvent étroits manquent fréquemment.

MolSafeEval offre un nouveau point de vue pour l'évaluation des modèles moléculaires et fournit une orientation essentielle vers une conception moléculaire plus sûre et plus fiable en révélant systématiquement les vulnérabilités de sécurité des approches génératives actuelles.