Исследователи представляют MolSafeEval, бенчмарк, предназначенный для оценки рисков безопасности молекул, сгенерированных ИИ, устраняя пробел, где текущие бенчмарки упускают из виду потенциальные опасности, такие как токсичность и реактивность. Система интегрирует разнородные знания о безопасности из токсикологических баз данных и правил опасности в структурированный граф знаний о безопасности молекул для обеспечения систематического обнаружения и объяснения небезопасных характеристик с помощью рассуждений больших языковых моделей.

  • MolSafeEval классифицирует модели генерации молекул на четыре типа задач: безусловная генерация, оптимизация свойств, дизайн на основе целевого белка и генерация на основе текста.
  • Бенчмарк предоставляет стандартизированные наборы данных и протоколы оценки безопасности для каждой из этих репрезентативных категорий задач.
  • Он использует структурированный граф знаний для выявления уязвимостей безопасности, которые часто упускают узкоспециализированные предикторы токсичности.

MolSafeEval предлагает новый взгляд на бенчмаркинг молекулярных моделей и предоставляет необходимое руководство к более безопасному и надежному дизайну молекул, систематически выявляя уязвимости безопасности текущих генеративных подходов.