Исследователи представляют MolSafeEval, бенчмарк, предназначенный для оценки рисков безопасности молекул, сгенерированных ИИ, устраняя пробел, где текущие бенчмарки упускают из виду потенциальные опасности, такие как токсичность и реактивность. Система интегрирует разнородные знания о безопасности из токсикологических баз данных и правил опасности в структурированный граф знаний о безопасности молекул для обеспечения систематического обнаружения и объяснения небезопасных характеристик с помощью рассуждений больших языковых моделей.
- MolSafeEval классифицирует модели генерации молекул на четыре типа задач: безусловная генерация, оптимизация свойств, дизайн на основе целевого белка и генерация на основе текста.
- Бенчмарк предоставляет стандартизированные наборы данных и протоколы оценки безопасности для каждой из этих репрезентативных категорий задач.
- Он использует структурированный граф знаний для выявления уязвимостей безопасности, которые часто упускают узкоспециализированные предикторы токсичности.
MolSafeEval предлагает новый взгляд на бенчмаркинг молекулярных моделей и предоставляет необходимое руководство к более безопасному и надежному дизайну молекул, систематически выявляя уязвимости безопасности текущих генеративных подходов.