MolSafeEval представляет бенчмарк для оценки рисков безопасности в молекулах, сгенерированных ИИ

Исследователи представляют MolSafeEval, бенчмарк, предназначенный для оценки рисков безопасности молекул, сгенерированных ИИ, устраняя пробел, где текущие бенчмарки упускают из виду потенциальные опасности, такие как токсичность и реактивность. Система интегрирует разнородные знания о безопасности из токсикологических баз данных и правил опасности в структурированный граф знаний о безопасности молекул для обеспечения систематического обнаружения и объяснения небезопасных характеристик с помощью рассуждений больших языковых моделей.

MolSafeEval классифицирует модели генерации молекул на четыре типа задач: безусловная генерация, оптимизация свойств, дизайн на основе целевого белка и генерация на основе текста.
Бенчмарк предоставляет стандартизированные наборы данных и протоколы оценки безопасности для каждой из этих репрезентативных категорий задач.
Он использует структурированный граф знаний для выявления уязвимостей безопасности, которые часто упускают узкоспециализированные предикторы токсичности.

MolSafeEval предлагает новый взгляд на бенчмаркинг молекулярных моделей и предоставляет необходимое руководство к более безопасному и надежному дизайну молекул, систематически выявляя уязвимости безопасности текущих генеративных подходов.