Los investigadores presentan MolSafeEval, un benchmark diseñado para evaluar los riesgos de seguridad de las moléculas generadas por IA, abordando la brecha donde los benchmarks actuales pasan por alto peligros potenciales como la toxicidad y la reactividad. El sistema integra conocimientos de seguridad heterogéneos de bases de datos toxicológicas y reglas de peligro en un grafo de conocimiento estructurado de seguridad molecular para permitir la detección y explicación sistemática de características inseguras mediante el razonamiento de grandes modelos de lenguaje.
- MolSafeEval categoriza los modelos generativos moleculares en cuatro tipos de tareas: generación incondicional, optimización de propiedades, diseño basado en proteínas objetivo y generación basada en texto.
- El benchmark proporciona conjuntos de datos estandarizados y protocolos de evaluación de seguridad para cada una de estas categorías de tareas representativas.
- Utiliza un grafo de conocimiento estructurado para descubrir vulnerabilidades de seguridad que los predictores de toxicidad estrechos a menudo pasan por alto.
MolSafeEval ofrece una nueva perspectiva para la evaluación de modelos moleculares y proporciona orientación esencial hacia un diseño molecular más seguro y confiable, revelando sistemáticamente las vulnerabilidades de seguridad de los enfoques generativos actuales.