La tubería de LLM multiagente amplía la taxonomía de clasificación de reacciones de 68 a 14.073 clases

Los investigadores presentan una tubería completamente automatizada que utiliza un marco multiagente de modelos de lenguaje grandes para clasificar reacciones y generar reglas en 665.901 reacciones de patentes de EE. UU. Este enfoque amplía una taxonomía estándar de 68 a 14.073 clases sin curación humana mediante la verificación de cada regla contra el corpus en un bucle de verificación.

El sistema genera reglas de reacción bajo un bucle de verificación que las prueba contra el corpus de 665.901 reacciones de patentes de EE. UU.
Amplía la taxonomía estándar de 68 a 14.073 clases sin curación humana.
Un clasificador de huellas dactilares ligero alcanza una precisión del 97,7% en reacciones no vistas, igualando a un clasificador propietario líder mientras resuelve la química con mayor finura.

El resultado es una base de datos de reactividad viva y una ruta general para convertir modelos generativos en sistemas simbólicos confiables y autoexpandibles.