Los investigadores presentan una tubería completamente automatizada que utiliza un marco multiagente de modelos de lenguaje grandes para clasificar reacciones y generar reglas en 665.901 reacciones de patentes de EE. UU. Este enfoque amplía una taxonomía estándar de 68 a 14.073 clases sin curación humana mediante la verificación de cada regla contra el corpus en un bucle de verificación.

  • El sistema genera reglas de reacción bajo un bucle de verificación que las prueba contra el corpus de 665.901 reacciones de patentes de EE. UU.
  • Amplía la taxonomía estándar de 68 a 14.073 clases sin curación humana.
  • Un clasificador de huellas dactilares ligero alcanza una precisión del 97,7% en reacciones no vistas, igualando a un clasificador propietario líder mientras resuelve la química con mayor finura.

El resultado es una base de datos de reactividad viva y una ruta general para convertir modelos generativos en sistemas simbólicos confiables y autoexpandibles.