Исследователи представляют полностью автоматизированный конвейер, использующий многоагентную архитектуру больших языковых моделей для классификации реакций и генерации правил на основе 665 901 патентной реакции США. Этот подход расширяет стандартную таксономию с 68 до 14 073 классов без участия человека за счёт проверки каждого правила в цикле верификации по корпусу.

  • Система генерирует правила реакций в рамках цикла верификации, проверяя их на корпусе из 665 901 патентной реакции США.
  • Она расширяет стандартную таксономию с 68 до 14 073 классов без ручной куриации.
  • Лёгкий классификатор отпечатков достигает точности 97,7% на невидимых ранее реакциях, сопоставляясь с ведущим проприетарным классификатором и обеспечивая более тонкое разрешение химических различий.

Результатом является живая база данных реактивности и общий путь превращения генеративных моделей в надёжные, само расширяющиеся символические системы.