Исследователи представляют полностью автоматизированный конвейер, использующий многоагентную архитектуру больших языковых моделей для классификации реакций и генерации правил на основе 665 901 патентной реакции США. Этот подход расширяет стандартную таксономию с 68 до 14 073 классов без участия человека за счёт проверки каждого правила в цикле верификации по корпусу.
- Система генерирует правила реакций в рамках цикла верификации, проверяя их на корпусе из 665 901 патентной реакции США.
- Она расширяет стандартную таксономию с 68 до 14 073 классов без ручной куриации.
- Лёгкий классификатор отпечатков достигает точности 97,7% на невидимых ранее реакциях, сопоставляясь с ведущим проприетарным классификатором и обеспечивая более тонкое разрешение химических различий.
Результатом является живая база данных реактивности и общий путь превращения генеративных моделей в надёжные, само расширяющиеся символические системы.