研究人员提出了一种完全自动化的流水线,利用大型语言模型的多智能体框架对 665,901 项美国专利反应进行分类并生成规则。该方法通过在验证循环中将每条规则与语料库进行比对,无需人工策展即可将标准分类体系从 68 类扩展至 14,073 类。
- 该系统在验证循环中生成反应规则,并在 665,901 项美国专利反应的语料库上进行测试。
- 它在不进行人工策展的情况下,将标准分类体系从 68 类扩展至 14,073 类。
- 轻量级指纹分类器在未见过反应上的准确率达到 97.7%,与领先的专有分类器持平,同时实现了更精细的化学解析。
结果是一个动态的反应性数据库,以及将生成式模型转化为可靠、自扩展符号系统的一般途径。