マルチエージェントLLMパイプラインが反応分類の階層を68から14,073クラスに拡張

研究者らは、大規模言語モデルのマルチエージェント・フレームワークを用いた完全自動化のパイプラインを発表し、665,901件の米国特許反応に対する反応の分類とルールの生成を行った。この手法は、検証ループ内で各ルールをコーパスに対してテストすることで、人間のキュレーションなしに標準的な階層を68から14,073クラスに拡張する。

システムは検証ループの下で反応ルールを生成し、それらを665,901件の米国特許反応のコーパスに対してテストする。
人間のキュレーションなしに標準的な階層を68から14,073クラスに拡張する。
軽量なフィンガープリント分類器は、未見の反応において97.7%の精度を達成し、主要なプロプライエタリな分類器と同等の性能を示しつつ、化学構造をより細かく解決している。

この結果は、生きた反応性データベースと、生成モデルを信頼できる自己拡張型の記号的システムに変換するための一般的な道筋をもたらす。