Les chercheurs présentent un pipeline entièrement automatisé utilisant un cadre multi-agents de grands modèles de langage pour classifier les réactions et générer des règles sur 665 901 réactions de brevets américains. Cette approche élargit une taxonomie standard de 68 à 14 073 classes sans curation humaine en testant chaque règle contre le corpus dans une boucle de vérification.
- Le système génère des règles de réaction sous une boucle de vérification qui les teste contre le corpus de 665 901 réactions de brevets américains.
- Il élargit la taxonomie standard de 68 à 14 073 classes sans curation humaine.
- Un classificateur d'empreinte numérique léger atteint une précision de 97,7 % sur des réactions non vues, égalant un classificateur propriétaire de pointe tout en résolvant la chimie plus finement.
Le résultat est une base de données de réactivité vivante et une voie générale pour transformer les modèles génératifs en systèmes symboliques fiables et auto-expansifs.