Les modèles de langage à passage de messages permettent un raisonnement efficace via la communication directe entre threads

Les chercheurs présentent les Modèles de Langage à Passage de Messages (MPLMs), un cadre permettant aux threads de grands modèles de langage de communiquer directement à l'aide de primitives d'envoi et de réception légères, répondant ainsi aux limites de scalabilité des paradigmes traditionnels fork-join.

Les MPLMs réduisent les coûts de communication en évitant le partage redondant du contexte et utilisent la préemption pour terminer prématurément les branches peu prometteuses.
Sur les puzzles de Sudoku, les MPLMs nécessitent un contexte asymptotiquement plus petit que les méthodes séquentielles Chain-of-Thought ou parallèles fork-join, permettant à un modèle affiné de résoudre des puzzles 25x25 qui défient les approches standard.
Dans les tâches 3-SAT, la capacité de préemption améliore l'efficacité en terminant prématurément les branches peu prometteuses.
Les grands modèles pré-entraînés correctement invités peuvent suivre le protocole MPLM, atteignant des résultats compétitifs sur la réponse aux questions à contexte long par rapport aux approches fork-join populaires.

Ce cadre offre un mécanisme de mise à l'échelle plus efficace pour le raisonnement des LLM en permettant une communication inter-thread directe et une terminaison précoce basée sur les informations des pairs.