Los Modelos de Lenguaje con Paso de Mensajes permiten un razonamiento eficiente mediante comunicación directa entre hilos

Los investigadores presentan los Modelos de Lenguaje con Paso de Mensajes (MPLMs), un marco que permite a los hilos de modelos de lenguaje grandes comunicarse directamente usando primitivas ligeras de envío y recepción, abordando los límites de escalabilidad de los paradigmas tradicionales fork-join.

Los MPLMs reducen los costos de comunicación evitando el intercambio redundante de contexto y utilizan la preempción para terminar ramas poco prometedoras temprano.
En acertijos de Sudoku, los MPLMs requieren un contexto asintóticamente menor que el Chain-of-Thought serial o los métodos fork-join paralelos, permitiendo que un modelo afinado resuelva acertijos de 25x25 que desafían a los enfoques estándar.
En tareas 3-SAT, la capacidad de preempción mejora la eficiencia al terminar ramas poco prometedoras.
Los modelos grandes previamente entrenados, adecuadamente instruccionados, pueden seguir el protocolo MPLM, logrando resultados competitivos en preguntas de contexto largo en comparación con los enfoques fork-join populares.

Este marco ofrece un mecanismo de escalado más eficiente para el razonamiento de LLM al permitir la comunicación directa entre hilos y la terminación temprana basada en información de pares.