Los investigadores presentan los Modelos de Lenguaje con Paso de Mensajes (MPLMs), un marco que permite a los hilos de modelos de lenguaje grandes comunicarse directamente usando primitivas ligeras de envío y recepción, abordando los límites de escalabilidad de los paradigmas tradicionales fork-join.

  • Los MPLMs reducen los costos de comunicación evitando el intercambio redundante de contexto y utilizan la preempción para terminar ramas poco prometedoras temprano.
  • En acertijos de Sudoku, los MPLMs requieren un contexto asintóticamente menor que el Chain-of-Thought serial o los métodos fork-join paralelos, permitiendo que un modelo afinado resuelva acertijos de 25x25 que desafían a los enfoques estándar.
  • En tareas 3-SAT, la capacidad de preempción mejora la eficiencia al terminar ramas poco prometedoras.
  • Los modelos grandes previamente entrenados, adecuadamente instruccionados, pueden seguir el protocolo MPLM, logrando resultados competitivos en preguntas de contexto largo en comparación con los enfoques fork-join populares.

Este marco ofrece un mecanismo de escalado más eficiente para el razonamiento de LLM al permitir la comunicación directa entre hilos y la terminación temprana basada en información de pares.