Peneliti memperkenalkan Model Bahasa Pemrosesan Pesan (MPLMs), sebuah kerangka kerja yang memungkinkan thread model bahasa besar berkomunikasi secara langsung menggunakan primitif kirim dan terima ringan, mengatasi batas skalabilitas paradigma fork-join tradisional.

  • MPLMs mengurangi biaya komunikasi dengan menghindari berbagi konteks redundan dan memanfaatkan preemption untuk menghentikan cabang yang tidak menjanjikan lebih awal.
  • Pada teka-teki Sudoku, MPLMs memerlukan konteks yang secara asimtotik lebih kecil dibandingkan metode Chain-of-Thought serial atau fork-join paralel, memungkinkan model yang telah di-fine-tune memecahkan teka-teki 25x25 yang menantang pendekatan standar.
  • Dalam tugas 3-SAT, kemampuan preemption meningkatkan efisiensi dengan menghentikan cabang yang tidak menjanjikan.
  • Model pra-pelatihan besar yang diprompt secara tepat dapat mengikuti protokol MPLM, mencapai hasil yang kompetitif pada pertanyaan konteks panjang dibandingkan dengan pendekatan fork-join populer.

Kerangka kerja ini menawarkan mekanisme penskalaan yang lebih efisien untuk penalaran LLM dengan memungkinkan komunikasi antar-thread langsung dan penghentian dini berdasarkan informasi rekan.