Model Bahasa Pemrosesan Pesan memungkinkan penalaran efisien melalui komunikasi thread langsung

Peneliti memperkenalkan Model Bahasa Pemrosesan Pesan (MPLMs), sebuah kerangka kerja yang memungkinkan thread model bahasa besar berkomunikasi secara langsung menggunakan primitif kirim dan terima ringan, mengatasi batas skalabilitas paradigma fork-join tradisional.

MPLMs mengurangi biaya komunikasi dengan menghindari berbagi konteks redundan dan memanfaatkan preemption untuk menghentikan cabang yang tidak menjanjikan lebih awal.
Pada teka-teki Sudoku, MPLMs memerlukan konteks yang secara asimtotik lebih kecil dibandingkan metode Chain-of-Thought serial atau fork-join paralel, memungkinkan model yang telah di-fine-tune memecahkan teka-teki 25x25 yang menantang pendekatan standar.
Dalam tugas 3-SAT, kemampuan preemption meningkatkan efisiensi dengan menghentikan cabang yang tidak menjanjikan.
Model pra-pelatihan besar yang diprompt secara tepat dapat mengikuti protokol MPLM, mencapai hasil yang kompetitif pada pertanyaan konteks panjang dibandingkan dengan pendekatan fork-join populer.

Kerangka kerja ini menawarkan mekanisme penskalaan yang lebih efisien untuk penalaran LLM dengan memungkinkan komunikasi antar-thread langsung dan penghentian dini berdasarkan informasi rekan.