संदेश पासिंग लैंग्वेज मॉडल्स सीधे थ्रेड संचार के माध्यम से कुशल तर्क को सक्षम बनाते हैं

शोधकर्ता संदेश पासिंग लैंग्वेज मॉडल्स (MPLMs) पेश करते हैं, एक फ्रेमवर्क जो बड़े लैंग्वेज मॉडल थ्रेड्स को हल्के भेजने और प्राप्त करने के प्राइमिटिव्स का उपयोग करके सीधे संचार करने की अनुमति देता है, पारंपरिक fork-join पैराडाइम्स के स्केलेबिलिटी सीमाओं को संबोधित करता है।

MPLMs अनावश्यक संदर्भ साझाकरण से बचकर संचार लागत को कम करते हैं और बेकार शाखाओं को जल्दी समाप्त करने के लिए प्रीएम्प्शन का उपयोग करते हैं।
सुडोकू पहेलियों पर, MPLMs को श्रृंखलाबद्ध Chain-of-Thought या समानांतर fork-join विधियों की तुलना में एसीम्प्टोटिक रूप से छोटा संदर्भव आवश्यक होता है, जिससे एक फाइन-ट्यूंड मॉडल 25x25 पहेलियों को हल करने में सक्षम होता है जो मानदृष्टि दृष्टिकोणों के लिए चुनौतीपूर्ण हैं।
3-SAT कार्यों में, प्रीएम्प्शन क्षमता बेकार शाखाओं को समाप्त करके दक्षता को बढ़ाती है।
उचित रूप से प्रॉम्प्ट किए गए बड़े पूर्व-प्रशिक्षित मॉडल्स MPLM प्रोटोकॉल का पालन कर सकते हैं, लोकप्रिय fork-join दृष्टिकोणों की तुलना में लंबे संदर्भ वाले प्रश्नोत्तर पर प्रतिस्पर्धी परिणाम प्राप्त करते हैं।

यह फ्रेमवर्क थ्रेड्स के बीच सीधे संचार और सहकर्मी जानकारी के आधार पर शीघ्र समाप्ति को सक्षम बनाकर LLM तर्क के लिए अधिक कुशल स्केलिंग तंत्र प्रदान करता है।