शोधकर्ता संदेश पासिंग लैंग्वेज मॉडल्स (MPLMs) पेश करते हैं, एक फ्रेमवर्क जो बड़े लैंग्वेज मॉडल थ्रेड्स को हल्के भेजने और प्राप्त करने के प्राइमिटिव्स का उपयोग करके सीधे संचार करने की अनुमति देता है, पारंपरिक fork-join पैराडाइम्स के स्केलेबिलिटी सीमाओं को संबोधित करता है।

  • MPLMs अनावश्यक संदर्भ साझाकरण से बचकर संचार लागत को कम करते हैं और बेकार शाखाओं को जल्दी समाप्त करने के लिए प्रीएम्प्शन का उपयोग करते हैं।
  • सुडोकू पहेलियों पर, MPLMs को श्रृंखलाबद्ध Chain-of-Thought या समानांतर fork-join विधियों की तुलना में एसीम्प्टोटिक रूप से छोटा संदर्भव आवश्यक होता है, जिससे एक फाइन-ट्यूंड मॉडल 25x25 पहेलियों को हल करने में सक्षम होता है जो मानदृष्टि दृष्टिकोणों के लिए चुनौतीपूर्ण हैं।
  • 3-SAT कार्यों में, प्रीएम्प्शन क्षमता बेकार शाखाओं को समाप्त करके दक्षता को बढ़ाती है।
  • उचित रूप से प्रॉम्प्ट किए गए बड़े पूर्व-प्रशिक्षित मॉडल्स MPLM प्रोटोकॉल का पालन कर सकते हैं, लोकप्रिय fork-join दृष्टिकोणों की तुलना में लंबे संदर्भ वाले प्रश्नोत्तर पर प्रतिस्पर्धी परिणाम प्राप्त करते हैं।

यह फ्रेमवर्क थ्रेड्स के बीच सीधे संचार और सहकर्मी जानकारी के आधार पर शीघ्र समाप्ति को सक्षम बनाकर LLM तर्क के लिए अधिक कुशल स्केलिंग तंत्र प्रदान करता है।