llama.cpp ने USM सिस्टम आवंटन और क्रॉस-प्लेटफ़ॉर्म बाइनरी के साथ b9673 जारी किया
llama.cpp संस्करण b9673 में GPU बफर ≥1GB के लिए वैकल्पिक USM सिस्टम आवंटन शामिल हैं, जो उपकरण समर्थन उपलब्ध होने पर VRAM ओवरकॉमिट को सक्षम बनाता है। इस सुविधा के लिए GGML_SYCL_USM_SYSTEM पर्यावरण चर की आवश्यकता होती है और यह डिफ़ॉल्ट रूप से अक्षम है, यदि असमर्थित हो तो नियमित आवंटन पर वापस आ जाता है।