llama.cpp b9850 रिलीज: Qwen3 फिक्स और नए बाइनरी

llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।

macOS Apple Silicon (arm64) बाइनरी उपलब्ध हैं, जबकि KleidiAI समर्थन अक्षम है।
Linux बिल्ड्स Ubuntu x64 और arm64 CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL FP32/FP16 वेरिएंट्स को कवर करते हैं।
Android arm64 CPU बाइनरी मोबाइल डिवाइसों के लिए प्रदान की गई हैं।
Windows रिलीज में CPU, OpenCL Adreno, CUDA 12.4/13.3, Vulkan, OpenVINO, SYCL, और HIP बैकएंड शामिल हैं।
ACL ग्राफ समर्थन के साथ x86 और aarch64 आर्किटेक्चर के लिए openEuler बिल्ड्स शामिल हैं।

यह अपडेट उपयोगकर्ताओं को Qwen3 सीरीज मॉडल्स के लिए ठीक किया गया मॉडल हैंडलिंग और कई ऑपरेटिंग सिस्टम और GPU आर्किटेक्चर पर विस्तृत हार्डवेयर एक्सेलेरेशन विकल्प प्रदान करता है।