सभी लेख
github llama.cpp · 12 दिन पहले

LLaMA.cpp ने b9732 जारी किया: नए बाइनरी और अपडेट

LLaMA.cpp ने macOS, Linux, Android, Windows और openEuler के लिए अपडेटेड बाइनरी के साथ संस्करण b9732 जारी किया है। इस रिलीज़ में रिफैक्टर्ड चाइल्ड-टू-राउटर संचार, वकीप हैंडलिंग में सुधार, बेहतर update_status() और दस्तावेज़ीकरण शामिल हैं। नए बिल्ड Vulkan, ROCm, OpenVINO, SYCL और कई आर्किटेक्चर पर CUDA 12/13 का समर्थन करते हैं।

github llama.cpp · 12 दिन पहले

ggml-webgpu ने Vulkan और NVIDIA के लिए F16 एडेप्टर टॉगल जोड़े

ggml-webgpu प्रोजेक्ट ने Vulkan और NVIDIA GPU पर अर्ध-सटीकता (F16) समर्थन के लिए एडेप्टर टॉगल जोड़े हैं। यह अपडेट macOS, Linux, Android, Windows और openEuler सहित कई प्लेटफ़ॉर्म पर संगत हार्डवेयर पर बेहतर प्रदर्शन सक्षम बनाता है, ARM और x64 आर्किटेक्चर के लिए विशिष्ट बिल्ड उपलब्ध हैं।

github llama.cpp · 12 दिन पहले

llama.cpp बर्नच b9731: प्रदर्शन अनुकूलन और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp संस्करण b9731 में टोकन सॉर्टिंग ओवरहेड को कम करने के लिए std::partial_sort का उपयोग करके अनुकूलन पेश किया गया है, जिससे top-n टोकन चयन के लिए प्रदर्शन 8.555ms से घटकर 0.704ms हो गया है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों पर प्रीबिल्ट बाइनरी शामिल हैं।

github llama.cpp · 12 दिन पहले

llama.cpp release b9730: fixes and new binaries

llama.cpp version b9730 में Windows पर UTF-8 हैंडलिंग के लिए सुधार और ggml_fopen और CLI में सुधार शामिल हैं। रिलीज में Vulkan, CUDA, OpenVINO, और SYCL सहित कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों के लिए macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी प्रदान करती है।

github llama.cpp · 12 दिन पहले

LLaMA.cpp ने b9729 जारी किया: नए बाइनरी और प्लेटफ़ॉर्म समर्थन

LLaMA.cpp ने macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर पर b9729 संस्करण जारी किया है। इस रिलीज़ में CPU, Vulkan, OpenVINO, SYCL और ROCm समर्थन शामिल है, साथ ही एक नया UI पैकेज भी है। 'webui' के आंतरिक संदर्भ हटा दिए गए हैं।

github llama.cpp · 12 दिन पहले

LLaMA.cpp Release b9728 में कमेंट लाइन सपोर्ट और मल्टीप्लेटफ़ॉर्म बाइनरीज जोड़ी गईं

LLaMA.cpp संस्करण b9728 ने --api-key-file कॉन्फ़िगरेशन में कमेंट लाइनों के लिए समर्थन पेश किया है। रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों सहित Vulkan, CUDA, OpenVINO और SYCL के लिए प्री-बिल्ट बाइनरीज शामिल हैं।

github llama.cpp · 12 दिन पहले

llama.cpp release b9726 में --agent तर्क और नए प्लेटफ़ॉर्म बाइनरी जोड़े गए

llama.cpp संस्करण b9726 ने एक नया --agent तर्क पेश किया है और अनावश्यक webui नामकरण संगतता को हटा दिया है। इस रिलीज़ में कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों के लिए macOS, Linux, Android, Windows और openEuler के लिए प्रीकंपाइंड बाइनरी शामिल हैं।

github llama.cpp · 12 दिन पहले

llama.cpp बर्नच b9727: cpp-httplib को 0.48.0 पर अपडेट

llama.cpp संस्करण b9727, cpp-httplib को संस्करण 0.48.0 पर अपडेट करता है। रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और Vulkan, CUDA, OpenVINO और SYCL सहित हार्डवेयर एक्सेलरेशन विकल्पों के लिए बाइनरी शामिल हैं।

github llama.cpp · 12 दिन पहले

llama.cpp ने बग फिक्स और क्रॉस-प्लेटफ़ॉर्म बाइनरी के साथ b9724 जारी किया

llama.cpp संस्करण b9724 में कई बग फिक्स और सुधार शामिल हैं, जैसे कि बिल्ड फिक्स, area() फ़ंक्शन में ओवरफ्लो से बचाव, और get_u32() में एक सैनिटी चेक। इस रिलीज़ में macOS (arm64 और x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) और openEuler (ACL Graph सहायता के साथ x86 और aarch64) के लिए पूर्व-निर्मित बाइनरी, साथ ही एक UI पैकेज प्रदान करता है।

github llama.cpp · 12 दिन पहले

llama.cpp b9723 रिलीज में Qwen3.5, Qwen3.6 और Eagle3 के लिए समर्थन जोड़ा गया

llama.cpp संस्करण b9723 ने Eagle3 के माध्यम से Qwen3.5 और Qwen3.6 मॉडल के लिए समर्थन पेश किया है। इस रिलीज में हाइब्रिड मॉडल के लिए विलंबित बाउंड्री चेकपॉइंट पुनर्स्थापना, और API व नामकरण परंपराओं में अपडेट शामिल हैं। macOS, Linux, Android, Windows, और openEuler प्लेटफ़ॉर्म के लिए बाइनरी बिल्स उपलब्ध हैं, जिनमें CPU, Vulkan, OpenVINO, SYCL, और ROCm के विकल्प शामिल हैं।

github llama.cpp · 12 दिन पहले

LLaMA.cpp ने b9722 जारी किया: सुधार और क्रॉस-प्लेटफ़ॉर्म बाइनरी

LLaMA.cpp संस्करण b9722 सर्वर संदर्भ हैंडलिंग में n_discard मान की गैर-बाउंड समस्या को ठीक करता है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए प्रीकंपाइल्ड बाइनरी शामिल हैं, जो विभिन्न आर्किटेक्चर और Vulkan, CUDA, OpenVINO और SYCL जैसे एक्सेलरेशन फ्रेमवर्क्स का समर्थन करती हैं।

github llama.cpp · 12 दिन पहले

llama.cpp रिलीज़ b9718: सॉट चयन को एकीकृत किया गया और नए बाइनरी बिल्ड्स

llama.cpp संस्करण b9718 में सॉट चयन को get_available_slot नामक एकल फ़ंक्शन में एकीकृत किया गया है, जबकि प्रॉम्प्ट कैश अपडेट के लिए LCP समानता जांच बनाए रखी गई है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों के साथ बाइनरी बिल्ड्स शामिल हैं।

github llama.cpp · 12 दिन पहले

llama.cpp b9721 रिलीज कई प्लेटफॉर्म के लिए उपलब्ध

llama.cpp ने b9721 संस्करण जारी किया है, जिसमें विभिन्न आर्किटेक्चर के लिए macOS, Linux, Android, Windows और openEuler के लिए बाइनरी शामिल हैं। इस रिलीज में CPU, Vulkan, ROCm, OpenVINO, SYCL और HIP समर्थन शामिल है, जिसमें एक समर्पित UI पैकेज भी है। KleidiAI के साथ Apple Silicon के लिए एक सुविधा वर्तमान में अक्षम है।

github llama.cpp · 12 दिन पहले

Power10 MMA Q8/Q4 के लिए ggml-cpu में K tails समर्थन जोड़ा गया

ggml-cpu अब Power10 Q8/Q4 MMA मैट्रिक्स गुणन में K tails का समर्थन करता है, जिससे K के kc से विभाज्य होने की आवश्यकता समाप्त हो गई है। इससे अधिक कार्यभार MMA kernel का उपयोग कर सकते हैं और mnpack पर निर्भरता कम होती है।

github OpenAI Agents SDK · 12 दिन पहले

v0.17.6 रिलीज़ नोट्स

v0.17.6 रिलीज़ में प्री-अप्रूवल टूल इनपुट गार्डरेल और टूल आउटपुट के लिए केवल SDK कस्टम डेटा जोड़ा गया है। यह टूल आउटपुट के लिए एक सख्त JSON-संगत अनुबंध को लागू करता है और टूल नामों में अनावश्यक व्हाइटस्पेस चेतावनियों को दबा देता है। @siddiksawani ने इस रिलीज़ में अपना पहला योगदान दिया है।

github llama.cpp · 12 दिन पहले

llama.cpp Release b9716 ने InternVL के लिए Batching Support जोड़ा है

llama.cpp संस्करण b9716 ने InternVL के लिए batching support पेश किया है, जिससे कुशल बैच प्रोसेसिंग के माध्यम से मॉडल प्रदर्शन में सुधार हुआ है। रिलीज में macOS, Linux, Android, Windows और openEuler के लिए binary builds शामिल हैं, जो कई आर्किटेक्चर और Vulkan, OpenVINO, SYCL, और ROCm सहित हार्डवेयर एक्सेलरेशन विकल्पों पर उपलब्ध हैं।