सभी लेख
github llama.cpp · 14 दिन पहले

LLaMA.cpp b9678 रिलीज में अनुकूलन और क्रॉस-प्लेटफ़ॉर्म बिल्ड्स जोड़े गए

LLaMA.cpp रिलीज b9678 में decode के लिए mul_mat_f16_f32_l4 का अनुकूलन शामिल है और macOS, Linux, Android, Windows, और openEuler के लिए नए बिल्ड्स पेश किए गए हैं। इस रिलीज में कई आर्किटेक्चरों पर CPU, Vulkan, ROCm, OpenVINO, SYCL, और HIP समर्थन उपलब्ध है, जिसमें एक समर्पित UI पैकेज भी शामिल है।

github llama.cpp · 14 दिन पहले

llama.cpp बर्नच b9677: अपडेट और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp संस्करण b9677 ने लॉगिंग को max_capacity लागू करने के लिए अपडेट किया है और क्यू एक्सपेंशन तर्क को हटा दिया है। रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए बाइनरी शामिल हैं, जो विभिन्न आर्किटेक्चर और Vulkan, CUDA, OpenVINO और SYCL सहित हार्डवेयर एक्सेलरेशन विकल्पों पर उपलब्ध हैं।

github llama.cpp · 14 दिन पहले

LLaMA.cpp ने b9674 जारी किया: Async memcpy बग को ठीक किया और नए बाइनरी जोड़े

LLaMA.cpp संस्करण b9674 ने MoE prefill के दौरान SYCL के async memcpy में use-after-free बग को ठीक किया। रिलीज़ में macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी शामिल हैं, जो कई आर्किटेक्चर पर CPU, Vulkan, ROCm, OpenVINO, SYCL, और CUDA का समर्थन करती हैं।

github llama.cpp · 14 दिन पहले

llama.cpp b9675 रिलीज़ में FP16 समर्थन और नए प्लेटफ़ॉर्म बाइनरी शामिल हैं

llama.cpp संस्करण b9675 ने SQR, SQRT, LOG, SIN, COS, और CLAMP जैसे ऑपरेशन के लिए FP16 समर्थन सक्षम किया है। इस रिलीज़ में कई आर्किटेक्चर पर macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी शामिल हैं, जिसमें Vulkan, ROCm, OpenVINO, SYCL (FP16 और FP32), और CUDA 12.4 और 13.3 का समर्थन है।

github llama.cpp · 14 दिन पहले

llama.cpp ने b9680 जारी किया: नए बाइनरी और Vulkan समर्थन

llama.cpp ने macOS, Linux, Android, Windows और openEuler के लिए अपडेटेड Vulkan समर्थन और नए बाइनरी के साथ संस्करण b9680 जारी किया है। इस रिलीज में कई आर्किटेक्चर के लिए CPU और GPU वेरिएंट शामिल हैं, जिनमें Vulkan, CUDA, OpenVINO, SYCL और ROCm का समर्थन है।

github llama.cpp · 14 दिन पहले

llama.cpp ने USM सिस्टम आवंटन और क्रॉस-प्लेटफ़ॉर्म बाइनरी के साथ b9673 जारी किया

llama.cpp संस्करण b9673 में GPU बफर ≥1GB के लिए वैकल्पिक USM सिस्टम आवंटन शामिल हैं, जो उपकरण समर्थन उपलब्ध होने पर VRAM ओवरकॉमिट को सक्षम बनाता है। इस सुविधा के लिए GGML_SYCL_USM_SYSTEM पर्यावरण चर की आवश्यकता होती है और यह डिफ़ॉल्ट रूप से अक्षम है, यदि असमर्थित हो तो नियमित आवंटन पर वापस आ जाता है।

lab Claude Code Releases · 15 दिन पहले

v2.1.179 रिलीज नोट्स

v2.1.179 में मध्य-स्ट्रीम कनेक्शन ड्रॉप, WSL2 में माउस-व्हील स्क्रॉलिंग समस्याएं, और अत्यधिक Bash टूल विवरणों का कारण बनने वाले सैंडबॉक्स ग्लॉग बग को ठीक किया गया है। इसमें फीडबैक सर्वे त्रुटियों, प्रचार बैनर स्टैकिंग, और सबएजेंट व्यू में फोकस समस्याओं को भी हल किया गया है, साथ ही रिमोट सेशनों में प्लगइन लोडिंग में सुधार किया गया है।

github llama.cpp · 15 दिन पहले

llama.cpp ने b9660 जारी किया है जिसमें सुधार और नए बाइनरी शामिल हैं

llama.cpp ने संस्करण b9660 जारी किया, जिसमें LFM2 टूल-कॉल पार्सिंग में डबल-एस्केपिंग की समस्या को ठीक किया गया है। इस अपडेट में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों के साथ बाइनरी शामिल हैं, जिसमें एक समर्पित UI पैकेज भी है।

github LangGraph · 15 दिन पहले

langgraph-cli 0.4.30 जारी

langgraph-cli संस्करण 0.4.30 अब उपलब्ध है, जिसमें संगत API संस्करण श्रेणियों के लिए समर्थन शामिल है। इस रिलीज़ में बेहतर दस्तावेज़ीकरण स्थिरता के लिए मानकीकृत README.md संरचनाएं भी शामिल हैं।

lab Claude Code Releases · 15 दिन पहले

Claude v2.1.178 रिलीज नोट्स

Claude v2.1.178 में Tool(param:value) सिंटैक्स का उपयोग करके नए अनुमति नियम, नेस्टेड निर्देशिकाओं में सुधारा गया वर्कफ़्लो और स्किल लोडिंग, और बढ़ाया गया ऑटो मोड और एरर मैसेजिंग शामिल हैं। इसमें क्रैश, प्रमाणीकरण त्रुटियाँ, और Chrome और VSCode में UI व्यवहार सहित महत्वपूर्ण मुद्दों को ठीक किया गया है, साथ ही टूल प्रॉम्प्ट्स और अनडो फ़ंक्शनलिटी को परिष्कृत किया गया है।

github llama.cpp · 15 दिन पहले

llama.cpp ने BoringSSL अपडेट के साथ संस्करण b9672 जारी किया

llama.cpp ने संस्करण b9672 जारी किया है, जिसने BoringSSL को 0.20260616.0 पर अपडेट किया है। रिलीज में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और Vulkan, CUDA, ROCm, OpenVINO और SYCL सहित हार्डवेयर त्वरण विकल्पों के लिए बाइनरी शामिल हैं।

github llama.cpp · 16 दिन पहले

llama.cpp ने Eagle3 के लिए बैकएंड सैम्पलिंग के साथ b96669 जारी किया

llama.cpp संस्करण b9669 में Eagle3 के लिए बैकएंड सैम्पलिंग समर्थन जोड़ा गया है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और Vulkan, CUDA, ROCm, OpenVINO, और SYCL सहित हार्डवेयर एक्सेलरेशन विकल्पों के लिए बाइनरी शामिल हैं।

github llama.cpp · 16 दिन पहले

llama.cpp रिलीज़ b9670: सुधार और नई बिल्ड्स

llama.cpp रिलीज़ b9670 में llama-graph में NVFP4 एज केस के लिए सुधार शामिल हैं, जैसे कि पोस्ट-GEMM MUL ऑपरेशन्स को स्थानांतरित करना और build_ffn को समर्थित संयोजनों तक सीमित करना। रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और बैकएंड विकल्पों, जैसे CUDA, Vulkan, SYCL और OpenVINO के लिए बाइनरी प्रदान की गई हैं।

github llama.cpp · 16 दिन पहले

llama.cpp release b9668 में UMA host-visible memory और cross-platform binaries जोड़े गए

llama.cpp संस्करण b9668 ने UMA उपकरणों पर बेहतर प्रदर्शन के लिए UMA host-visible memory buffers को लागू किया है, 0cc4m के सुझाव के आधार पर। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए binaries शामिल हैं, जो CPU, Vulkan, ROCm, OpenVINO, SYCL और HIP का समर्थन करते हैं, एक समर्पित UI पैकेज के साथ।

github llama.cpp · 16 दिन पहले

llama.cpp release b9665 में --offline फ्लैग और नए बाइनरी बिल्ड्स जोड़े गए

llama.cpp संस्करण b9665 में बेंचमार्किंग के लिए एक नया --offline फ्लैग पेश किया गया है। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और Vulkan, CUDA, ROCm, OpenVINO और SYCL सहित हार्डवेयर एक्सेलरेशन विकल्पों पर बाइनरी बिल्ड्स शामिल हैं।

github llama.cpp · 16 दिन पहले

LLaMA.cpp b9663 रिलीज़ में SYCL समर्थन और नए बाइनरी बिल्ड्स जोड़े गए

LLaMA.cpp रिलीज़ b9663 में OP EXPM1 के लिए समर्थन और FLOOR, TRUNC, और ROUND के लिए सभी यूनिट टेस्ट केस जोड़े गए हैं। इसमें macOS, Linux, Android, Windows, और openEuler के लिए अपडेटेड बाइनरी शामिल हैं, जिनमें SYCL (FP32 और FP16), Vulkan, CUDA 12.4 और 13.3, और ROCm 7.2 का समर्थन है, साथ ही एक अपडेटेड UI भी है।

github llama.cpp · 16 दिन पहले

sycl: पुनः क्रमित Q4_K/Q5_K/Q6_K MoE MUL_MAT_ID का समर्थन

sycl अपडेट ने Q4_K, Q5_K और Q6_K के लिए MoE MUL_MAT_ID में पुनः क्रमित विशेषज्ञ टेंसर हैंडलिंग के लिए समर्थन को बढ़ा दिया है। असमर्थित 3D पुनः क्रमण मामलों को अब रद्द करने के बजाय फॉलबैक पर चला जाता है।

github llama.cpp · 16 दिन पहले

Vulkan ने col2im_1d ऑप जोड़ा और कई प्लेटफॉर्म का समर्थन किया

llama.cpp के रिलीज b9661 ने Vulkan के लिए GGML_OP_COL2IM_1D समर्थन जोड़ा है, मॉड्यूलो के साथ पूर्ण-K स्कैन के बजाय एक बाउंडेड गैदर लूप का उपयोग करते हुए। यह असमर्थित प्रकारों के लिए nullptr लौटाता है और CPU, Vulkan, CUDA, और SYCL पर macOS, Linux, Android, Windows, और openEuler के लिए बिल्ड्स शामिल हैं।