सभी लेख
github llama.cpp · 4 दिन पहले

llama.cpp b9828 रिलीज़: OpenCL Flash Attention में सुधार और नए बाइनरी

llama.cpp की b9828 रिलीज़ ने महत्वपूर्ण OpenCL बढ़तों को पेश किया, विशेष रूप से f16 और f32 प्रिसिजन के लिए Flash Attention kernels को फिर से डिजाइन किया। इस अपडेट में नए prefill prepass kernels और q4_0 व q8_0 क्वांटीज़ेशन फॉर्मेट्स के लिए समर्थन शामिल है।

github llama.cpp · 4 दिन पहले

llama.cpp b9827 रिलीज में CUDA 2D async copy ऑप्टिमाइज़ेशन जोड़ा गया

llama.cpp की b9827 रिलीज ने ggml_cuda_cpy फ़ंक्शन में cudaMemcpy2DAsync फास्ट पथ जोड़कर CUDA के लिए एक प्रदर्शन ऑप्टिमाइज़ेशन पेश किया है। यह बदलाव उन स्ट्राइडेड कॉपीज को तेज़ करता है जहाँ टेंसर पूरी तरह से कंटिग्यूस नहीं होते लेकिन प्रत्येक पंक्ति कंटिग्यूस होती है, जिसमें धीमे एलिमेंट-वाइज स्केलर कॉपी kernels की जगह लेता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9825 रिलीज़: Vulkan फिक्स और क्रॉस-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9825 जारी किया है, जिसमें शून्य इनपुट हैंडल करते समय Vulkan स्टेप ऑपरेटर के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Windows, Android और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 4 दिन पहले

SYCL norm फिक्स के साथ llama.cpp b9826 रिलीज

llama.cpp प्रोजेक्ट ने b9826 रिलीज जारी की है, जिसमें SYCL में norm फ़ंक्शन से जुड़े विफल यूनिट टेस्ट केसों के लिए एक फिक्स शामिल है। यह अपडेट कई प्लेटफॉर्म और हार्डवेयर एक्सेलेरेटर पर पूर्व-बिल्ड बाइनरी और फ्रेमवर्क प्रदान करता है।

github llama.cpp · 4 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9822 रिलीज

llama.cpp प्रोजेक्ट ने b9822 रिलीज प्रकाशित की है, जिसमें macOS, iOS, Linux, Android और Windows के लिए पूर्व-निर्मित बाइनरी शामिल हैं। इस अपडेट में test-chat-template --no-common विकल्प के लिए एक सुधार शामिल है और विभिन्न हार्डवेयर आर्किटेक्चर और एक्सेलेरेटर पर बिल्ड वितरित किए गए हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9823 रिलीज में विंडोज ओपेनवीनो और बाइनरी अपडेट्स शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9823 प्रकाशित किया है, जिसमें macOS, iOS, Linux, Android, Windows, और openEuler प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं। इस रिलीज में एक प्रमुख बदलाव चेक-रिलीज पाइपलाइन में विंडोज ओपेनवीनो बिल्ड का जोड़ना है।

github llama.cpp · 4 दिन पहले

llama.cpp b9824 रिलीज़: बाइनरी नामांतरण और नए बिल्ड

llama.cpp प्रोजेक्ट ने संस्करण b9824 जारी किया है, जिसमें rpc-server और export-graph-ops बाइनरी में सुधार शामिल हैं। `export-graph-ops` टूल को टेस्ट नामकरण अनुपालन का पालन करने के लिए नामांतरित किया गया है, जबकि `rpc-server` को सिस्टम निर्देशिकाओं में संघर्षों से बचने के लिए `ggml-rpc-server` में नामांतरित किया गया है।

lab OpenAI News · 5 दिन पहले

OpenAI ने GPT-5.6 Sol, Terra और Luna मॉडलों का पूर्वावलोकन प्रस्तुत किया

OpenAI ने GPT-5.6 श्रृंखला की सीमित पूर्वावलोकन शुरू की है, जिसमें तीन नए मॉडल शामिल हैं: Sol फ्लैगशिप के रूप में, Terra संतुलित दैनिक कार्यों के लिए, और Luna तेज़ और किफ़ायती कार्यों के लिए। कंपनी इन मॉडलों को भरोसेमंद भागीदारों के साथ इस प्रारंभिक चरण के बाद आने वाली कुछ हफ्तों में सामान्य रूप से उपलब्ध कराने की योजना बना रही है।

github llama.cpp · 5 दिन पहले

llama.cpp b9821 रिलीज़: CLI फ्लैग्स और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9821 जारी किया है, जिसमें --version, --licenses, और --help फ्लैग्स को कॉल करने की सुविधा के साथ कमांड-लाइन इंटरफ़ेस अपडेट शामिल हैं। इस रिलीज़ में विभिन्न हार्डवेयर एक्सेलेरेटर्स के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्वावलोकन बाइनरीज़ का एक व्यापक सेट प्रदान किया गया है।

lab Claude Code Releases · 5 दिन पहले

Claude Code v2.1.195 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.195 में कई फिक्स और सुधार शामिल हैं, जिनमें फुलस्क्रीन मोड में माउस नियंत्रण के लिए नए पर्यावरण चर और हुक मैचर लॉजिक में सुधार शामिल हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9820 रिलीज: कम CUDA सिंक और नए बाइनरी

llama.cpp b9820 रिलीज ने स्प्लिट कंप्यूट के दौरान कम सिंक्रनाइज़ेशन को पुनः पेश करके प्रदर्शन में सुधार लाया, विशेष रूप से CUDA बैकएंड्स को लक्षित करते हुए। यह अपडेट CPU, GPU और विशेष हार्डवेयर एक्सेलेरेटर के लिए macOS, Linux, Windows, Android और openEuler पर पूर्व-बिल्ड बाइनरी भी प्रदान करता है।

github llama.cpp · 5 दिन पहले

llama.cpp b9816 रिलीज: ggml के साथ सिंक और नए बाइनरी

llama.cpp प्रोजेक्ट ने संस्करण b9816 जारी किया है, जिसमें ggml लाइब्रेरी के साथ सिंक शामिल है। इस अपडेट में macOS, iOS, Linux, Windows, Android, और openEuler प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9817 रिलीज़: OpenVINO 2026.2.1 अपडेट और ऑपरेटर में सुधार

llama.cpp b9817 रिलीज़ OpenVINO बैकएंड को संस्करण 2026.2.1 पर अपडेट करता है और अपने रिलीज़ पैकेजों को स्वयं-समर्थित बनाता है। इस अपडेट में OpenVINO बैकएंड के भीतर कई ऑपरेटर सुधार शामिल हैं, जैसे कि हार्डकोडेड compute_op_type सेट्स को हटा देना और sink इनपुट के साथ softmax को सक्षम करना।

github llama.cpp · 5 दिन पहले

llama.cpp b9813 रिलीज में Intel Xe-LPG Plus Vulkan समर्थन जोड़ा गया

llama.cpp की b9813 रिलीज ने INTEL_XE1 आर्किटेक्चर एनम को जोड़ने और coopmat1 को सक्षम करने के माध्यम से Intel Xe-LPG Plus हार्डवेयर के लिए Vulkan समर्थन पेश किया है। यह अपडेट पिछले कोड टिप्पणियों को संबोधित करता है, आर्किटेक्चर पहचानकर्ता का नाम बदलता है, और एक Windows ड्राइवर जांच शामिल करता है।

github llama.cpp · 5 दिन पहले

mi50 के लिए Vulkan अनुकूलन के साथ llama.cpp b9814 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9814 जारी किया है, जिसमें AMD mi50 GPU को विशेष रूप से लक्षित करते हुए Vulkan में `mul_mat_vecq` ऑपरेशन के लिए एक अनुकूलन शामिल है। इस अपडेट के साथ कई ऑपरेटिंग सिस्टम और हार्डवेयर आर्किटेक्चर पर व्यापक रूप से पूर्व-निर्मित बाइनरीज़ उपलब्ध हैं।

github MCP (GitHub org) · 5 दिन पहले

MCP Python SDK v2.0.0a3 रिलीज नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना तीसरा अल्फा संस्करण, v2.0.0a3 जारी किया है, जिसमें महत्वपूर्ण प्रोटोकॉल और आर्किटेक्चरल बदलाव शामिल हैं जबकि स्थिर 1.x उपयोगकर्ताओं के लिए बैकवर्ड कंपैटिबिलिटी बनाए रखी गई है।

github llama.cpp · 5 दिन पहले

Vulkan कंपाइलर वर्कअराउंड के साथ llama.cpp b9811 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9811 जारी किया है, जिसमें Vulkan में conv2d coopmat2 पथ को प्रभावित करने वाले कंपाइलर बग के लिए एक फिक्स शामिल है। NVIDIA इंजीनियर Jeff Bolz की सलाह पर इस वर्कअराउंड को CONV_3D इम्प्लीमेंटेशन पर भी लागू किया गया है।

github MCP (GitHub org) · 5 दिन पहले

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK v1.28.1 रिलीज

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK ने संस्करण 1.28.1 जारी किया है, जिसमें स्ट्रीम हैंडलिंग और ट्रांसपोर्ट सुरक्षा में अपडेट शामिल हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9804 रिलीज़: Mamba2 फिक्स और नए बाइनरी

llama.cpp b9804 रिलीज़ में Mamba2 आर्किटेक्चर के लिए एक फिक्स शामिल है, जिसमें एक हार्डकोडेड 2x एक्सपेंशन फैक्टर और एक अमान्य पैरामीटर चेक को हटाया गया है, जिससे किसी भी expand मान का समर्थन संभव हो जाता है। यह बदलाव `convert_hf_to_gguf.py` स्क्रिप्ट को अपडेट करता है ताकि expand पैरामीटर वैकल्पिक हो जाए और इसका डिफ़ॉल्ट मान 2 हो।