सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 3 / 11

llama.cpp b9838 रिलीज: macOS, Linux, Windows, Android के लिए बिल्ड्स

llama.cpp प्रोजेक्ट ने संस्करण b9838 जारी किया है, जो विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर एक्सेलेरेटरों के लिए पूर्व-बिल्ड बाइनरी प्रदान करता है। इस रिलीज में macOS, Linux, Windows, Android, और openEuler पर CPU, GPU (CUDA, Vulkan, ROCm, OpenCL), और विशेष AI एक्सेलेरेटर्स के लिए समर्थन शामिल है।

lab OpenAI News · 3 दिन पहले

HP Inc. ने OpenAI के साथ Frontier रणनीतिक साझेदारी शुरू की

सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।

github llama.cpp · 3 दिन पहले

llama.cpp b9837 रिलीज में --reasoning-preserve फ्लैग और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9837 जारी किया है, जिसने Jinja चैट टेम्पलेट के लिए एक नया `--reasoning-preserve` फ्लैग पेश किया है ताकि तर्क टोकन को बनाए रखा जा सके। इस अपडेट में सुधारी गई मदद संदेश भी शामिल हैं और विभिन्न हार्डवेयर बैकएंड पर macOS, Linux, Windows, Android और openEuler के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।

github llama.cpp · 3 दिन पहले

UI स्टॉप और रीजनिंग स्किप फिक्स के साथ llama.cpp b9835 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।

github llama.cpp · 3 दिन पहले

llama.cpp b9833 रिलीज़: MiniCPM5 पार्सर और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।

github llama.cpp · 3 दिन पहले

llama.cpp b9832 रिलीज में --dump-prog डीबगिंग फ्लैग जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।

github llama.cpp · 3 दिन पहले

llama.cpp b9831 रिलीज में DFlash समर्थन और नए बाइनरी शामिल हैं

llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।

github llama.cpp · 3 दिन पहले

llama.cpp b9830 रिलीज में --offline फ्लैग जोड़ा गया और मेमोरी बग ठीक किया

llama.cpp की b9830 रिलीज में llama download कमांड के साथ --offline फ्लैग का उपयोग करने की क्षमता शामिल है, जिससे स्क्रिप्ट्स नेटवर्क एक्सेस के बिना कैश किए गए मॉडलों की जांच कर सकते हैं। यह अपडेट URL-टास्क on_done कॉलबैक में first_path को गलत तरीके से रेफरेंस द्वारा कैप्चर किए जाने के कारण उत्पन्न हुए use-after-free दोष को भी ठीक करता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9829 रिलीज़: कम लॉग और मल्टी-प्लेटफ़ॉर्म बाइनरी

llama.cpp प्रोजेक्ट ने संस्करण b9829 जारी किया है, जिसमें सर्वर, सामान्य घटकों और स्पेकुलेटिव डिकोडिंग मॉड्यूल में लॉग आउटपुट की कमी शामिल है। यह अपडेट CMN_ को COM_ से बदलकर नामकरण रूढ़ियों को मानकीकृत भी करता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9828 रिलीज़: OpenCL Flash Attention में सुधार और नए बाइनरी

llama.cpp की b9828 रिलीज़ ने महत्वपूर्ण OpenCL बढ़तों को पेश किया, विशेष रूप से f16 और f32 प्रिसिजन के लिए Flash Attention kernels को फिर से डिजाइन किया। इस अपडेट में नए prefill prepass kernels और q4_0 व q8_0 क्वांटीज़ेशन फॉर्मेट्स के लिए समर्थन शामिल है।

github llama.cpp · 4 दिन पहले

llama.cpp b9827 रिलीज में CUDA 2D async copy ऑप्टिमाइज़ेशन जोड़ा गया

llama.cpp की b9827 रिलीज ने ggml_cuda_cpy फ़ंक्शन में cudaMemcpy2DAsync फास्ट पथ जोड़कर CUDA के लिए एक प्रदर्शन ऑप्टिमाइज़ेशन पेश किया है। यह बदलाव उन स्ट्राइडेड कॉपीज को तेज़ करता है जहाँ टेंसर पूरी तरह से कंटिग्यूस नहीं होते लेकिन प्रत्येक पंक्ति कंटिग्यूस होती है, जिसमें धीमे एलिमेंट-वाइज स्केलर कॉपी kernels की जगह लेता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9825 रिलीज़: Vulkan फिक्स और क्रॉस-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9825 जारी किया है, जिसमें शून्य इनपुट हैंडल करते समय Vulkan स्टेप ऑपरेटर के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Windows, Android और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 4 दिन पहले

SYCL norm फिक्स के साथ llama.cpp b9826 रिलीज

llama.cpp प्रोजेक्ट ने b9826 रिलीज जारी की है, जिसमें SYCL में norm फ़ंक्शन से जुड़े विफल यूनिट टेस्ट केसों के लिए एक फिक्स शामिल है। यह अपडेट कई प्लेटफॉर्म और हार्डवेयर एक्सेलेरेटर पर पूर्व-बिल्ड बाइनरी और फ्रेमवर्क प्रदान करता है।

github llama.cpp · 5 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9822 रिलीज

llama.cpp प्रोजेक्ट ने b9822 रिलीज प्रकाशित की है, जिसमें macOS, iOS, Linux, Android और Windows के लिए पूर्व-निर्मित बाइनरी शामिल हैं। इस अपडेट में test-chat-template --no-common विकल्प के लिए एक सुधार शामिल है और विभिन्न हार्डवेयर आर्किटेक्चर और एक्सेलेरेटर पर बिल्ड वितरित किए गए हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9823 रिलीज में विंडोज ओपेनवीनो और बाइनरी अपडेट्स शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9823 प्रकाशित किया है, जिसमें macOS, iOS, Linux, Android, Windows, और openEuler प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं। इस रिलीज में एक प्रमुख बदलाव चेक-रिलीज पाइपलाइन में विंडोज ओपेनवीनो बिल्ड का जोड़ना है।

github llama.cpp · 5 दिन पहले

llama.cpp b9824 रिलीज़: बाइनरी नामांतरण और नए बिल्ड

llama.cpp प्रोजेक्ट ने संस्करण b9824 जारी किया है, जिसमें rpc-server और export-graph-ops बाइनरी में सुधार शामिल हैं। `export-graph-ops` टूल को टेस्ट नामकरण अनुपालन का पालन करने के लिए नामांतरित किया गया है, जबकि `rpc-server` को सिस्टम निर्देशिकाओं में संघर्षों से बचने के लिए `ggml-rpc-server` में नामांतरित किया गया है।

github vLLM · 5 दिन पहले

v0.24.0

v0.24.0 रिलीज में MoE Refactor Qwen3 NVFP4 कॉन्फ़िगरेशन के लिए GSM8K स्टार्टअप टाइमआउट बढ़ाने के लिए एक निरंतर एकीकरण अद्यतन शामिल है।

lab OpenAI News · 5 दिन पहले

OpenAI ने GPT-5.6 Sol, Terra और Luna मॉडलों का पूर्वावलोकन प्रस्तुत किया

OpenAI ने GPT-5.6 श्रृंखला की सीमित पूर्वावलोकन शुरू की है, जिसमें तीन नए मॉडल शामिल हैं: Sol फ्लैगशिप के रूप में, Terra संतुलित दैनिक कार्यों के लिए, और Luna तेज़ और किफ़ायती कार्यों के लिए। कंपनी इन मॉडलों को भरोसेमंद भागीदारों के साथ इस प्रारंभिक चरण के बाद आने वाली कुछ हफ्तों में सामान्य रूप से उपलब्ध कराने की योजना बना रही है।

github llama.cpp · 5 दिन पहले

llama.cpp b9821 रिलीज़: CLI फ्लैग्स और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9821 जारी किया है, जिसमें --version, --licenses, और --help फ्लैग्स को कॉल करने की सुविधा के साथ कमांड-लाइन इंटरफ़ेस अपडेट शामिल हैं। इस रिलीज़ में विभिन्न हार्डवेयर एक्सेलेरेटर्स के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्वावलोकन बाइनरीज़ का एक व्यापक सेट प्रदान किया गया है।

lab Claude Code Releases · 5 दिन पहले

Claude Code v2.1.195 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.195 में कई फिक्स और सुधार शामिल हैं, जिनमें फुलस्क्रीन मोड में माउस नियंत्रण के लिए नए पर्यावरण चर और हुक मैचर लॉजिक में सुधार शामिल हैं।