सभी लेख
github llama.cpp · 1 दिन पहले

Asahi Linux के लिए Vulkan matmul अनुकूलन के साथ llama.cpp b9846 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।

github llama.cpp · 1 दिन पहले

llama.cpp b9844 रिलीज में NVFP4 सपोर्ट और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।

lab Google — The Keyword (AI) · 1 दिन पहले

ब्रिटेन की अगली उत्पादकता की अवधि को अनलॉक करना: एआई ट्रेलब्लेज़र्स का एक राष्ट्र बनाना

Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।

github llama.cpp · 1 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9843 रिलीज

llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।

lab Microsoft Research Blog · 2 दिन पहले

मेमोरा: एक हार्मोनिक मेमोरी रिप्रजेंटेशन जो एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करता है

माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।

lab Claude Code Releases · 2 दिन पहले

क्लॉड कोड v2.1.196 रिलीज नोट्स

क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।

lab Google — The Keyword (AI) · 2 दिन पहले

एक एआई विशेषज्ञ से पूछें: पूर्ण स्टैक क्या है?

एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।

github llama.cpp · 2 दिन पहले

llama.cpp b9842 रिलीज: /v1/models में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़

llama.cpp b9842 रिलीज में /v1/models एंडपॉइंट में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़ को डुप्लिकेट से हटाने के लिए एक बदलाव शामिल है। यह अपडेट Hugging Face से Adrien Gallouët द्वारा अनुमोदित है।

lab Meta AI / FAIR Blog · 2 दिन पहले

Brain2Qwerty v2 ने गैर-आक्रामक मस्तिष्क-से-पाठ डिकोडिंग में 61% शब्द सटीकता हासिल की

शोधकर्ताओं ने Brain2Qwerty v2 जारी किया है, जो एक गैर-आक्रामक AI पाइपलाइन है जो सर्जिकल इम्प्लांट के बिना मैग्नेटोएन्सेफेलोग्राफी (MEG) रिकॉर्डिंग से वास्तविक समय की वाक्यों को डिकोड करती है। सिस्टम ने समग्र रूप से 61% शब्द सटीकता दर हासिल की है और शीर्ष प्रदर्शनकर्ताओं के लिए यह 78% तक पहुंचती है, जो पिछले गैर-आक्रामक तरीकों से काफी बेहतर है।

github llama.cpp · 2 दिन पहले

llama.cpp b9840 रिलीज में DeepSeek V4 सपोर्ट और मल्टी-प्लेटफ़ॉर्म बाइनरीज़ शामिल हैं

llama.cpp की b9840 रिलीज में DeepSeek V4 मॉडल के लिए कन्वर्जन सपोर्ट पेश किया गया है, जिसमें Pro वेरिएंट के लिए विशेष हैंडलिंग भी शामिल है। इस अपडेट ने लाइब्रेरी में नई आर्किटेक्चर को विभिन्न इंटरनल ऑप्टिमाइज़ेशन और बग फिक्स के साथ एकीकृत किया है।

lab OpenAI News · 2 दिन पहले

यूरोप के एआई कार्यबल अवसर का मानचित्रण

OpenAI Economic Research ने अपनी AI Jobs Transition Framework को यूरोपीय संघ तक विस्तारित किया है, जिसमें ESCO टैक्सोनॉमी और Eurostat डेटा का उपयोग करके यह विश्लेषण किया गया है कि एआई क्षमताएं सदस्य राज्यों में श्रम बाजारों को कैसे बदल सकती हैं।

github llama.cpp · 2 दिन पहले

Tailwind स्कैनिंग फिक्स और मल्टी-प्लेटफ़ॉर्म बाइनरीज़ के साथ llama.cpp b9839 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9839 जारी किया है, जिसमें अनदेखी वुडट्रीज़ में Tailwind स्कैनिंग को पुनर्स्थापित करने के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न आर्किटेक्चर्स और हार्डवेयर एक्सेलरेशन बैकएंड्स पर macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 2 दिन पहले

llama.cpp b9838 रिलीज: macOS, Linux, Windows, Android के लिए बिल्ड्स

llama.cpp प्रोजेक्ट ने संस्करण b9838 जारी किया है, जो विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर एक्सेलेरेटरों के लिए पूर्व-बिल्ड बाइनरी प्रदान करता है। इस रिलीज में macOS, Linux, Windows, Android, और openEuler पर CPU, GPU (CUDA, Vulkan, ROCm, OpenCL), और विशेष AI एक्सेलेरेटर्स के लिए समर्थन शामिल है।

lab OpenAI News · 3 दिन पहले

HP Inc. ने OpenAI के साथ Frontier रणनीतिक साझेदारी शुरू की

सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।

github llama.cpp · 3 दिन पहले

UI स्टॉप और रीजनिंग स्किप फिक्स के साथ llama.cpp b9835 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।

github llama.cpp · 3 दिन पहले

llama.cpp b9833 रिलीज़: MiniCPM5 पार्सर और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।

github llama.cpp · 3 दिन पहले

llama.cpp b9832 रिलीज में --dump-prog डीबगिंग फ्लैग जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।

github llama.cpp · 3 दिन पहले

llama.cpp b9831 रिलीज में DFlash समर्थन और नए बाइनरी शामिल हैं

llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।

github llama.cpp · 3 दिन पहले

llama.cpp b9830 रिलीज में --offline फ्लैग जोड़ा गया और मेमोरी बग ठीक किया

llama.cpp की b9830 रिलीज में llama download कमांड के साथ --offline फ्लैग का उपयोग करने की क्षमता शामिल है, जिससे स्क्रिप्ट्स नेटवर्क एक्सेस के बिना कैश किए गए मॉडलों की जांच कर सकते हैं। यह अपडेट URL-टास्क on_done कॉलबैक में first_path को गलत तरीके से रेफरेंस द्वारा कैप्चर किए जाने के कारण उत्पन्न हुए use-after-free दोष को भी ठीक करता है।