llama.cpp b9847 रिलीज में Gemma E4B MTP FlashAttention की मरम्मत
llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।
llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।
Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।
llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।
LangGraph संस्करण 1.2.7 जारी किया गया है, जिसमें LangChain इकोसिस्टम के लिए बग फिक्स और निर्भरता अपडेट शामिल हैं।
माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।
क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।
एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।
llama.cpp b9842 रिलीज में /v1/models एंडपॉइंट में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़ को डुप्लिकेट से हटाने के लिए एक बदलाव शामिल है। यह अपडेट Hugging Face से Adrien Gallouët द्वारा अनुमोदित है।
शोधकर्ताओं ने Brain2Qwerty v2 जारी किया है, जो एक गैर-आक्रामक AI पाइपलाइन है जो सर्जिकल इम्प्लांट के बिना मैग्नेटोएन्सेफेलोग्राफी (MEG) रिकॉर्डिंग से वास्तविक समय की वाक्यों को डिकोड करती है। सिस्टम ने समग्र रूप से 61% शब्द सटीकता दर हासिल की है और शीर्ष प्रदर्शनकर्ताओं के लिए यह 78% तक पहुंचती है, जो पिछले गैर-आक्रामक तरीकों से काफी बेहतर है।
llama.cpp की b9840 रिलीज में DeepSeek V4 मॉडल के लिए कन्वर्जन सपोर्ट पेश किया गया है, जिसमें Pro वेरिएंट के लिए विशेष हैंडलिंग भी शामिल है। इस अपडेट ने लाइब्रेरी में नई आर्किटेक्चर को विभिन्न इंटरनल ऑप्टिमाइज़ेशन और बग फिक्स के साथ एकीकृत किया है।
OpenAI Economic Research ने अपनी AI Jobs Transition Framework को यूरोपीय संघ तक विस्तारित किया है, जिसमें ESCO टैक्सोनॉमी और Eurostat डेटा का उपयोग करके यह विश्लेषण किया गया है कि एआई क्षमताएं सदस्य राज्यों में श्रम बाजारों को कैसे बदल सकती हैं।
llama.cpp प्रोजेक्ट ने संस्करण b9839 जारी किया है, जिसमें अनदेखी वुडट्रीज़ में Tailwind स्कैनिंग को पुनर्स्थापित करने के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न आर्किटेक्चर्स और हार्डवेयर एक्सेलरेशन बैकएंड्स पर macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।
llama.cpp प्रोजेक्ट ने संस्करण b9838 जारी किया है, जो विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर एक्सेलेरेटरों के लिए पूर्व-बिल्ड बाइनरी प्रदान करता है। इस रिलीज में macOS, Linux, Windows, Android, और openEuler पर CPU, GPU (CUDA, Vulkan, ROCm, OpenCL), और विशेष AI एक्सेलेरेटर्स के लिए समर्थन शामिल है।
सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।
llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।
llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।
llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।
llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।