सभी लेख
github llama.cpp · 1 दिन पहले

llama.cpp b9849 रिलीज़: IPv6 URL हैंडलिंग और नए बाइनरी

llama.cpp की b9849 रिलीज़ में URL अधिकारियों में ब्रैकेट वाले IPv6 लिटरल्स के लिए समर्थन पेश किया गया है, जिससे सर्वर RFC 3986 के अनुसार [host]:port रूपों को पार्स कर सकता है। यह अपडेट प्रति-अनुरोध ट्रैकिंग के लिए bare remote_addr बनाए रखते हुए, सुनने वाले लॉग्स, प्रॉक्सी हेडर्स और क्लाइंट रीबिल्ड्स की उचित फॉर्मेटिंग को सुनिश्चित करता है।

lab Google DeepMind Blog · 1 दिन पहले

Nano Banana 2 Lite और Gemini Omni Flash के साथ निर्माण शुरू करें

Google ने दो नए AI मॉडल, Nano Banana 2 Lite और Gemini Omni Flash जारी किए हैं, जो बुद्धिमान एप्लिकेशन बनाने के लिए डेवलपर क्षमताओं को बढ़ाने के लिए डिज़ाइन किए गए हैं।

github llama.cpp · 1 दिन पहले

llama.cpp b9848 रिलीज में CUDA get_rows_back की मरम्मत और बाइनरी प्रदान की गई

llama.cpp परियोजना ने संस्करण b9848 जारी किया है, जिसमें 65535 पंक्तियों से अधिक वाली तालिकाओं पर `get_rows_back` फ़ंक्शन के साथ समस्याओं को हल करने के लिए CUDA बैकएंड के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट ग्रिड-वाई क्लैम्पिंग और स्त्राइड त्रुटियों को संबोधित करता है, जो पहले बड़ी तालिका संचालन को प्रभावित कर रहे थे।

github llama.cpp · 2 दिन पहले

Asahi Linux के लिए Vulkan matmul अनुकूलन के साथ llama.cpp b9846 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।

github llama.cpp · 2 दिन पहले

llama.cpp b9844 रिलीज में NVFP4 सपोर्ट और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।

lab Google — The Keyword (AI) · 2 दिन पहले

ब्रिटेन की अगली उत्पादकता की अवधि को अनलॉक करना: एआई ट्रेलब्लेज़र्स का एक राष्ट्र बनाना

Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।

github llama.cpp · 2 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9843 रिलीज

llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।

lab Microsoft Research Blog · 2 दिन पहले

मेमोरा: एक हार्मोनिक मेमोरी रिप्रजेंटेशन जो एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करता है

माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।

lab Claude Code Releases · 2 दिन पहले

क्लॉड कोड v2.1.196 रिलीज नोट्स

क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।

lab Google — The Keyword (AI) · 2 दिन पहले

एक एआई विशेषज्ञ से पूछें: पूर्ण स्टैक क्या है?

एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।

github llama.cpp · 2 दिन पहले

llama.cpp b9842 रिलीज: /v1/models में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़

llama.cpp b9842 रिलीज में /v1/models एंडपॉइंट में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़ को डुप्लिकेट से हटाने के लिए एक बदलाव शामिल है। यह अपडेट Hugging Face से Adrien Gallouët द्वारा अनुमोदित है।

lab Meta AI / FAIR Blog · 2 दिन पहले

Brain2Qwerty v2 ने गैर-आक्रामक मस्तिष्क-से-पाठ डिकोडिंग में 61% शब्द सटीकता हासिल की

शोधकर्ताओं ने Brain2Qwerty v2 जारी किया है, जो एक गैर-आक्रामक AI पाइपलाइन है जो सर्जिकल इम्प्लांट के बिना मैग्नेटोएन्सेफेलोग्राफी (MEG) रिकॉर्डिंग से वास्तविक समय की वाक्यों को डिकोड करती है। सिस्टम ने समग्र रूप से 61% शब्द सटीकता दर हासिल की है और शीर्ष प्रदर्शनकर्ताओं के लिए यह 78% तक पहुंचती है, जो पिछले गैर-आक्रामक तरीकों से काफी बेहतर है।

github llama.cpp · 2 दिन पहले

llama.cpp b9840 रिलीज में DeepSeek V4 सपोर्ट और मल्टी-प्लेटफ़ॉर्म बाइनरीज़ शामिल हैं

llama.cpp की b9840 रिलीज में DeepSeek V4 मॉडल के लिए कन्वर्जन सपोर्ट पेश किया गया है, जिसमें Pro वेरिएंट के लिए विशेष हैंडलिंग भी शामिल है। इस अपडेट ने लाइब्रेरी में नई आर्किटेक्चर को विभिन्न इंटरनल ऑप्टिमाइज़ेशन और बग फिक्स के साथ एकीकृत किया है।

lab OpenAI News · 3 दिन पहले

यूरोप के एआई कार्यबल अवसर का मानचित्रण

OpenAI Economic Research ने अपनी AI Jobs Transition Framework को यूरोपीय संघ तक विस्तारित किया है, जिसमें ESCO टैक्सोनॉमी और Eurostat डेटा का उपयोग करके यह विश्लेषण किया गया है कि एआई क्षमताएं सदस्य राज्यों में श्रम बाजारों को कैसे बदल सकती हैं।

github llama.cpp · 3 दिन पहले

Tailwind स्कैनिंग फिक्स और मल्टी-प्लेटफ़ॉर्म बाइनरीज़ के साथ llama.cpp b9839 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9839 जारी किया है, जिसमें अनदेखी वुडट्रीज़ में Tailwind स्कैनिंग को पुनर्स्थापित करने के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न आर्किटेक्चर्स और हार्डवेयर एक्सेलरेशन बैकएंड्स पर macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 3 दिन पहले

llama.cpp b9838 रिलीज: macOS, Linux, Windows, Android के लिए बिल्ड्स

llama.cpp प्रोजेक्ट ने संस्करण b9838 जारी किया है, जो विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर एक्सेलेरेटरों के लिए पूर्व-बिल्ड बाइनरी प्रदान करता है। इस रिलीज में macOS, Linux, Windows, Android, और openEuler पर CPU, GPU (CUDA, Vulkan, ROCm, OpenCL), और विशेष AI एक्सेलेरेटर्स के लिए समर्थन शामिल है।

lab OpenAI News · 3 दिन पहले

HP Inc. ने OpenAI के साथ Frontier रणनीतिक साझेदारी शुरू की

सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।

github llama.cpp · 3 दिन पहले

llama.cpp b9837 रिलीज में --reasoning-preserve फ्लैग और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9837 जारी किया है, जिसने Jinja चैट टेम्पलेट के लिए एक नया `--reasoning-preserve` फ्लैग पेश किया है ताकि तर्क टोकन को बनाए रखा जा सके। इस अपडेट में सुधारी गई मदद संदेश भी शामिल हैं और विभिन्न हार्डवेयर बैकएंड पर macOS, Linux, Windows, Android और openEuler के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।