सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 1 / 13

llama.cpp b9850 रिलीज: Qwen3 फिक्स और नए बाइनरी

llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।

lab OpenAI News · 1 दिन पहले

Genebench-Pro के अंदर: जटिल जीनोमिक तर्क के 10 केस स्टडी

GeneBench-Pro एक बेंचमार्क है जो मॉडल्स को जटिल जीनोमिक तर्क कार्यों पर आंकने के लिए डिज़ाइन किया गया है, जिसमें प्रतिनिधि प्रश्नों और सहायक सामग्री को प्रदर्शित करने वाले दस विस्तृत केस स्टडी शामिल हैं। प्रत्येक केस स्टडी विशिष्ट जैविक चुनौतियों पर मॉडल प्रदर्शन का आकलन करने के लिए आवश्यक मूल प्रॉम्प्ट, डेटासेट और संदर्भ प्रदान करती है।

lab OpenAI News · 1 दिन पहले

GeneBench-Pro का परिचय

GeneBench-Pro एक शोध-स्तर का बेंचमार्क है जो कंप्यूटेशनल बायोलॉजी में AI एजेंट अस्पष्टता को कैसे संभालते हैं और निर्णायक निर्णय लेते हैं, इसका मापन करने के लिए डिज़ाइन किया गया है, जो मूल GeneBench का विस्तार करता है। यह वर्तमान मूल्यांकनों की सीमाओं को संबोधित करता है, उच्च-क्रम क्षमताओं जैसे डेटा शोर को संभालना, मान्यताओं को पुनः देखना और परिणाम निर्णय-के लिए तैयार हैं या नहीं, यह निर्धारित करने का परीक्षण करके।

lab OpenAI News · 1 दिन पहले

कोर डंप महामारी विज्ञान: 18 साल पुरानी बग को ठीक करना

OpenAI के इंजीनियरों ने अपने Rockset डेटा इन्फ्रास्ट्रक्चर में अस्पष्ट C++ क्रैश को हल किया, जिसमें दो अलग-अलग कारणों की पहचान की गई: Azure होस्ट पर सilent हार्डवेयर करप्शन और GNU libunwind में 18 साल पुरानी रेस कंडीशन।

lab OpenAI News · 1 दिन पहले

ChatGPT की adoption कैसे विस्तृत हुई

OpenAI के Signals डेटा से पता चलता है कि ChatGPT की adoption दुनिया भर में चौड़ी और गहरी हो रही है, जिसमें उपयोगकर्ता दैनिक रूप से 50% अधिक संदेश भेज रहे हैं और साइन अप करने के छह महीने बाद कोशिश किए गए विशिष्ट कार्यों की संख्या दोगुनी हो गई है।

github llama.cpp · 1 दिन पहले

llama.cpp b9849 रिलीज़: IPv6 URL हैंडलिंग और नए बाइनरी

llama.cpp की b9849 रिलीज़ में URL अधिकारियों में ब्रैकेट वाले IPv6 लिटरल्स के लिए समर्थन पेश किया गया है, जिससे सर्वर RFC 3986 के अनुसार [host]:port रूपों को पार्स कर सकता है। यह अपडेट प्रति-अनुरोध ट्रैकिंग के लिए bare remote_addr बनाए रखते हुए, सुनने वाले लॉग्स, प्रॉक्सी हेडर्स और क्लाइंट रीबिल्ड्स की उचित फॉर्मेटिंग को सुनिश्चित करता है।

lab Google DeepMind Blog · 1 दिन पहले

Nano Banana 2 Lite और Gemini Omni Flash के साथ निर्माण शुरू करें

Google ने दो नए AI मॉडल, Nano Banana 2 Lite और Gemini Omni Flash जारी किए हैं, जो बुद्धिमान एप्लिकेशन बनाने के लिए डेवलपर क्षमताओं को बढ़ाने के लिए डिज़ाइन किए गए हैं।

lab Hugging Face Blog · 1 दिन पहले

विशेषीकरण अनिवार्य क्यों है

लेख तर्क देता है कि मशीन लर्निंग में विशेषीकरण एक अपरिहार्य प्रवृत्ति है जो मॉडल की बढ़ती जटिलता और डोमेन-विशिष्ट विशेषज्ञता की आवश्यकता द्वारा संचालित है।

github llama.cpp · 1 दिन पहले

llama.cpp b9848 रिलीज में CUDA get_rows_back की मरम्मत और बाइनरी प्रदान की गई

llama.cpp परियोजना ने संस्करण b9848 जारी किया है, जिसमें 65535 पंक्तियों से अधिक वाली तालिकाओं पर `get_rows_back` फ़ंक्शन के साथ समस्याओं को हल करने के लिए CUDA बैकएंड के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट ग्रिड-वाई क्लैम्पिंग और स्त्राइड त्रुटियों को संबोधित करता है, जो पहले बड़ी तालिका संचालन को प्रभावित कर रहे थे।

lab Hugging Face Blog · 1 दिन पहले

Hugging Face मॉडल पेज पर हर Eval के परिणाम प्रदर्शित

Hugging Face ने 'Every Eval' पहल से मूल्यांकन परिणामों को प्रदर्शित करने के लिए अपने मॉडल पृष्ठों को अपडेट किया है, जो विभिन्न बेंचमार्क में मॉडल की कार्यक्षमता का एक व्यापक दृश्य प्रदान करता है। इस एकीकरण से उपयोगकर्ताओं को मॉडल हब इंटरफ़ेस के भीतर ही मानकीकृत मापदंडों की एक विस्तृत श्रृंखला तक पहुंच मिलती है।

github llama.cpp · 2 दिन पहले

llama.cpp b9847 रिलीज में Gemma E4B MTP FlashAttention की मरम्मत

llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।

github llama.cpp · 2 दिन पहले

Asahi Linux के लिए Vulkan matmul अनुकूलन के साथ llama.cpp b9846 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।

github llama.cpp · 2 दिन पहले

llama.cpp b9844 रिलीज में NVFP4 सपोर्ट और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।

lab Google — The Keyword (AI) · 2 दिन पहले

ब्रिटेन की अगली उत्पादकता की अवधि को अनलॉक करना: एआई ट्रेलब्लेज़र्स का एक राष्ट्र बनाना

Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।

github llama.cpp · 2 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9843 रिलीज

llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।

github LangGraph · 2 दिन पहले

LangGraph 1.2.7 रिलीज नोट्स

LangGraph संस्करण 1.2.7 जारी किया गया है, जिसमें LangChain इकोसिस्टम के लिए बग फिक्स और निर्भरता अपडेट शामिल हैं।

lab Microsoft Research Blog · 2 दिन पहले

मेमोरा: एक हार्मोनिक मेमोरी रिप्रजेंटेशन जो एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करता है

माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।

lab Claude Code Releases · 2 दिन पहले

क्लॉड कोड v2.1.196 रिलीज नोट्स

क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।

lab Hugging Face Blog · 2 दिन पहले

DiScoFormer: घनत्व और स्कोर के लिए एक transformer, वितरणों में

लेख DiScoFormer का परिचय देता है, जो एक एकीकृत transformer मॉडल है जो विभिन्न डेटा वितरणों में घनत्व अनुमान और स्कोर-आधारित जनरेटिव कार्यों को करने में सक्षम है।

lab Google — The Keyword (AI) · 2 दिन पहले

एक एआई विशेषज्ञ से पूछें: पूर्ण स्टैक क्या है?

एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।