ICML 2026 पर Together AI: पूरे स्टैक में अग्रिम शोध
Together AI ICML 2026 में अपनी प्लेटफ़ॉर्म विकास के पूरे स्टैक को कवर करने वाले नौ पेपर प्रस्तुत कर रहा है।
Together AI ICML 2026 में अपनी प्लेटफ़ॉर्म विकास के पूरे स्टैक को कवर करने वाले नौ पेपर प्रस्तुत कर रहा है।
यह लेख ScarfBench पेश करता है, एक बेंचमार्क जो विभिन्न फ्रेमवर्क्स के बीच एंटरप्राइज़ जावा एप्लिकेशन को माइग्रेट करने में AI एजेंट्स के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अध्ययन फ्रेमवर्क माइग्रेशन की जटिलता पर प्रकाश डालता है और इस डोमेन में एजेंट क्षमताओं का आकलन करने के लिए एक मानकीकृत मूल्यांकन विधि का सुझाव देता है।
llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।
एन्थ्रोपिक ने क्लॉड साइंस को बीटा में लॉन्च किया है, जो एक ऐसा AI वर्कबेंच है जो बिखरे हुए वैज्ञानिक टूल्स को एक ही शोध वातावरण में एकीकृत करने के लिए डिज़ाइन किया गया है। प्लेटफ़ॉर्म ऑडिटेबल आर्टिफैक्ट्स, लचीले कंप्यूट स्केलिंग और जीनोमिक्स और संरचनात्मक जैविकी जैसे डोमेन के लिए विशेष एजेंट्स प्रदान करके खोज को तेज़ करने का लक्ष्य रखता है।
Anthropic ने क्लॉड सनेट 5 जारी किया है, जो एक नया एजेंटिक AI मॉडल है जिसका डिज़ाइन जटिल प्लानिंग, टूल उपयोग और स्वतंत्र कोडिंग कार्यों को पिछले Opus-क्लास मॉडल्स की तुलना में कम लागत पर करने के लिए किया गया है। यह अपडेट Opus 4.8 के साथ प्रदर्शन अंतर को कम करता है, जबकि अपने पूर्ववर्ती, सनेट 4.6 की तुलना में तर्क, सुरक्षा और निष्पादन में महत्वपूर्ण सुधार प्रदान करता है।
Anthropic ने Claude Code का संस्करण 2.1.197 जारी किया है, जिसमें डिफ़ॉल्ट मॉडल को Claude Sonnet 5 पर अपडेट किया गया है। इस नए मॉडल में एक नेटिव 1M-टोकन संदर्भ विंडो है और यह 31 अगस्त तक प्रचारक मूल्य पर उपलब्ध है।
GeneBench-Pro एक बेंचमार्क है जो मॉडल्स को जटिल जीनोमिक तर्क कार्यों पर आंकने के लिए डिज़ाइन किया गया है, जिसमें प्रतिनिधि प्रश्नों और सहायक सामग्री को प्रदर्शित करने वाले दस विस्तृत केस स्टडी शामिल हैं। प्रत्येक केस स्टडी विशिष्ट जैविक चुनौतियों पर मॉडल प्रदर्शन का आकलन करने के लिए आवश्यक मूल प्रॉम्प्ट, डेटासेट और संदर्भ प्रदान करती है।
GeneBench-Pro एक शोध-स्तर का बेंचमार्क है जो कंप्यूटेशनल बायोलॉजी में AI एजेंट अस्पष्टता को कैसे संभालते हैं और निर्णायक निर्णय लेते हैं, इसका मापन करने के लिए डिज़ाइन किया गया है, जो मूल GeneBench का विस्तार करता है। यह वर्तमान मूल्यांकनों की सीमाओं को संबोधित करता है, उच्च-क्रम क्षमताओं जैसे डेटा शोर को संभालना, मान्यताओं को पुनः देखना और परिणाम निर्णय-के लिए तैयार हैं या नहीं, यह निर्धारित करने का परीक्षण करके।
OpenAI के इंजीनियरों ने अपने Rockset डेटा इन्फ्रास्ट्रक्चर में अस्पष्ट C++ क्रैश को हल किया, जिसमें दो अलग-अलग कारणों की पहचान की गई: Azure होस्ट पर सilent हार्डवेयर करप्शन और GNU libunwind में 18 साल पुरानी रेस कंडीशन।
OpenAI के Signals डेटा से पता चलता है कि ChatGPT की adoption दुनिया भर में चौड़ी और गहरी हो रही है, जिसमें उपयोगकर्ता दैनिक रूप से 50% अधिक संदेश भेज रहे हैं और साइन अप करने के छह महीने बाद कोशिश किए गए विशिष्ट कार्यों की संख्या दोगुनी हो गई है।
llama.cpp की b9849 रिलीज़ में URL अधिकारियों में ब्रैकेट वाले IPv6 लिटरल्स के लिए समर्थन पेश किया गया है, जिससे सर्वर RFC 3986 के अनुसार [host]:port रूपों को पार्स कर सकता है। यह अपडेट प्रति-अनुरोध ट्रैकिंग के लिए bare remote_addr बनाए रखते हुए, सुनने वाले लॉग्स, प्रॉक्सी हेडर्स और क्लाइंट रीबिल्ड्स की उचित फॉर्मेटिंग को सुनिश्चित करता है।
Google ने दो नए AI मॉडल, Nano Banana 2 Lite और Gemini Omni Flash जारी किए हैं, जो बुद्धिमान एप्लिकेशन बनाने के लिए डेवलपर क्षमताओं को बढ़ाने के लिए डिज़ाइन किए गए हैं।
लेख तर्क देता है कि मशीन लर्निंग में विशेषीकरण एक अपरिहार्य प्रवृत्ति है जो मॉडल की बढ़ती जटिलता और डोमेन-विशिष्ट विशेषज्ञता की आवश्यकता द्वारा संचालित है।
llama.cpp परियोजना ने संस्करण b9848 जारी किया है, जिसमें 65535 पंक्तियों से अधिक वाली तालिकाओं पर `get_rows_back` फ़ंक्शन के साथ समस्याओं को हल करने के लिए CUDA बैकएंड के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट ग्रिड-वाई क्लैम्पिंग और स्त्राइड त्रुटियों को संबोधित करता है, जो पहले बड़ी तालिका संचालन को प्रभावित कर रहे थे।
Hugging Face ने 'Every Eval' पहल से मूल्यांकन परिणामों को प्रदर्शित करने के लिए अपने मॉडल पृष्ठों को अपडेट किया है, जो विभिन्न बेंचमार्क में मॉडल की कार्यक्षमता का एक व्यापक दृश्य प्रदान करता है। इस एकीकरण से उपयोगकर्ताओं को मॉडल हब इंटरफ़ेस के भीतर ही मानकीकृत मापदंडों की एक विस्तृत श्रृंखला तक पहुंच मिलती है।
llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।
llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।
Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।
llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।