सभी लेख
media Hugging Face Forums · 14 घंटे पहले

MacBook M5 Pro पर स्थानीय LLM - इसमें बिल्कुल नए!

एक गैर-प्रोग्रामर 128GB एकत्रीकृत मेमोरी वाले MacBook M5 Max पर स्थानीय बड़े भाषा मॉडल (LLM) इंफ्रास्ट्रक्चर सेटअप करने के अपने अनुभव को साझा करता है। उपयोगकर्ता स्थिर, दूरस्थ रूप से सुलभ सिस्टम स्थापित करते हुए AI सीखने के अपने उद्देश्यों, मॉडल चयनों और सॉफ़्टवेयर स्टैक का विवरण देते हैं।

lab Hugging Face Blog · 16 घंटे पहले

ScarfBench: एंटरप्राइज़ जावा फ्रेमवर्क माइग्रेशन के लिए AI एजेंट्स का बेंचमार्किंग

यह लेख ScarfBench पेश करता है, एक बेंचमार्क जो विभिन्न फ्रेमवर्क्स के बीच एंटरप्राइज़ जावा एप्लिकेशन को माइग्रेट करने में AI एजेंट्स के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अध्ययन फ्रेमवर्क माइग्रेशन की जटिलता पर प्रकाश डालता है और इस डोमेन में एजेंट क्षमताओं का आकलन करने के लिए एक मानकीकृत मूल्यांकन विधि का सुझाव देता है।

github llama.cpp · 2 दिन पहले

llama.cpp b9851 रिलीज में CUDA पूर्णांक ट्रंकेशन ठीक किया गया और बाइनरी प्रदान की गई

llama.cpp परियोजना ने संस्करण b9851 जारी किया है, जिसमें flash_attn_mask_to_KV_max kernel में पूर्णांक ट्रंकेशन और ओवरफ्लो त्रुटियों को रोकने के लिए CUDA के लिए एक सुधार शामिल है। यह अपडेट निर्दिष्ट kernel के भीतर KQ मास्क स्टाइड्स से संबंधित समस्याओं को हल करता है।

github llama.cpp · 2 दिन पहले

llama.cpp b9850 रिलीज: Qwen3 फिक्स और नए बाइनरी

llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।

github MCP (GitHub org) · 2 दिन पहले

MCP Python SDK v2.0.0b1 2026 स्पेसिफिकेशन पूर्ण समर्थन के साथ जारी

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना पहला बीटा संस्करण, v2.0.0b1 जारी किया है, जो 2026-07-28 MCP स्पेसिफिकेशन के लिए पूर्ण समर्थन पेश करता है। यह प्री-रिलीज केवल ऑप-इन है, सुनिश्चित करती है कि मानक इंस्टॉलेशन स्थिर 1.x लाइन पर ही रिज़ॉल्व होते रहें।

lab Microsoft Research Blog · 2 दिन पहले

SkillOpt: एजेंट कौशल को प्रशिक्षणीय पैरामीटर के रूप में

Microsoft Research ने SkillOpt पेश किया है, एक विधि जो एजेंट कौशल फ़ाइलों को एक फ्रोजन टारगेट मॉडल के बाहर प्रशिक्षणीय पैरामीटर के रूप में मानती है, जिससे मैनुअल कौशल संपादन को नियंत्रित अनुकूलन प्रक्रिया में बदल दिया जाता है। यह दृष्टिकोण अंतर्निहित मॉडल वजन को अपडेट किए बिना एजेंट की विश्वसनीयता और स्थिरता को बढ़ावा देता है।

lab Anthropic News · 2 दिन पहले

वैज्ञानिकों के लिए एक AI वर्कबेंच क्लॉड साइंस अब उपलब्ध है

एन्थ्रोपिक ने क्लॉड साइंस को बीटा में लॉन्च किया है, जो एक ऐसा AI वर्कबेंच है जो बिखरे हुए वैज्ञानिक टूल्स को एक ही शोध वातावरण में एकीकृत करने के लिए डिज़ाइन किया गया है। प्लेटफ़ॉर्म ऑडिटेबल आर्टिफैक्ट्स, लचीले कंप्यूट स्केलिंग और जीनोमिक्स और संरचनात्मक जैविकी जैसे डोमेन के लिए विशेष एजेंट्स प्रदान करके खोज को तेज़ करने का लक्ष्य रखता है।

lab Anthropic News · 2 दिन पहले

क्लॉड सनेट 5 का परिचय

Anthropic ने क्लॉड सनेट 5 जारी किया है, जो एक नया एजेंटिक AI मॉडल है जिसका डिज़ाइन जटिल प्लानिंग, टूल उपयोग और स्वतंत्र कोडिंग कार्यों को पिछले Opus-क्लास मॉडल्स की तुलना में कम लागत पर करने के लिए किया गया है। यह अपडेट Opus 4.8 के साथ प्रदर्शन अंतर को कम करता है, जबकि अपने पूर्ववर्ती, सनेट 4.6 की तुलना में तर्क, सुरक्षा और निष्पादन में महत्वपूर्ण सुधार प्रदान करता है।

lab Claude Code Releases · 2 दिन पहले

Claude Code v2.1.197 में Claude Sonnet 5 का परिचय

Anthropic ने Claude Code का संस्करण 2.1.197 जारी किया है, जिसमें डिफ़ॉल्ट मॉडल को Claude Sonnet 5 पर अपडेट किया गया है। इस नए मॉडल में एक नेटिव 1M-टोकन संदर्भ विंडो है और यह 31 अगस्त तक प्रचारक मूल्य पर उपलब्ध है।

lab OpenAI News · 2 दिन पहले

Genebench-Pro के अंदर: जटिल जीनोमिक तर्क के 10 केस स्टडी

GeneBench-Pro एक बेंचमार्क है जो मॉडल्स को जटिल जीनोमिक तर्क कार्यों पर आंकने के लिए डिज़ाइन किया गया है, जिसमें प्रतिनिधि प्रश्नों और सहायक सामग्री को प्रदर्शित करने वाले दस विस्तृत केस स्टडी शामिल हैं। प्रत्येक केस स्टडी विशिष्ट जैविक चुनौतियों पर मॉडल प्रदर्शन का आकलन करने के लिए आवश्यक मूल प्रॉम्प्ट, डेटासेट और संदर्भ प्रदान करती है।

lab OpenAI News · 2 दिन पहले

GeneBench-Pro का परिचय

GeneBench-Pro एक शोध-स्तर का बेंचमार्क है जो कंप्यूटेशनल बायोलॉजी में AI एजेंट अस्पष्टता को कैसे संभालते हैं और निर्णायक निर्णय लेते हैं, इसका मापन करने के लिए डिज़ाइन किया गया है, जो मूल GeneBench का विस्तार करता है। यह वर्तमान मूल्यांकनों की सीमाओं को संबोधित करता है, उच्च-क्रम क्षमताओं जैसे डेटा शोर को संभालना, मान्यताओं को पुनः देखना और परिणाम निर्णय-के लिए तैयार हैं या नहीं, यह निर्धारित करने का परीक्षण करके।

lab OpenAI News · 2 दिन पहले

कोर डंप महामारी विज्ञान: 18 साल पुरानी बग को ठीक करना

OpenAI के इंजीनियरों ने अपने Rockset डेटा इन्फ्रास्ट्रक्चर में अस्पष्ट C++ क्रैश को हल किया, जिसमें दो अलग-अलग कारणों की पहचान की गई: Azure होस्ट पर सilent हार्डवेयर करप्शन और GNU libunwind में 18 साल पुरानी रेस कंडीशन।

lab OpenAI News · 2 दिन पहले

ChatGPT की adoption कैसे विस्तृत हुई

OpenAI के Signals डेटा से पता चलता है कि ChatGPT की adoption दुनिया भर में चौड़ी और गहरी हो रही है, जिसमें उपयोगकर्ता दैनिक रूप से 50% अधिक संदेश भेज रहे हैं और साइन अप करने के छह महीने बाद कोशिश किए गए विशिष्ट कार्यों की संख्या दोगुनी हो गई है।

github llama.cpp · 2 दिन पहले

llama.cpp b9849 रिलीज़: IPv6 URL हैंडलिंग और नए बाइनरी

llama.cpp की b9849 रिलीज़ में URL अधिकारियों में ब्रैकेट वाले IPv6 लिटरल्स के लिए समर्थन पेश किया गया है, जिससे सर्वर RFC 3986 के अनुसार [host]:port रूपों को पार्स कर सकता है। यह अपडेट प्रति-अनुरोध ट्रैकिंग के लिए bare remote_addr बनाए रखते हुए, सुनने वाले लॉग्स, प्रॉक्सी हेडर्स और क्लाइंट रीबिल्ड्स की उचित फॉर्मेटिंग को सुनिश्चित करता है।

lab Google DeepMind Blog · 2 दिन पहले

Nano Banana 2 Lite और Gemini Omni Flash के साथ निर्माण शुरू करें

Google ने दो नए AI मॉडल, Nano Banana 2 Lite और Gemini Omni Flash जारी किए हैं, जो बुद्धिमान एप्लिकेशन बनाने के लिए डेवलपर क्षमताओं को बढ़ाने के लिए डिज़ाइन किए गए हैं।

lab Hugging Face Blog · 2 दिन पहले

विशेषीकरण अनिवार्य क्यों है

लेख तर्क देता है कि मशीन लर्निंग में विशेषीकरण एक अपरिहार्य प्रवृत्ति है जो मॉडल की बढ़ती जटिलता और डोमेन-विशिष्ट विशेषज्ञता की आवश्यकता द्वारा संचालित है।

github llama.cpp · 2 दिन पहले

llama.cpp b9848 रिलीज में CUDA get_rows_back की मरम्मत और बाइनरी प्रदान की गई

llama.cpp परियोजना ने संस्करण b9848 जारी किया है, जिसमें 65535 पंक्तियों से अधिक वाली तालिकाओं पर `get_rows_back` फ़ंक्शन के साथ समस्याओं को हल करने के लिए CUDA बैकएंड के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट ग्रिड-वाई क्लैम्पिंग और स्त्राइड त्रुटियों को संबोधित करता है, जो पहले बड़ी तालिका संचालन को प्रभावित कर रहे थे।

lab Hugging Face Blog · 2 दिन पहले

Hugging Face मॉडल पेज पर हर Eval के परिणाम प्रदर्शित

Hugging Face ने 'Every Eval' पहल से मूल्यांकन परिणामों को प्रदर्शित करने के लिए अपने मॉडल पृष्ठों को अपडेट किया है, जो विभिन्न बेंचमार्क में मॉडल की कार्यक्षमता का एक व्यापक दृश्य प्रदान करता है। इस एकीकरण से उपयोगकर्ताओं को मॉडल हब इंटरफ़ेस के भीतर ही मानकीकृत मापदंडों की एक विस्तृत श्रृंखला तक पहुंच मिलती है।