सभी लेख
media Hugging Face Forums · 9 घंटे पहले

MacBook M5 Pro पर स्थानीय LLM - इसमें बिल्कुल नए!

एक गैर-प्रोग्रामर 128GB एकत्रीकृत मेमोरी वाले MacBook M5 Max पर स्थानीय बड़े भाषा मॉडल (LLM) इंफ्रास्ट्रक्चर सेटअप करने के अपने अनुभव को साझा करता है। उपयोगकर्ता स्थिर, दूरस्थ रूप से सुलभ सिस्टम स्थापित करते हुए AI सीखने के अपने उद्देश्यों, मॉडल चयनों और सॉफ़्टवेयर स्टैक का विवरण देते हैं।

lab Hugging Face Blog · 10 घंटे पहले

Hugging Face और Cerebras ने रियल-टाइम वॉइस AI के लिए Gemma 4 लाया

Hugging Face और Cerebras ने Google के Gemma 4 मॉडल को अपनी प्लेटफार्मों में एकीकृत किया है ताकि रियल-टाइम वॉइस आर्टिफिशियल इंटेलिजेंस अनुप्रयोग सक्षम हो सकें। इस सहयोग से डेवलपर्स कम लेटेंसी वाले ऑडियो प्रोसेसिंग कार्यों के लिए Gemma 4 की मल्टीमोडल क्षमताओं का लाभ उठा सकते हैं।

media Together AI Blog · 10 घंटे पहले

ओपन-सोर्स AI की ओर बदलाव को तेज करने के लिए हमारी $800M सीरीज़ C का ऐलान

कंपनी ने ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस की ओर संक्रमण को तेज करने के उद्देश्य से सीरीज़ C फंडिंग राउंड में $800 मिलियन जुटाए हैं।

lab Hugging Face Blog · 10 घंटे पहले

ScarfBench: एंटरप्राइज़ जावा फ्रेमवर्क माइग्रेशन के लिए AI एजेंट्स का बेंचमार्किंग

यह लेख ScarfBench पेश करता है, एक बेंचमार्क जो विभिन्न फ्रेमवर्क्स के बीच एंटरप्राइज़ जावा एप्लिकेशन को माइग्रेट करने में AI एजेंट्स के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अध्ययन फ्रेमवर्क माइग्रेशन की जटिलता पर प्रकाश डालता है और इस डोमेन में एजेंट क्षमताओं का आकलन करने के लिए एक मानकीकृत मूल्यांकन विधि का सुझाव देता है।

github llama.cpp · 19 घंटे पहले

llama.cpp b9857 रिलीज़: Flash Attention का पुनर्निर्माण और नए बाइनरी

llama.cpp b9857 रिलीज़ में Hexagon Flash Attention कार्यान्वयन का व्यापक पुनर्निर्माण पेश किया गया है, जिसमें अनुकूलन और सटीकता में सुधार पर ध्यान केंद्रित किया गया है। इस अपडेट में hex-mm और hex-fa मॉड्यूल में महत्वपूर्ण बदलाव शामिल हैं, जैसे कि मुख्य matmul थ्रेड्स में quant कार्यों को फोल्ड करना, ADD ऑपरेशन के साथ फ्यूज़ करना, और मास्क प्रसंस्करण का अनुकूलन।

github llama.cpp · 23 घंटे पहले

llama.cpp b9855 रिलीज में AVX2 nvfp4 अनुकूलन और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9855 जारी किया है, जिसने ggml-cpu बैकएंड के भीतर UE4M3 लुक-अप टेबल (LUT) का उपयोग करके nvfp4 डॉट उत्पाद के लिए AVX2 अनुकूलन पेश किया है।

github llama.cpp · 23 घंटे पहले

FA के लिए CUDA restrict + PDL के साथ llama.cpp b9856 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9856 जारी किया है, जिसमें CUDA में Flash Attention के लिए `restrict` कीवर्ड और PDL का सुसंगत उपयोग शामिल है। इस अपडेट के साथ विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी उपलब्ध हैं।

github llama.cpp · 1 दिन पहले

API एंडपॉइंट अनुरोधों के कैशिंग को रोकने के लिए PWA नेविगेट फॉलबैक हटाएं

अपडेट में प्रोग्रेसिव वेब ऐप (PWA) नेविगेट फॉलबैक तंत्र को हटा दिया गया है। यह परिवर्तन विशेष रूप से API एंडपॉइंट अनुरोधों के अनचाहे कैशिंग को रोकने के लिए लागू किया गया है।

github llama.cpp · 1 दिन पहले

llama.cpp b9852 रिलीज में OpenCL q1_0 सपोर्ट जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9852 जारी किया है, जिसमें q1_0 क्वांटाइज़ेशन फॉर्मेट के लिए प्रारंभिक OpenCL सपोर्ट शामिल है। इस अपडेट में सामान्य q1_0 क्षमताएं और OpenCL डिवाइसों के लिए विशिष्ट Adreno GEMM/GEMV कार्यान्वयन शामिल हैं।

lab Anthropic News · 1 दिन पहले

अमेरिकी निर्यात नियंत्रणों के बाद एंथ्रोपिक ने फेबल 5 को पुनः तैनात किया

अमेरिकी सरकार द्वारा सभी उपयोगकर्ताओं की उपलब्धता को निलंबित करने वाले निर्यात नियंत्रणों को हटाए जाने के बाद एंथ्रोपिक अपने क्लॉड फेबल 5 और माइथोस 5 मॉडल्स तक वैश्विक पहुंच को पुनर्स्थापित कर रहा है। फेबल 5 1 जुलाई से क्लॉड प्लेटफ़ॉर्म पर वैश्विक रूप में उपलब्ध होगा, जिसमें 7 जुलाई तक उपयोग सीमाएं लागू रहेंगी और उसके बाद क्रेडिट-आधारित पहुंच में बदलाव हो जाएगा।

github llama.cpp · 1 दिन पहले

llama.cpp b9851 रिलीज में CUDA पूर्णांक ट्रंकेशन ठीक किया गया और बाइनरी प्रदान की गई

llama.cpp परियोजना ने संस्करण b9851 जारी किया है, जिसमें flash_attn_mask_to_KV_max kernel में पूर्णांक ट्रंकेशन और ओवरफ्लो त्रुटियों को रोकने के लिए CUDA के लिए एक सुधार शामिल है। यह अपडेट निर्दिष्ट kernel के भीतर KQ मास्क स्टाइड्स से संबंधित समस्याओं को हल करता है।

github llama.cpp · 1 दिन पहले

llama.cpp b9850 रिलीज: Qwen3 फिक्स और नए बाइनरी

llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।

github MCP (GitHub org) · 1 दिन पहले

MCP Python SDK v2.0.0b1 2026 स्पेसिफिकेशन पूर्ण समर्थन के साथ जारी

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना पहला बीटा संस्करण, v2.0.0b1 जारी किया है, जो 2026-07-28 MCP स्पेसिफिकेशन के लिए पूर्ण समर्थन पेश करता है। यह प्री-रिलीज केवल ऑप-इन है, सुनिश्चित करती है कि मानक इंस्टॉलेशन स्थिर 1.x लाइन पर ही रिज़ॉल्व होते रहें।

lab Microsoft Research Blog · 2 दिन पहले

SkillOpt: एजेंट कौशल को प्रशिक्षणीय पैरामीटर के रूप में

Microsoft Research ने SkillOpt पेश किया है, एक विधि जो एजेंट कौशल फ़ाइलों को एक फ्रोजन टारगेट मॉडल के बाहर प्रशिक्षणीय पैरामीटर के रूप में मानती है, जिससे मैनुअल कौशल संपादन को नियंत्रित अनुकूलन प्रक्रिया में बदल दिया जाता है। यह दृष्टिकोण अंतर्निहित मॉडल वजन को अपडेट किए बिना एजेंट की विश्वसनीयता और स्थिरता को बढ़ावा देता है।

lab Anthropic News · 2 दिन पहले

वैज्ञानिकों के लिए एक AI वर्कबेंच क्लॉड साइंस अब उपलब्ध है

एन्थ्रोपिक ने क्लॉड साइंस को बीटा में लॉन्च किया है, जो एक ऐसा AI वर्कबेंच है जो बिखरे हुए वैज्ञानिक टूल्स को एक ही शोध वातावरण में एकीकृत करने के लिए डिज़ाइन किया गया है। प्लेटफ़ॉर्म ऑडिटेबल आर्टिफैक्ट्स, लचीले कंप्यूट स्केलिंग और जीनोमिक्स और संरचनात्मक जैविकी जैसे डोमेन के लिए विशेष एजेंट्स प्रदान करके खोज को तेज़ करने का लक्ष्य रखता है।

lab Anthropic News · 2 दिन पहले

क्लॉड सनेट 5 का परिचय

Anthropic ने क्लॉड सनेट 5 जारी किया है, जो एक नया एजेंटिक AI मॉडल है जिसका डिज़ाइन जटिल प्लानिंग, टूल उपयोग और स्वतंत्र कोडिंग कार्यों को पिछले Opus-क्लास मॉडल्स की तुलना में कम लागत पर करने के लिए किया गया है। यह अपडेट Opus 4.8 के साथ प्रदर्शन अंतर को कम करता है, जबकि अपने पूर्ववर्ती, सनेट 4.6 की तुलना में तर्क, सुरक्षा और निष्पादन में महत्वपूर्ण सुधार प्रदान करता है।

lab Claude Code Releases · 2 दिन पहले

Claude Code v2.1.197 में Claude Sonnet 5 का परिचय

Anthropic ने Claude Code का संस्करण 2.1.197 जारी किया है, जिसमें डिफ़ॉल्ट मॉडल को Claude Sonnet 5 पर अपडेट किया गया है। इस नए मॉडल में एक नेटिव 1M-टोकन संदर्भ विंडो है और यह 31 अगस्त तक प्रचारक मूल्य पर उपलब्ध है।