सभी लेख
github MCP (GitHub org) · 6 दिन पहले

MCP Python SDK v2.0.0a3 रिलीज नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना तीसरा अल्फा संस्करण, v2.0.0a3 जारी किया है, जिसमें महत्वपूर्ण प्रोटोकॉल और आर्किटेक्चरल बदलाव शामिल हैं जबकि स्थिर 1.x उपयोगकर्ताओं के लिए बैकवर्ड कंपैटिबिलिटी बनाए रखी गई है।

github llama.cpp · 6 दिन पहले

llama.cpp b9804 रिलीज़: Mamba2 फिक्स और नए बाइनरी

llama.cpp b9804 रिलीज़ में Mamba2 आर्किटेक्चर के लिए एक फिक्स शामिल है, जिसमें एक हार्डकोडेड 2x एक्सपेंशन फैक्टर और एक अमान्य पैरामीटर चेक को हटाया गया है, जिससे किसी भी expand मान का समर्थन संभव हो जाता है। यह बदलाव `convert_hf_to_gguf.py` स्क्रिप्ट को अपडेट करता है ताकि expand पैरामीटर वैकल्पिक हो जाए और इसका डिफ़ॉल्ट मान 2 हो।

media Hugging Face Forums · 6 दिन पहले

JoeBro: शून्य निर्भरता के साथ एक नेटिव macOS AI वर्कस्पेस

JoeBro एक लोकल-फर्स्ट, नेटिव macOS एप्लिकेशन है जो बाहरी निर्भरताओं जैसे pip या Docker की आवश्यकता के बिना एक AI वर्कस्पेस प्रदान करने के लिए डिज़ाइन किया गया है। इसमें एक बंडल किए गए Python बैकएंड और SQLite स्टोरेज हैं ताकि सुनिश्चित किया जा सके कि सभी डेटा उपयोगकर्ता की मशीन पर ही रहे, जिससे टेलीमेट्री और खाता आवश्यकताओं को समाप्त कर दिया जाता है।

media Hugging Face Forums · 6 दिन पहले

मैं किसी व्यक्ति को Hugging Face डेटासेट/डेटाबेस में कैसे जोड़ सकता हूँ?

प्रदान किया गया स्रोत सामग्री संकेत देती है कि मूल पोस्ट विषय लेखक द्वारा हटा दिया गया था। परिणामस्वरूप, इस उद्धरण में Hugging Face डेटासेट या डेटाबेस में उपयोगकर्ताओं को जोड़ने की प्रक्रिया के बारे में कोई विशिष्ट जानकारी उपलब्ध नहीं है।

github CrewAI · 6 दिन पहले

crewAI 1.15.0 रिलीज नोट्स

crewAI 1.15.0 रिलीज़ में Flow परिभाषाओं के लिए महत्वपूर्ण सुधार शामिल हैं, जिनमें एकत्रीकृत घोषणात्मक लोडिंग, इनलाइन crew समर्थन और `each` तथा सिंगल एजेंट एक्शन जैसे नए संयुक्त एक्शन शामिल हैं।

github llama.cpp · 6 दिन पहले

OpenCL प्रोफाइलिंग फिक्स के साथ llama.cpp b9803 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9803 जारी किया है, जिसमें OpenCL को अपूर्ण बैचों के लिए शटडाउन पर प्रोफाइलिंग बैच फ्लश करने का फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स के लिए macOS, Linux, Windows, Android और openEuler के लिए बाइनरीज प्रदान करता है।

github AutoGPT · 6 दिन पहले

AutoGPT Platform Beta v0.6.65 रिलीज नोट्स

AutoGPT प्लेटफ़ॉर्म ने संस्करण 0.6.65 जारी किया है, जिसमें Copilot सिस्टम, उपयोगकर्ता इंटरफ़ेस नेविगेशन और बुनियादी ढांचे की विश्वसनीयता में महत्वपूर्ण अपडेट शामिल हैं।

github llama.cpp · 6 दिन पहले

llama.cpp b9802 रिलीज में macOS, Linux, Windows और Android के लिए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने b9802 रिलीज जारी की है, जिसमें कई ऑपरेटिंग सिस्टम और हार्डवेयर आर्किटेक्चर पर पहले से बनाए गए बाइनरी उपलब्ध हैं। इस अपडेट में macOS, Linux, Windows, Android और openEuler जैसे प्लेटफॉर्म पर CPU, GPU और विशेष AI एक्सेलेरेटर के लिए समर्थन शामिल है।

lab Claude Code Releases · 6 दिन पहले

क्लाउड कोड v2.1.193 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.193 ऑटो-मोड वर्गीकरण, टेलीमेट्री लॉगिंग और बैकग्राउंड एजेंट प्रबंधन में कई सुधार लाता है। इस अपडेट में UI स्टेट समस्याओं, MCP सर्वरों में प्रमाणीकरण हैंडलिंग और विभिन्न बैकग्राउंडिंग बग के लिए फिक्स भी शामिल हैं।

lab Cohere Blog · 7 दिन पहले

AI एजेंट्स के साथ फॉर्क रखरखाव को स्वचालित करना

यह लेख AI कोडिंग एजेंट्स का उपयोग करके सॉफ्टवेयर फॉर्क्स के रखरखाव को स्वचालित करने की एक विधि का वर्णन करता है, जिसका अनुप्रयोग Cohere के vLLM के फॉर्क पर किया गया है। यह दृष्टिकोण मैन्युअल हस्तक्षेप को एक स्वचालित फीडबैक लूप से बदलकर अपस्ट्रीम रिलीजों को एकीकृत करने में लगने वाले समय को सप्ताहों से दिनों तक कम कर देता है।

lab Microsoft Research Blog · 7 दिन पहले

AI-संचालित व्याख्याओं और प्रयोगों के साथ मस्तिष्क को समझना

शोधकर्ताओं ने जनरेटिव काज़ुअल टेस्टिंग (GCT) विकसित की है, एक फ्रेमवर्क जो अविश्लेषणीय LLM-आधारित मस्तिष्क-पूर्वानुमान मॉडलों को कॉर्टिकल कार्य के बारे में संक्षिप्त, परीक्षण योग्य मौखिक परिकल्पनाओं में परिवर्तित करता है। यह विधि मॉडल पैरामीटरों को छोटे वाक्यांशों में निचोड़ती है जो वर्णन करते हैं कि विशिष्ट मस्तिष्क क्षेत्र किसके प्रति प्रतिक्रिया करते हैं, जैसे "खाना तैयार करना", और फिर लक्षित fMRI प्रयोगों के माध्यम से इन व्याख्याओं की पुष्टि करते हैं।

lab Hugging Face Blog · 7 दिन पहले

एक कमांड में HF Jobs पर vLLM सर्वर चलाएं

Hugging Face ने एक नई सुविधा पेश की है जो उपयोगकर्ताओं को एकल कमांड का उपयोग करके Hugging Face Jobs प्लेटफ़ॉर्म के माध्यम से सीधे vLLM सर्वर तैनात करने की अनुमति देती है।

lab Hugging Face Blog · 7 दिन पहले

हाइब्रिड भाषा मॉडल में टोकन भविष्यवाणी सटीकता का विश्लेषण

एक हालिया अध्ययन जांचता है कि मानक घन संरचनाओं की तुलना में हाइब्रिड भाषा मॉडल किस विशिष्ट टोकन को अधिक सटीकता से भविष्यवाणी करते हैं। शोध दुर्लभ शब्दों और कोड स्निपेट्स जैसे विभिन्न टोकन प्रकारों के अनुमान त्रुटियों के वितरण को समझने पर केंद्रित है। हानि परिदृश्य का विश्लेषण करने से, लेखकों ने पहचाना कि हाइब्रिड मॉडल विरल डेटा क्षेत्रों में दीर्घ-परास निर्भरताओं को पकड़ने में उत्कृष्ट हैं। निष्कर्ष सुझाव देते हैं कि विशेषज्ञ मिश्रण तंत्र अनुमान के दौरान अधिक कुशल पैरामीटर उपयोग की अनुमति देता है। यह सुधरी हुई सटीकता प्रशिक्षण कॉर्पस में कम आवृत्ति वाले टोकन के लिए विशेष रूप से उल्लेखनीय है। पेपर विभिन्न बेंचमार्क डेटासेट पर प्रदर्शन मेट्रिक्स का एक विस्तृत विभाजन प्रदान करता है। ये परिणाम हाइब्रिड संरचनाओं की विविध भाषाई संरचनाओं को प्रभावी ढंग से संभालने की क्षमता को उजागर करते हैं।

lab Cohere Blog · 7 दिन पहले

कॉहेर ने कस्टम MCP सर्वर के जरिए नॉर्थ और विज़ के साथ इंसिडेंट रिस्पॉन्स को ऑटोमेट किया

कॉहेर ने अपने एंटरप्राइज़ AI प्लेटफ़ॉर्म, कॉहेर नॉर्थ का उपयोग करके एक सुरक्षा एजेंट विकसित किया, जिसे कस्टम मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर के जरिए क्लाउड सुरक्षा प्लेटफ़ॉर्म विज़ के साथ इंटीग्रेट किया गया। यह आर्किटेक्चर नॉर्थ को विज़ के GraphQL API से आठ एटॉमिक टूल्स के जरिए कनेक्ट करता है, जिससे एकल प्रॉम्प्ट से ऑटोमेटेड इंसिडेंट रिस्पॉन्स वर्कफ़्लो सक्षम होते हैं। सिस्टम अटैक चेन का मूल्यांकन करने और इंटरनेट एक्सपोज़र और प्राइविलेज लेवल के आधार पर जोखिमों को रैंक करने के जरिए टॉक्सिक कॉम्बिनेशन ब्लास्ट रेडियस विश्लेषण लगभग 20 सेकंड में करता है। यह मुद्दे की जानकारी प्राप्त करना, लीनियर टिकट बनाना, विज़ स्थिति अपडेट करना और संरचित इंसिडेंट रिस्पॉन्स रिपोर्ट तैयार करके एंड-टू-एंड जांच को भी ऑटोमेट करता है। इसके अलावा, एक शेड्यूल्ड वीकली ऑटोमेशन बिना किसी मैन्युअल हस्तक्षेप के हर सोमवार सुबह एक सुरक्षा पोस्चर ब्रीफ़ जनरेट करता है। यह इंटीग्रेशन प्रति फाइंडिंग पहले के 30 मिनट से दो घंटे के ट्रायज लूप को समाप्त कर देता है, जिससे इंजीनियर कच्चे अलर्टों पर ध्यान देने के बजाय एसेसमेंट का मूल्यांकन करने पर ध्यान केंद्रित कर सकते हैं।

github llama.cpp · 7 दिन पहले

llama.cpp b9788 में dual-GPU सेटअप के लिए SYCL tensor parallelism जोड़ा गया

llama.cpp का release b9788 SYCL backend में --split-mode tensor फ्लैग के माध्यम से tensor parallelism के लिए समर्थन पेश करता है। यह कार्यान्वयन meta-backend में comm_init, comm_free, और comm_allreduce_tensor फ़ंक्शंस जोड़कर dual-GPU संचार को सक्षम बनाता है। दो डिवाइसों के लिए, यह ring all-reduce रणनीति का उपयोग करता है जो छोटे tensors के लिए FP32 direct memcpy और बड़े tensors के लिए BF16 compression के बीच स्विच करता है। OneCCL से बचा जाता है क्योंकि इसकी single-device-per-process सीमा है, इसके बजाय SYCL pool invariants बनाए रखने के लिए persistent buffers का उपयोग किया जाता है। dual Intel Arc Pro B70 GPUs पर प्रदर्शन परीक्षण Llama-3.3-70B और Qwen3-Coder-Next-80B-A3B मॉडल्स के लिए layer mode की तुलना में महत्वपूर्ण गति वृद्धि दिखाते हैं। अपडेट में CPU, CUDA, ROCm, Vulkan, और SYCL लक्ष्यों के लिए macOS, Linux, Windows, Android, और openEuler के लिए नए binaries शामिल हैं।