सभी लेख
media Hugging Face Forums · 8 दिन पहले

Hugging Face पर संगठन का नाम बदलने की प्रक्रिया के बारे में उपयोगकर्ता ने पूछा

एक उपयोगकर्ता ने Hugging Face चर्चा मंच पर एक संगठन का नाम बदलने में सहायता मांगते हुए पोस्ट किया। व्यक्ति ने कहा कि उन्होंने 15 जून को website@huggingface.co को DZER-Studios से Vexion-LM में बदलाव की अनुरोध करते हुए एक ईमेल भेजा था। प्रारंभिक अनुरोध भेजने के बावजूद, उपयोगकर्ता ने रिपोर्ट किया कि उन्हें कोई जवाब नहीं मिला और उन्होंने देखा कि संगठन का नाम अपरिवर्तित बना रहा। परिणामस्वरूप, पोस्टर ने पूछा कि क्या प्लेटफ़ॉर्म अभी भी संगठन के नाम बदलने का समर्थन करता है। उन्होंने इस विशिष्ट प्रशासनिक अनुरोध के संबंध में टीम से संपर्क करने के वैकल्पिक तरीकों पर मार्गदर्शन भी मांगा।

media Hugging Face Forums · 8 दिन पहले

मॉडल बेंचमार्किंग विधियों पर सामुदायिक जांच

Hugging Face चर्चा मंच पर एक उपयोगकर्ता ने मशीन लर्निंग मॉडल का बेंचमार्क कैसे करें, इसके बारे में सलाह मांगते हुए एक प्रश्न पोस्ट किया। यह पूछताछ फाइन-ट्यूनिंग के क्षेत्र में नए व्यक्ति द्वारा शुरू की गई थी, जो अपने मॉडल को पूर्ण होने के बाद मूल्यांकन करना चाहता है। पोस्ट में स्पष्ट रूप से इस उद्देश्य के लिए सामुदायिक द्वारा उपयोग किए जाने वाले स्थापित तरीकों या रणनीतियों के बारे में पूछा गया है। यह मॉडल विकास में मानक मूल्यांकन अभ्यासों को समझने की व्यावसायिकों के बीच एक सामान्य आवश्यकता को उजागर करता है। चर्चा थ्रेड में वर्तमान में केवल एक भाग लेने वाले से एक पोस्ट है। स्रोत की दृश्य सामग्री के भीतर कोई विशिष्ट बेंचमार्क, मेट्रिक या तकनीकी समाधान प्रदान नहीं किए गए हैं।

media Hugging Face Forums · 8 दिन पहले

Qwen3/Gemma3 Candle CPU मोड में समान-लंबाई वाले बैचों के लिए एटेंशन मास्क को छोड़ देता है

एक उपयोगकर्ता ने Hugging Face text-embeddings-inference लाइब्रेरी में Qwen3 और Gemma3 मॉडलों को प्रभावित करने वाली एक गंभीर बग की रिपोर्ट की है। यह समस्या तब उत्पन्न होती है जब CPU पर समवर्ती अनुरोधों के साथ इनफरेंस चलाया जाता है, जिससे महत्वपूर्ण सटीकता में कमी आती है। विशेष रूप से, Candle बैकएंड उन बैचों के लिए एटेंशन मास्क को गलत तरीके से छोड़ देता है जिनमें सभी इनपुट अनुक्रम समान लंबाई के होते हैं। यह दोष इन विशिष्ट स्थितियों के तहत उत्पन्न एम्बेडिंग्स की विश्वसनीयता को कमजोर करता है। इस समस्या को हल करने के लिए, लेखक ने एक पल रिक्वेस्ट जमा की जिसमें एक ठोस समाधान था जिसे उनके स्थानीय मशीनों पर व्यापक रूप से परखा गया। यह बग बैच्ड इनपुट्स हैंडल करते समय CPU-आधारित एम्बेडिंग सेवाओं में संभावित स्थिरता जोखिमों को उजागर करता है।

github CrewAI · 8 दिन पहले

v1.14.8a4 रिलीज़ नोट्स

v1.14.8a4 में CLI TUI में कनवर्सेशनल फ्लो सपोर्ट जोड़ा गया है। इसमें स्किल आर्काइव एक्सट्रैक्शन और डेक्लेरेटिव फ्लो डिफिनिशन पथ्स की वैलिडेशन के दौरान सिम्लंक पथ ट्रावर्सल के लिए फिक्स शामिल हैं। v1.14.8a3 के लिए दस्तावेज़ अपडेट किए गए हैं।

github llama.cpp · 8 दिन पहले

LLaMA.cpp Release b9784: Hexagon MM Optimizations और Cross-Platform Binaries

LLaMA.cpp ने hexagon-आधारित MM ऑपरेशन के लिए प्रमुख अनुकूलन के साथ संस्करण b9784 जारी किया है, जिसमें 32x32 टाइल्ड वेट रीपैक, सुधारा हुआ dyn.quant हैंडलिंग और एकीकृत kernel पैरामीटर प्रबंधन शामिल हैं। इस रिलीज में macOS (arm64 और x64), iOS, और Vulkan, ROCm, और OpenVINO के साथ कई Linux आर्किटेक्चर के लिए नए binaries शामिल हैं।

github llama.cpp · 8 दिन पहले

llama.cpp ने b9782 नए बाइनरी और समर्थन के साथ जारी किया

llama.cpp ने संस्करण b9782 जारी किया, जिसमें macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी शामिल हैं। इस रिलीज में कई आर्किटेक्चर पर Vulkan, OpenVINO, SYCL, ROCm, और CUDA के लिए समर्थन जोड़ा गया है, साथ ही अपडेटेड UI और KleidiAI व openEuler समर्थन जैसे फीचर्स को अक्षम किया गया है।

lab Google DeepMind Blog · 8 दिन पहले

जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ क्षमता जोड़ी गई

गूगल ने जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ पेश किया है, जिससे मॉडल कोड निष्पादित कर सकता है और बाहरी टूल्स के साथ इंटरैक्ट कर सकता है। इस सुविधा से उपयोगकर्ता प्रोग्रामिंग कार्य चला सकते हैं और एकीकृत कंप्यूटिंग फंक्शन्स के माध्यम से रियल-टाइम जानकारी तक पहुंच सकते हैं।

lab Hugging Face Blog · 8 दिन पहले

FFASR लीडरबोर्ड का परिचय: वास्तविक दुनिया में ASR का बेंचमार्किंग

वास्तविक दुनिया की स्थितियों में वॉइस रिकग्निशन सिस्टम का मूल्यांकन करने के लिए FFASR लीडरबोर्ड शुरू किया गया था। यह विविध वातावरण और उपयोग मामलों में स्वचालित वॉइस रिकग्निशन मॉडल के प्रदर्शन का आकलन करने के लिए एक बेंचमार्क प्रदान करता है।

lab Hugging Face Blog · 8 दिन पहले

NVIDIA NeMo AutoModel ट्रान्सफॉर्मर फाइन-ट्यूनिंग को तेज करता है

NVIDIA का NeMo AutoModel मॉडल चयन और अनुकूलन को स्वचालित करके ट्रान्सफॉर्मर मॉडल्स के फाइन-ट्यूनिंग को तेज बनाता है। यह विकास समय को कम करता है और NVIDIA हार्डवेयर पर बड़े भाषा मॉडल (LLMs) के प्रशिक्षण में दक्षता बढ़ाता है।

github llama.cpp · 8 दिन पहले

llama.cpp ने Vulkan और मल्टी-प्लेटफ़ॉर्म सपोर्ट के साथ b9781 जारी किया

llama.cpp ने Linux और Windows के लिए Vulkan सपोर्ट जोड़ते हुए, macOS, Linux, Android, और Windows पर ARM64 और x64 सहित कई आर्किटेक्चरों का विस्तार करते हुए संस्करण b9781 जारी किया। इस रिलीज़ में CPU, CUDA, OpenVINO, SYCL, और ROCm बिल्ड्स शामिल हैं, साथ ही एक UI कंपोनेंट भी उपलब्ध है।

lab Mistral AI News · 8 दिन पहले

एंटरप्राइज सुरक्षा और एक्सेस के लिए नए कनेक्टर नियंत्रण

Mistral Studio अब प्रत्येक वर्कस्पेस और टूल के लिए कनेक्टर एक्सेस को शासित करने के लिए समृद्ध एडमिन नियंत्रण प्रदान करता है, जिसमें सूक्ष्म-स्तर की अनुमतियां शामिल हैं। इसमें स्कॉप्स के साथ API कुंजियां, मल्टी-अकाउंट कनेक्टर्स और रूट कारण विश्लेषण के लिए एक नया Connectors डीबगर शामिल हैं, जो सभी एंटरप्राइज सिस्टम के साथ सुरक्षित और ऑडिट करने योग्य इंटीग्रेशन का समर्थन करते हैं।

lab Microsoft Research Blog · 8 दिन पहले

Talos: दुर्लभ रोग निदान के लिए स्वचालित जीनोमिक पुनर्विश्लेषण

Talos एक ओपन-सोर्स टूल है जो दुर्लभ रोग निदान की पहचान के लिए जीनोमिक डेटा का आवर्ती पुनर्विश्लेषण स्वचालित करता है। इसने केवल 1.3 उम्मीदवार वेरिएंट्स प्रति मरीज के साथ स्कोप में आने वाले निदानों की 90% पुनः प्राप्ति दर हासिल की, और 5,000 अनिर्धारित मरीजों में 241 नए निदान प्रदान किए, जिनमें से अधिकांश नई खोजें साक्ष्य के प्रकाशन के 32 दिनों के भीतर सामने आईं।

media Hugging Face Forums · 8 दिन पहले

Aiden मोबाइल एजेंट प्रोटोटाइप बनाया जा रहा है

Aiden एक भौतिक AI एजेंट डिवाइस है जो HDMI के माध्यम से फोन की स्क्रीन की निगरानी करता है और USB HID के माध्यम से इसे नियंत्रित करता है, जिससे जेलब्रेक या इंस्टॉल किए गए सॉफ़्टवेयर के बिना ऐप ऑटोमेशन संभव होता है। यह अपने LLMs का समर्थन करता है, बैकएंड बुनियादी ढांचे या डेटा संग्रह के बिना काम करता है, और AGPL लाइसेंस के तहत एक ओपन-सोर्स डेवलपमेंट बोर्ड के रूप में जारी किया गया है।

lab OpenAI News · 8 दिन पहले

OpenAI और Broadcom ने LLM-अनुकूलित इनफरेंस चिप का अनावरण किया

OpenAI और Broadcom ने Jalapeño पेश किया है, जो बड़े भाषा मॉडल इनफरेंस के लिए डिज़ाइन किया गया एक कस्टम AI चिप है। इस चिप का उद्देश्य AI सिस्टम में प्रदर्शन, दक्षता और स्केलेबिलिटी को बढ़ाना है।

github llama.cpp · 8 दिन पहले

vulkan-shaders-gen अब शेडर कंपाइलेशन त्रुटियों पर बिल्ड विफल हो जाता है

vulkan-shaders-gen टूल अब शेडर कंपाइलेशन विफल होने पर बिल्ड को विफल कर देता है, जिससे एक दोषपूर्ण libggml-vulkan का निर्माण रोका जाता है। यह सुधार उस पूर्व की समस्या को हल करता है जहां सफल बिल्ड रनटाइम विफलताओं को छिपा रहा था, और इसमें प्लेटफॉर्म भर में त्रुटि हैंडलिंग और एटॉमिक फ्लैग प्रबंधन में सुधार शामिल हैं।

github llama.cpp · 8 दिन पहले

LLaMA.cpp Release b9777 में नए मॉडल और क्रॉस-प्लेटफ़ॉर्म बाइनरी शामिल हैं

LLaMA.cpp release b9777 ने LFM2.5-ColBERT-350M और LFM2.5-Embedding-350M मॉडल जोड़े हैं। इस रिलीज़ में macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ट बाइनरी शामिल हैं, जो CUDA, Vulkan, OpenVINO, और SYCL जैसे विभिन्न आर्किटेक्चर और एक्सेलरेशन तकनीकों का समर्थन करती हैं।

github vLLM · 8 दिन पहले

v0.24.0rc1: SM75 पर topk histogram बिल्ड को ठीक करें

vllm ने v0.24.0rc1 जारी किया, जिसमें SM75 पर topk histogram बिल्ड समस्याओं के लिए एक सुधार शामिल है। यह परिवर्तन commit 191826e से cherry-picked किया गया है और Mohammad Miadh Angkad द्वारा signed off किया गया है।

media Hugging Face Forums · 8 दिन पहले

मैंने AI एजेंट्स के लिए Go में एक MCP सर्वर बनाया - 200 लाइनों का ट्यूटोरियल

Go की संवादक्षमता और सरलता का उपयोग करके एक हल्के मॉडल कॉन्टेक्स्ट प्रोटोकॉल सर्वर बनाने को दर्शाता है 200-लाइन वाला Go ट्यूटोरियल। यह सर्वर Claude जैसे AI एजेंट्स को संरचित डेटा और Go एप्लिकेशन तक पहुंचने की अनुमति देता है, जिससे वे 10 गुना अधिक उपयोगी हो सकते हैं।

media Hugging Face Forums · 8 दिन पहले

स्थानीय उपयोग और MCP के साथ Unity में काम करने के लिए सर्वश्रेष्ठ मॉडल, 12 GB VRAM पर

एक उपयोगकर्ता Unity 6.5 और MCP के लिए अनुकूलित एक हल्का LLM खोज रहे हैं, जो 12 GB VRAM के भीतर काम करता है। वे वर्तमान में Cursor और Claude के मुफ्त स्तरों पर निर्भर हैं लेकिन उन्हें अपर्याप्त पाते हैं, यह पूछते हुए कि क्या कोई विशेष मॉडल मौजूद हैं या वैकल्पिक समाधान उपलब्ध हैं।