सभी लेख
media r/LocalLLaMA · 11 घंटे पहले

रेडिट उपयोगकर्ता पूछता है कि क्या उबंटु स्थानीय एआई के लिए सबसे संगत लिनक्स डिस्ट्रो है

r/LocalLLaMA समुदाय में एक रेडिट उपयोगकर्ता लिनक्स पर स्विच कर रहा है और यह पुष्टि चाहता है कि क्या उबंटु स्थानीय एआई वर्कलोड चलाने के लिए सर्वोत्तम संगतता प्रदान करता है।

media Hugging Face Forums · 11 घंटे पहले

वेबसाइट डाउनलोड पर Unicode अक्षर समर्थन

Hugging Face वेबसाइट डाटासेट से व्यक्तिगत फ़ाइलें डाउनलोड करते समय, चाहे डाउनलोड बटन के माध्यम से हो या resolve URL के माध्यम से, Unicode अक्षरों को उचित रूप से एन्कोड नहीं कर पाती है।

media Hugging Face Forums · 11 घंटे पहले

क्या LLM एजेंट्स पूर्वदृष्टि विकसित कर सकते हैं?

लेख में तर्क दिया गया है कि वर्तमान LLM एजेंट अक्सर निहित परिणाम जागरूकता के साथ कार्य करते हैं, जो परिणामकारी कार्यों के लिए अपर्याप्त है। यह निष्पादन से पहले जोखिमों को मॉडल करने और प्रभावों की भविष्यवाणी सुनिश्चित करने के लिए एक आवश्यक आर्किटेक्चर परत के रूप में "स्पष्ट पूर्वदृष्टि" का प्रस्ताव देता है।

media Hugging Face Forums · 11 घंटे पहले

ग्राहक सहायता एजेंटों के लिए कौन सा ओपन-सोर्स मॉडल सबसे अच्छा प्रदर्शन करता है?

Hugging Face फोरम पर एक उपयोगकर्ता पूछ रहा है कि AI ग्राहक सहायता चैटबॉट या वर्चुअल असिस्टेंट बनाने के लिए मुफ्त AI मॉडल का सबसे अच्छा विकल्प कौन सा है। पोस्ट में कोई विशिष्ट मॉडल तुलना, परीक्षण परिणाम, या तकनीकी विवरण नहीं हैं।

media Hugging Face Forums · 11 घंटे पहले

Hugging Face में मॉडल्स के लिए डाउनलोड काउंटर त्रुटि

Hugging Face समुदाय फोरम पर एक उपयोगकर्ता ने रिपोर्ट की कि उनके मॉडल रिपॉजिटरी, InternScience/Agents-A1-FP8, के लिए डाउनलोड सांख्यिकी दो दिन पहले अपलोड किए जाने के बावजूद शून्य पर बनी हुई है। उपयोगकर्ता ने नोट किया है कि रिपॉजिटरी में एक config.json फ़ाइल शामिल है और संदेह है कि कोई तकनीकी समस्या काउंटर को अपडेट करने से रोक रही है।

media Hugging Face Forums · 11 घंटे पहले

उपयोगकर्ताओं ने Hugging Face बिलिंग सहायता से प्रतिक्रिया में देरी की रिपोर्ट की

Hugging Face चर्चा मंच पर एक उपयोगकर्ता ने रिपोर्ट की है कि अनधिकृत सदस्यता के संबंध में उनकी बिलिंग सहायता को ईमेल का कोई उत्तर नहीं मिला। व्यक्ति यादृच्छिक शुल्क के लिए रिफंड की तलाश कर रहा है और संपर्क करने के बावजूद संचार की कमी पर ध्यान दिलाता है।

media Hugging Face Forums · 11 घंटे पहले

डेटासेट डेल्टा का पता लगाने और प्राप्त करने के लिए सर्वोत्तम अभ्यास

Hugging Face फोरम पर एक उपयोगकर्ता नए डेटा के जुड़ने या डेटासेट अपडेट होने का पता लगाने के लिए कुशल तरीकों की मांग करता है, पूरे डेटासेट को फिर से प्रोसेस किए बिना पाइपलाइन को ट्रिगर करने के उद्देश्य से।

media r/LocalLLaMA · 11 घंटे पहले

PrismML का 1-bit Bonsai-8B व्याकरण के साथ CPU पर टूल कॉलिंग में IBM Granite को हराता है

IBM Granite और अन्य LLMs के खिलाफ PrismML के 1-bit Bonsai-8B मॉडल का एक बेंचमार्क यह दर्शाता है कि व्याकरण-बाध्यकारी डिकोडिंग का उपयोग करते समय Bonsai-8B टूल कॉलिंग में उच्चतम सटीकता प्राप्त करता है। परीक्षण, llama.cpp का उपयोग करके CPU पर किया गया, आउटपुट बाधाओं के महत्वपूर्ण भूमिका को उजागर करता है जो छोटे, क्वांटाइज्ड मॉडलों को एजेंट कार्यों के लिए प्रभावी ढंग से काम करने की अनुमति देता है।

media r/LocalLLaMA · 11 घंटे पहले

लेमोनेड एसडीके ने स्थानीय मल्टीमीडिया रोल-प्लेइंग के लिए RPG-HaloTales-V1 जारी किया

लेमोनेड एसडीके ने एक नया मॉडल RPG-HaloTales-V1 जारी किया है, जिसे स्थानीय रूप से चलाने योग्य मल्टीमीडिया रोल-प्लेइंग अनुभव प्रदान करने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 11 घंटे पहले

NPC-से-NPC संवादों के लिए ओपन-सोर्स लोकल LLM NPC बैकएंड

लेखक ने एक पूरी तरह से लोकल, ओपन-सोर्स स्पीच-टू-स्पीच बैकएंड जारी किया है जो Large Language Model NPCs के लिए डिज़ाइन किया गया है और क्लाउड निर्भरता के बिना सीधे NPC-से-NPC इंटरैक्शन को सक्षम बनाता है। सिस्टम स्पीच-टू-टेक्स्ट, एक लोकल LLM, और टेक्स्ट-टू-स्पीच घटकों को एकीकृत करता है ताकि NPCs एक-दूसरे से बात कर सकें, संदर्भ बनाए रख सकें और भविष्य के खिलाड़ी इंटरैक्शन को प्रभावित कर सकें।

media r/LocalLLaMA · 12 घंटे पहले

3x सेटअप के लिए बेस्ट कोडिंग मॉडल?

एक उपयोगकर्ता समर्पित हार्डवेयर सेटअप पर चलाने के लिए सर्वोत्तम कोडिंग मॉडल के लिए सिफारिशें खोज रहा है, जिसमें तीन Asus Ascent GX10 (GB10) इकाइयाँ शामिल हैं, और 5-10 उपयोगकर्ताओं के लिए कन्करेंसी की उम्मीद है।

media r/LocalLLaMA · 12 घंटे पहले

Hugging Face से Andi ने Gemma 4 31B का उपयोग करके पूरी तरह से ओपन-सोर्स वॉइस पाइपलाइन का प्रदर्शन किया

Hugging Face से Andi ने एक पूरी तरह से ओपन-सोर्स और मुफ्त-उपयोग वाली डेमो जारी की है जो एक वॉइस इंटरैक्शन पाइपलाइन बनाती है। सिस्टम Nvidia parakeet, Cerebras द्वारा संचालित Gemma 4 31B मॉडल, और Qwen3TTS के लिए कस्टम इनफरेंस को एकीकृत करता है।

media r/LocalLLaMA · 12 घंटे पहले

Z.ai ने AI कोडिंग में Cursor, Claude Code और GitHub Copilot को चुनौती देने के लिए ZCode लॉन्च किया

Z.ai ने ZCode पेश किया है, जो एक नया AI कोडिंग टूल है जिसे Cursor, Claude Code और GitHub Copilot जैसे स्थापित प्लेटफार्मों के साथ प्रतिस्पर्धा करने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 12 घंटे पहले

Windows XP पर एजेंटिक AI के लिए SimpleLLMChat 1.2.5 अपडेट

डेवलपर ने SimpleLLMChat का संस्करण 1.2.5 जारी किया है, जो एक एजेंटिक AI हार्नेस है जो Windows XP और .NET 4.0 का उपयोग करने वाले पुराने मशीनों पर चलने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 12 घंटे पहले

आपके RAG में क्या है?

एक रेडिट उपयोगकर्ता कोडिंग, सिस्टम एडमिन काम और छोटे कोडबेस वाले व्यक्तिगत परियोजनाओं के लिए रेट्रीवल-एंगमेंटेड जनरेशन (RAG) की व्यावहारिक उपयोगिता पर सवाल उठाते हैं। लेखक का तर्क है कि मानक उद्योग ज्ञान मॉडल द्वारा पहले से ही अच्छी तरह से कवर किया गया है, जबकि विशिष्ट डेटा स्रोत जैसे कोडबेस या API संदर्भ या तो इंडेक्सिंग की आवश्यकता के लिए बहुत छोटे हैं या प्रभावी ढंग से प्रबंधित करने के लिए बहुत बड़े हैं।

media r/LocalLLaMA · 12 घंटे पहले

Palantir के CEO ने बंद मॉडलों के खिलाफ गुस्सा किया

Palantir के CEO अलेक्स कार्प ने Anthropic और OpenAI को ग्राहकों से अधिक शुल्क लेने और उनके डेटा का दुरुपयोग करने के लिए सार्वजनिक रूप से आलोचित किया। यह स्थिति तब आई जब Palantir ने हाल ही में अपने एंटरप्राइज़ क्लाइंट्स के लिए स्थानीय मॉडल चलाने के लिए Nvidia चिप्स खरीदने का समझौता किया है।

media r/LocalLLaMA · 12 घंटे पहले

विश्वसनीय संरचित आउटपुट के लिए एक सस्ता ट्रिक: पुनः प्रयास में मान्यता त्रुटि को वापस फीड करें

बड़े भाषा मॉडल से संरचित आउटपुट उत्पन्न करते समय विश्वसनीयता को बेहतर बनाने के लिए, एक विधि प्रस्तावित की गई है जो पुनः प्रयासों के दौरान मान्यता त्रुटियों और मॉडल के पिछले आउटपुट को वापस प्रॉम्प्ट में फीड करती है। यह दृष्टिकोण यादृच्छिक प्रतिक्रियाओं को फिर से रोल करने की प्रक्रिया को पिछले प्रयास को संपादित करके विशिष्ट त्रुटियों को स्वयं-सुधारने में बदल देता है।

media Hugging Face Forums · 17 घंटे पहले

रिपोर्ट किए गए ZeroGPU स्लॉट और सूचीबद्ध स्पेस के बीच असंगति

एक उपयोगकर्ता को एक क्वाटा त्रुटि का सामना करना पड़ा जिसमें कहा गया था कि 10 की सीमा के मुकाबले 17 ZeroGPU स्लॉट उपयोग में थे, भले ही केवल 8 स्पेस zero-a10g हार्डवेयर का अनुरोध कर रहे थे।