सभी लेख
media r/LocalLLaMA · अभी अभी लाइव

DGX Spark और Strix Halo के साथ disaggregated prompt प्रोसेसिंग

एक उपयोगकर्ता DGX Spark का उपयोग prefilling के लिए और Strix Halo बॉक्स का उपयोग token जनरेशन के लिए करके एक disaggregated inference pipeline का प्रदर्शन करता है, लंबे-संदर्भ कार्यभारों के लिए महत्वपूर्ण गति वृद्धि हासिल करता है। DGX पर कंप्यूटेशनली इंटेंसिव prompt प्रोसेसिंग को offload करके और decoding के लिए Strix की मेमोरी बैंडविड्थ का लाभ उठाकर, सेटअप Strix पर अकेले चलते समय देखी गई प्रदर्शन ह्रास को दूर करता है।

media r/LocalLLaMA · 15 घंटे पहले

एजेंट्स LLMs के लिए RL पर एक विशाल विकी सहयोगात्मक रूप से लिख रहे हैं (अब तक 200+ पेपर) और कोई भी शामिल हो सकता है

एक सहयोगात्मक परियोजना चल रही है जहां AI एजेंट्स बड़े भाषा मॉडल्स के लिए पुनर्बल सीखने पर एक व्यापक विकी तैयार कर रहे हैं, जिसमें पहले से ही 200 से अधिक शोध पत्रों को संसाधित किया जा चुका है।

media r/LocalLLaMA · 15 घंटे पहले

ओपन सोर्स डेवलपर्स के लिए सराहना का आह्वान करने वाला रेडिट पोस्ट

एक रेडिट उपयोगकर्ता ओपन-सोर्स योगदानकर्ताओं के प्रति कृतज्ञता की महत्वपूर्ण आवश्यकता को उजागर करते हुए, समुदाय प्रयास का एक उत्कृष्ट उदाहरण के रूप में vLLM के हालिया तेज़ अपडेट का हवाला देते हैं।

media r/LocalLLaMA · 15 घंटे पहले

Gemma 4 31b को फिर से बनाना... बेहतर... 26b के रूप में...

एक डेवलपर ने Gemma 4 31B मॉडल को पुनर्निर्माण करने की योजना का विवरण दिया है, जिसमें पैरामीटर की संख्या को लगभग 26B तक कम किया जाएगा, जबकि प्रदर्शन में सुधार का लक्ष्य रखा गया है। इस परियोजना में वास्तुकला में बदलाव, विशिष्ट प्रशिक्षण तकनीकों और डेटासेट चयन शामिल हैं ताकि एक छोटा और अधिक कुशल मॉडल बनाया जा सके।

media r/LocalLLaMA · 17 घंटे पहले

रेडिट उपयोगकर्ता पूछता है कि क्या उबंटु स्थानीय एआई के लिए सबसे संगत लिनक्स डिस्ट्रो है

r/LocalLLaMA समुदाय में एक रेडिट उपयोगकर्ता लिनक्स पर स्विच कर रहा है और यह पुष्टि चाहता है कि क्या उबंटु स्थानीय एआई वर्कलोड चलाने के लिए सर्वोत्तम संगतता प्रदान करता है।

media Hugging Face Forums · 17 घंटे पहले

वेबसाइट डाउनलोड पर Unicode अक्षर समर्थन

Hugging Face वेबसाइट डाटासेट से व्यक्तिगत फ़ाइलें डाउनलोड करते समय, चाहे डाउनलोड बटन के माध्यम से हो या resolve URL के माध्यम से, Unicode अक्षरों को उचित रूप से एन्कोड नहीं कर पाती है।

media Hugging Face Forums · 17 घंटे पहले

क्या LLM एजेंट्स पूर्वदृष्टि विकसित कर सकते हैं?

लेख में तर्क दिया गया है कि वर्तमान LLM एजेंट अक्सर निहित परिणाम जागरूकता के साथ कार्य करते हैं, जो परिणामकारी कार्यों के लिए अपर्याप्त है। यह निष्पादन से पहले जोखिमों को मॉडल करने और प्रभावों की भविष्यवाणी सुनिश्चित करने के लिए एक आवश्यक आर्किटेक्चर परत के रूप में "स्पष्ट पूर्वदृष्टि" का प्रस्ताव देता है।

media Hugging Face Forums · 17 घंटे पहले

ग्राहक सहायता एजेंटों के लिए कौन सा ओपन-सोर्स मॉडल सबसे अच्छा प्रदर्शन करता है?

Hugging Face फोरम पर एक उपयोगकर्ता पूछ रहा है कि AI ग्राहक सहायता चैटबॉट या वर्चुअल असिस्टेंट बनाने के लिए मुफ्त AI मॉडल का सबसे अच्छा विकल्प कौन सा है। पोस्ट में कोई विशिष्ट मॉडल तुलना, परीक्षण परिणाम, या तकनीकी विवरण नहीं हैं।

media Hugging Face Forums · 17 घंटे पहले

Hugging Face में मॉडल्स के लिए डाउनलोड काउंटर त्रुटि

Hugging Face समुदाय फोरम पर एक उपयोगकर्ता ने रिपोर्ट की कि उनके मॉडल रिपॉजिटरी, InternScience/Agents-A1-FP8, के लिए डाउनलोड सांख्यिकी दो दिन पहले अपलोड किए जाने के बावजूद शून्य पर बनी हुई है। उपयोगकर्ता ने नोट किया है कि रिपॉजिटरी में एक config.json फ़ाइल शामिल है और संदेह है कि कोई तकनीकी समस्या काउंटर को अपडेट करने से रोक रही है।

media Hugging Face Forums · 17 घंटे पहले

उपयोगकर्ताओं ने Hugging Face बिलिंग सहायता से प्रतिक्रिया में देरी की रिपोर्ट की

Hugging Face चर्चा मंच पर एक उपयोगकर्ता ने रिपोर्ट की है कि अनधिकृत सदस्यता के संबंध में उनकी बिलिंग सहायता को ईमेल का कोई उत्तर नहीं मिला। व्यक्ति यादृच्छिक शुल्क के लिए रिफंड की तलाश कर रहा है और संपर्क करने के बावजूद संचार की कमी पर ध्यान दिलाता है।

media Hugging Face Forums · 17 घंटे पहले

डेटासेट डेल्टा का पता लगाने और प्राप्त करने के लिए सर्वोत्तम अभ्यास

Hugging Face फोरम पर एक उपयोगकर्ता नए डेटा के जुड़ने या डेटासेट अपडेट होने का पता लगाने के लिए कुशल तरीकों की मांग करता है, पूरे डेटासेट को फिर से प्रोसेस किए बिना पाइपलाइन को ट्रिगर करने के उद्देश्य से।

media r/LocalLLaMA · 17 घंटे पहले

PrismML का 1-bit Bonsai-8B व्याकरण के साथ CPU पर टूल कॉलिंग में IBM Granite को हराता है

IBM Granite और अन्य LLMs के खिलाफ PrismML के 1-bit Bonsai-8B मॉडल का एक बेंचमार्क यह दर्शाता है कि व्याकरण-बाध्यकारी डिकोडिंग का उपयोग करते समय Bonsai-8B टूल कॉलिंग में उच्चतम सटीकता प्राप्त करता है। परीक्षण, llama.cpp का उपयोग करके CPU पर किया गया, आउटपुट बाधाओं के महत्वपूर्ण भूमिका को उजागर करता है जो छोटे, क्वांटाइज्ड मॉडलों को एजेंट कार्यों के लिए प्रभावी ढंग से काम करने की अनुमति देता है।

media r/LocalLLaMA · 17 घंटे पहले

लेमोनेड एसडीके ने स्थानीय मल्टीमीडिया रोल-प्लेइंग के लिए RPG-HaloTales-V1 जारी किया

लेमोनेड एसडीके ने एक नया मॉडल RPG-HaloTales-V1 जारी किया है, जिसे स्थानीय रूप से चलाने योग्य मल्टीमीडिया रोल-प्लेइंग अनुभव प्रदान करने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 17 घंटे पहले

NPC-से-NPC संवादों के लिए ओपन-सोर्स लोकल LLM NPC बैकएंड

लेखक ने एक पूरी तरह से लोकल, ओपन-सोर्स स्पीच-टू-स्पीच बैकएंड जारी किया है जो Large Language Model NPCs के लिए डिज़ाइन किया गया है और क्लाउड निर्भरता के बिना सीधे NPC-से-NPC इंटरैक्शन को सक्षम बनाता है। सिस्टम स्पीच-टू-टेक्स्ट, एक लोकल LLM, और टेक्स्ट-टू-स्पीच घटकों को एकीकृत करता है ताकि NPCs एक-दूसरे से बात कर सकें, संदर्भ बनाए रख सकें और भविष्य के खिलाड़ी इंटरैक्शन को प्रभावित कर सकें।

media r/LocalLLaMA · 18 घंटे पहले

3x सेटअप के लिए बेस्ट कोडिंग मॉडल?

एक उपयोगकर्ता समर्पित हार्डवेयर सेटअप पर चलाने के लिए सर्वोत्तम कोडिंग मॉडल के लिए सिफारिशें खोज रहा है, जिसमें तीन Asus Ascent GX10 (GB10) इकाइयाँ शामिल हैं, और 5-10 उपयोगकर्ताओं के लिए कन्करेंसी की उम्मीद है।

media r/LocalLLaMA · 18 घंटे पहले

Hugging Face से Andi ने Gemma 4 31B का उपयोग करके पूरी तरह से ओपन-सोर्स वॉइस पाइपलाइन का प्रदर्शन किया

Hugging Face से Andi ने एक पूरी तरह से ओपन-सोर्स और मुफ्त-उपयोग वाली डेमो जारी की है जो एक वॉइस इंटरैक्शन पाइपलाइन बनाती है। सिस्टम Nvidia parakeet, Cerebras द्वारा संचालित Gemma 4 31B मॉडल, और Qwen3TTS के लिए कस्टम इनफरेंस को एकीकृत करता है।

media r/LocalLLaMA · 18 घंटे पहले

Z.ai ने AI कोडिंग में Cursor, Claude Code और GitHub Copilot को चुनौती देने के लिए ZCode लॉन्च किया

Z.ai ने ZCode पेश किया है, जो एक नया AI कोडिंग टूल है जिसे Cursor, Claude Code और GitHub Copilot जैसे स्थापित प्लेटफार्मों के साथ प्रतिस्पर्धा करने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 18 घंटे पहले

Windows XP पर एजेंटिक AI के लिए SimpleLLMChat 1.2.5 अपडेट

डेवलपर ने SimpleLLMChat का संस्करण 1.2.5 जारी किया है, जो एक एजेंटिक AI हार्नेस है जो Windows XP और .NET 4.0 का उपयोग करने वाले पुराने मशीनों पर चलने के लिए डिज़ाइन किया गया है।