सभी लेख
media r/LocalLLaMA · 6 घंटे पहले

NPC-से-NPC संवादों के लिए ओपन-सोर्स लोकल LLM NPC बैकएंड

लेखक ने एक पूरी तरह से लोकल, ओपन-सोर्स स्पीच-टू-स्पीच बैकएंड जारी किया है जो Large Language Model NPCs के लिए डिज़ाइन किया गया है और क्लाउड निर्भरता के बिना सीधे NPC-से-NPC इंटरैक्शन को सक्षम बनाता है। सिस्टम स्पीच-टू-टेक्स्ट, एक लोकल LLM, और टेक्स्ट-टू-स्पीच घटकों को एकीकृत करता है ताकि NPCs एक-दूसरे से बात कर सकें, संदर्भ बनाए रख सकें और भविष्य के खिलाड़ी इंटरैक्शन को प्रभावित कर सकें।

media r/LocalLLaMA · 8 घंटे पहले

Hugging Face से Andi ने Gemma 4 31B का उपयोग करके पूरी तरह से ओपन-सोर्स वॉइस पाइपलाइन का प्रदर्शन किया

Hugging Face से Andi ने एक पूरी तरह से ओपन-सोर्स और मुफ्त-उपयोग वाली डेमो जारी की है जो एक वॉइस इंटरैक्शन पाइपलाइन बनाती है। सिस्टम Nvidia parakeet, Cerebras द्वारा संचालित Gemma 4 31B मॉडल, और Qwen3TTS के लिए कस्टम इनफरेंस को एकीकृत करता है।

media r/LocalLLaMA · 8 घंटे पहले

Z.ai ने AI कोडिंग में Cursor, Claude Code और GitHub Copilot को चुनौती देने के लिए ZCode लॉन्च किया

Z.ai ने ZCode पेश किया है, जो एक नया AI कोडिंग टूल है जिसे Cursor, Claude Code और GitHub Copilot जैसे स्थापित प्लेटफार्मों के साथ प्रतिस्पर्धा करने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 8 घंटे पहले

Windows XP पर एजेंटिक AI के लिए SimpleLLMChat 1.2.5 अपडेट

डेवलपर ने SimpleLLMChat का संस्करण 1.2.5 जारी किया है, जो एक एजेंटिक AI हार्नेस है जो Windows XP और .NET 4.0 का उपयोग करने वाले पुराने मशीनों पर चलने के लिए डिज़ाइन किया गया है।

media r/LocalLLaMA · 8 घंटे पहले

आपके RAG में क्या है?

एक रेडिट उपयोगकर्ता कोडिंग, सिस्टम एडमिन काम और छोटे कोडबेस वाले व्यक्तिगत परियोजनाओं के लिए रेट्रीवल-एंगमेंटेड जनरेशन (RAG) की व्यावहारिक उपयोगिता पर सवाल उठाते हैं। लेखक का तर्क है कि मानक उद्योग ज्ञान मॉडल द्वारा पहले से ही अच्छी तरह से कवर किया गया है, जबकि विशिष्ट डेटा स्रोत जैसे कोडबेस या API संदर्भ या तो इंडेक्सिंग की आवश्यकता के लिए बहुत छोटे हैं या प्रभावी ढंग से प्रबंधित करने के लिए बहुत बड़े हैं।

media r/LocalLLaMA · 8 घंटे पहले

Palantir के CEO ने बंद मॉडलों के खिलाफ गुस्सा किया

Palantir के CEO अलेक्स कार्प ने Anthropic और OpenAI को ग्राहकों से अधिक शुल्क लेने और उनके डेटा का दुरुपयोग करने के लिए सार्वजनिक रूप से आलोचित किया। यह स्थिति तब आई जब Palantir ने हाल ही में अपने एंटरप्राइज़ क्लाइंट्स के लिए स्थानीय मॉडल चलाने के लिए Nvidia चिप्स खरीदने का समझौता किया है।

media r/LocalLLaMA · 8 घंटे पहले

विश्वसनीय संरचित आउटपुट के लिए एक सस्ता ट्रिक: पुनः प्रयास में मान्यता त्रुटि को वापस फीड करें

बड़े भाषा मॉडल से संरचित आउटपुट उत्पन्न करते समय विश्वसनीयता को बेहतर बनाने के लिए, एक विधि प्रस्तावित की गई है जो पुनः प्रयासों के दौरान मान्यता त्रुटियों और मॉडल के पिछले आउटपुट को वापस प्रॉम्प्ट में फीड करती है। यह दृष्टिकोण यादृच्छिक प्रतिक्रियाओं को फिर से रोल करने की प्रक्रिया को पिछले प्रयास को संपादित करके विशिष्ट त्रुटियों को स्वयं-सुधारने में बदल देता है।

media Hugging Face Forums · 13 घंटे पहले

रिपोर्ट किए गए ZeroGPU स्लॉट और सूचीबद्ध स्पेस के बीच असंगति

एक उपयोगकर्ता को एक क्वाटा त्रुटि का सामना करना पड़ा जिसमें कहा गया था कि 10 की सीमा के मुकाबले 17 ZeroGPU स्लॉट उपयोग में थे, भले ही केवल 8 स्पेस zero-a10g हार्डवेयर का अनुरोध कर रहे थे।

media Hugging Face Forums · 13 घंटे पहले

Azure पर SAM3 को डिप्लॉय करते समय उपयोगकर्ता SecretsInjectionError का सामना करता है

एक उपयोगकर्ता ने Hugging Face Foundry उदाहरण का उपयोग करके Microsoft Azure पर Meta SAM3 मॉडल को डिप्लॉय करने का प्रयास करते हुए SecretsInjectionError का सामना करने की रिपोर्ट की है। यह त्रुटि डिप्लॉय किए गए API को कॉल करते समय सेटअप और इंस्टॉलेशन चरण के दौरान होती है।

media Hugging Face Forums · 13 घंटे पहले

NanoI2V: शून्य से एक Image-to-Video मॉडल बनाना

NanoI2V एक ओपन-सोर्स प्रोजेक्ट है जो शून्य से एक Image-to-Video जनरेशन मॉडल को लागू करता है, जिसका उद्देश्य आधुनिक वीडियो जनरेशन तकनीकों के लिए एक स्वच्छ और शैक्षिक संदर्भ प्रदान करना है। रिपॉजिटरी अधिकांश स्टेट-ऑफ़-द-आर्ट प्रोजेक्ट्स में पाई जाने वाली जटिलता की तुलना में पठनीयता और पुनरुत्पादन को प्राथमिकता देती है।

media Hugging Face Forums · 13 घंटे पहले

HuggingFace पर अपनी शोध को कैसे प्रकाशित करें?

Hugging Face फोरम पर एक उपयोगकर्ता अपने शोध परियोजना, TIS (टोकन इम्पोर्टेंस स्कोरिंग), और उसके संबंधित कोड और दस्तावेज़ों को उचित रूप से प्रकाशित करने के बारे में मार्गदर्शन की खोज कर रहा है।

github Goose (Block) · 13 घंटे पहले

Goose v1.40.0 रिलीज नोट्स

Goose v1.40.0 अपडेट डेस्कटॉप एप्लिकेशन के लिए व्यापक स्थानीयकरण समर्थन पेश करता है, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, इंडोनेशियाई, मलय, वियतनामी, परंपरागत चीनी, कोरियाई, जापानी, स्पैनिश और हिंदी के लिए भाषा समर्थन जोड़ता है।

media Hugging Face Forums · 19 घंटे पहले

Show HF: ServBay, कोडिंग एजेंट्स के लिए एक लोकल-फर्स्ट रनटाइम और AI गेटवे

ServBay को एक लोकल-फर्स्ट रनटाइम और इंफ्रास्ट्रक्चर समाधान के रूप में पेश किया गया है, जो AI कोडिंग एजेंट्स और उपयोगकर्ता की होस्ट मशीन के बीच के अंतर को पूरा करने के लिए डिज़ाइन किया गया है। यह उस "आखिरी मील" की समस्या को हल करता है, जहाँ बुद्धिमान एजेंट्स डेटाबेस, डोमेन्स या SSL प्रमाणपत्रों को कॉन्फ़िगर करने के लिए सिस्टम-लेवल क्षमताओं से वंचित होते हैं और इसके लिए मैन्युअल डेवलपर हस्तक्षेप की आवश्यकता होती है।

media Hugging Face Forums · 19 घंटे पहले

प्रिज़्म ट्रान्सफॉर्मर: हियरार्किकल एटेंशन प्रोसेसिंग के लिए प्रोग्रेसिव हेड शेड्यूल

प्रिज़्म ट्रान्सफॉर्मर एक प्रोग्रेसिव हेड शेड्यूल पेश करता है जो परतों में ध्यान देने वाले हेड की संख्या को बदलता है, जहां शुरुआती परतों में कम, चौड़े हेड होते हैं और गहराई के साथ उनकी संख्या क्रमिक रूप से बढ़ती है। यह दृष्टिकोण प्रारंभिक और बाद की परतों की अलग-अलग संरचनात्मक आवश्यकताओं को पूरा करते हुए, बिना किसी आर्किटेक्चरल ओवरहेड के, मानक समान वितरण को चुनौती देता है।

github CrewAI · 19 घंटे पहले

LangChain v1.15.2a2 रिलीज़ नोट्स

यह रिलीज़ Bedrock इंटीग्रेशन, फ्लो एजेंट दस्तावेज़ीकरण और स्ट्रीमिंग नेविगेशन के लिए नई सुविधाओं के साथ LangChain को अपडेट करती है, साथ ही बग फिक्स और दस्तावेज़ीकरण में सुधार।

media Hugging Face Forums · 20 घंटे पहले

फ्रैक्टल ड्रीमिंग + क्वांटम-प्रेरित प्लानिंग: DeepSeek Coder के साथ एक स्व-संगठित ज्ञान खोज उपकरण

लेखक एक स्व-संगठित ज्ञान खोज उपकरण प्रस्तुत करता है जो गहरे ज्ञान स्थानों की अन्वेषण को बढ़ाने के लिए फ्रैक्टल पैटर्न जनरेशन और क्वांटम-प्रेरित सुपरपोजिशन को एकीकृत करता है। सिस्टम सफल रचनात्मक पथों को मेमोरी के बजाय कैश्ड क्वेरीज के रूप में संग्रहीत करके खोज ट्रैजेक्ट्री को अनुकूलित करता है, हार्डवेयर बाधाओं के आधार पर संसाधन उपयोग को अनुकूलित करता है।

media Hugging Face Forums · 20 घंटे पहले

MacBook M5 Pro पर स्थानीय LLM - इसमें बिल्कुल नए!

एक गैर-प्रोग्रामर 128GB एकत्रीकृत मेमोरी वाले MacBook M5 Max पर स्थानीय बड़े भाषा मॉडल (LLM) इंफ्रास्ट्रक्चर सेटअप करने के अपने अनुभव को साझा करता है। उपयोगकर्ता स्थिर, दूरस्थ रूप से सुलभ सिस्टम स्थापित करते हुए AI सीखने के अपने उद्देश्यों, मॉडल चयनों और सॉफ़्टवेयर स्टैक का विवरण देते हैं।