सभी लेख
media r/LocalLLaMA · 4 घंटे पहले

Palantir के CEO ने बंद मॉडलों के खिलाफ गुस्सा किया

Palantir के CEO अलेक्स कार्प ने Anthropic और OpenAI को ग्राहकों से अधिक शुल्क लेने और उनके डेटा का दुरुपयोग करने के लिए सार्वजनिक रूप से आलोचित किया। यह स्थिति तब आई जब Palantir ने हाल ही में अपने एंटरप्राइज़ क्लाइंट्स के लिए स्थानीय मॉडल चलाने के लिए Nvidia चिप्स खरीदने का समझौता किया है।

media r/LocalLLaMA · 4 घंटे पहले

विश्वसनीय संरचित आउटपुट के लिए एक सस्ता ट्रिक: पुनः प्रयास में मान्यता त्रुटि को वापस फीड करें

बड़े भाषा मॉडल से संरचित आउटपुट उत्पन्न करते समय विश्वसनीयता को बेहतर बनाने के लिए, एक विधि प्रस्तावित की गई है जो पुनः प्रयासों के दौरान मान्यता त्रुटियों और मॉडल के पिछले आउटपुट को वापस प्रॉम्प्ट में फीड करती है। यह दृष्टिकोण यादृच्छिक प्रतिक्रियाओं को फिर से रोल करने की प्रक्रिया को पिछले प्रयास को संपादित करके विशिष्ट त्रुटियों को स्वयं-सुधारने में बदल देता है।

github Goose (Block) · 9 घंटे पहले

Goose v1.40.0 रिलीज नोट्स

Goose v1.40.0 अपडेट डेस्कटॉप एप्लिकेशन के लिए व्यापक स्थानीयकरण समर्थन पेश करता है, फ्रेंच, जर्मन, इतालवी, पुर्तगाली, इंडोनेशियाई, मलय, वियतनामी, परंपरागत चीनी, कोरियाई, जापानी, स्पैनिश और हिंदी के लिए भाषा समर्थन जोड़ता है।

media Hugging Face Forums · 14 घंटे पहले

Show HF: ServBay, कोडिंग एजेंट्स के लिए एक लोकल-फर्स्ट रनटाइम और AI गेटवे

ServBay को एक लोकल-फर्स्ट रनटाइम और इंफ्रास्ट्रक्चर समाधान के रूप में पेश किया गया है, जो AI कोडिंग एजेंट्स और उपयोगकर्ता की होस्ट मशीन के बीच के अंतर को पूरा करने के लिए डिज़ाइन किया गया है। यह उस "आखिरी मील" की समस्या को हल करता है, जहाँ बुद्धिमान एजेंट्स डेटाबेस, डोमेन्स या SSL प्रमाणपत्रों को कॉन्फ़िगर करने के लिए सिस्टम-लेवल क्षमताओं से वंचित होते हैं और इसके लिए मैन्युअल डेवलपर हस्तक्षेप की आवश्यकता होती है।

media Hugging Face Forums · 14 घंटे पहले

प्रिज़्म ट्रान्सफॉर्मर: हियरार्किकल एटेंशन प्रोसेसिंग के लिए प्रोग्रेसिव हेड शेड्यूल

प्रिज़्म ट्रान्सफॉर्मर एक प्रोग्रेसिव हेड शेड्यूल पेश करता है जो परतों में ध्यान देने वाले हेड की संख्या को बदलता है, जहां शुरुआती परतों में कम, चौड़े हेड होते हैं और गहराई के साथ उनकी संख्या क्रमिक रूप से बढ़ती है। यह दृष्टिकोण प्रारंभिक और बाद की परतों की अलग-अलग संरचनात्मक आवश्यकताओं को पूरा करते हुए, बिना किसी आर्किटेक्चरल ओवरहेड के, मानक समान वितरण को चुनौती देता है।

github CrewAI · 14 घंटे पहले

LangChain v1.15.2a2 रिलीज़ नोट्स

यह रिलीज़ Bedrock इंटीग्रेशन, फ्लो एजेंट दस्तावेज़ीकरण और स्ट्रीमिंग नेविगेशन के लिए नई सुविधाओं के साथ LangChain को अपडेट करती है, साथ ही बग फिक्स और दस्तावेज़ीकरण में सुधार।

media Hugging Face Forums · 15 घंटे पहले

फ्रैक्टल ड्रीमिंग + क्वांटम-प्रेरित प्लानिंग: DeepSeek Coder के साथ एक स्व-संगठित ज्ञान खोज उपकरण

लेखक एक स्व-संगठित ज्ञान खोज उपकरण प्रस्तुत करता है जो गहरे ज्ञान स्थानों की अन्वेषण को बढ़ाने के लिए फ्रैक्टल पैटर्न जनरेशन और क्वांटम-प्रेरित सुपरपोजिशन को एकीकृत करता है। सिस्टम सफल रचनात्मक पथों को मेमोरी के बजाय कैश्ड क्वेरीज के रूप में संग्रहीत करके खोज ट्रैजेक्ट्री को अनुकूलित करता है, हार्डवेयर बाधाओं के आधार पर संसाधन उपयोग को अनुकूलित करता है।

media Hugging Face Forums · 15 घंटे पहले

MacBook M5 Pro पर स्थानीय LLM - इसमें बिल्कुल नए!

एक गैर-प्रोग्रामर 128GB एकत्रीकृत मेमोरी वाले MacBook M5 Max पर स्थानीय बड़े भाषा मॉडल (LLM) इंफ्रास्ट्रक्चर सेटअप करने के अपने अनुभव को साझा करता है। उपयोगकर्ता स्थिर, दूरस्थ रूप से सुलभ सिस्टम स्थापित करते हुए AI सीखने के अपने उद्देश्यों, मॉडल चयनों और सॉफ़्टवेयर स्टैक का विवरण देते हैं।

lab Hugging Face Blog · 17 घंटे पहले

Hugging Face और Cerebras ने रियल-टाइम वॉइस AI के लिए Gemma 4 लाया

Hugging Face और Cerebras ने Google के Gemma 4 मॉडल को अपनी प्लेटफार्मों में एकीकृत किया है ताकि रियल-टाइम वॉइस आर्टिफिशियल इंटेलिजेंस अनुप्रयोग सक्षम हो सकें। इस सहयोग से डेवलपर्स कम लेटेंसी वाले ऑडियो प्रोसेसिंग कार्यों के लिए Gemma 4 की मल्टीमोडल क्षमताओं का लाभ उठा सकते हैं।

media Together AI Blog · 17 घंटे पहले

ओपन-सोर्स AI की ओर बदलाव को तेज करने के लिए हमारी $800M सीरीज़ C का ऐलान

कंपनी ने ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस की ओर संक्रमण को तेज करने के उद्देश्य से सीरीज़ C फंडिंग राउंड में $800 मिलियन जुटाए हैं।

lab Hugging Face Blog · 17 घंटे पहले

ScarfBench: एंटरप्राइज़ जावा फ्रेमवर्क माइग्रेशन के लिए AI एजेंट्स का बेंचमार्किंग

यह लेख ScarfBench पेश करता है, एक बेंचमार्क जो विभिन्न फ्रेमवर्क्स के बीच एंटरप्राइज़ जावा एप्लिकेशन को माइग्रेट करने में AI एजेंट्स के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अध्ययन फ्रेमवर्क माइग्रेशन की जटिलता पर प्रकाश डालता है और इस डोमेन में एजेंट क्षमताओं का आकलन करने के लिए एक मानकीकृत मूल्यांकन विधि का सुझाव देता है।

lab Claude Code Releases · 21 घंटे पहले

Claude Code v2.1.198 रिलीज नोट्स

Claude Code के लिए v2.1.198 अपडेट में Chrome में Claude की सामान्य उपलब्धता और नोटिफिकेशन हुक्स और स्वचालित पुल अनुरोध वर्कफ़्लो के साथ बैकग्राउंड एजेंट क्षमताओं में सुधार शामिल है।

lab Google — The Keyword (AI) · 21 घंटे पहले

NYC के शिक्षक और उद्योग नेता कक्षाओं में AI को आकार देने के लिए Google में एकत्र हुए

Google, न्यू यॉर्क जॉब्स CEO काउंसिल और अर्बन असंबली ने Google के कार्यालयों में 150 शिक्षा और उद्योग नेताओं के लिए एक AI शिखर सम्मेलन आयोजित किया। इस कार्यक्रम ने कक्षा के वातावरण के भीतर कृत्रिम बुद्धिमत्ता के एकीकरण के भविष्य पर चर्चा करने और आकार देने के लिए हितधारकों को एकत्र किया।

github llama.cpp · 22 घंटे पहले

llama.cpp b9859 रिलीज़ में OpenCL प्रीकंपाइल्ड kernel समर्थन जोड़ा गया

llama.cpp b9859 रिलीज़ OpenCL के लिए लाइब्रेरी से प्रीकंपाइल्ड बाइनरी kernels लोड करने की क्षमता पेश करता है, विशेष रूप से Adreno GPUs को टारगेट करके। यह अपडेट CPU, GPU और विभिन्न एक्सेलेरेटर बैकएंड्स के लिए macOS, Linux, Windows, Android और openEuler के लिए बाइनरी भी प्रदान करता है।

lab xAI News · 23 घंटे पहले

xAI ने Grok Voice के लिए कोड-रहित वॉइस एजेंट बिल्डर लॉन्च किया

xAI ने Grok Voice पर प्रोडक्शन-ग्रेड वॉइस एजेंट्स को दो मिनट से कम समय में कॉन्फ़िगर करने के लिए डिज़ाइन किए गए एक कोड-रहित प्लेटफ़ॉर्म, Voice Agent Builder का बीटा रिलीज़ घोषित किया। यह टूल ऑपरेटरों और डेवलपर्स को बेसिक टेलीफोनी या AI स्टैक को शून्य से बनाने के बिना उच्च-वॉल्यूम वॉइस एजेंट्स को डिप्लॉय करने की अनुमति देता है।