चैटबॉट विकास के लिए ओपन-सोर्स LLMs पर समुदाय चर्चा
Hugging Face फोरम पर एक चर्चा थ्रेड उपयोगकर्ताओं से पूछता है कि वे वर्तमान में चैटबॉट विकास के लिए कौन से मुफ्त या ओपन-सोर्स AI मॉडल का उपयोग कर रहे हैं और अपनी पसंद के कारण क्या हैं।
Hugging Face फोरम पर एक चर्चा थ्रेड उपयोगकर्ताओं से पूछता है कि वे वर्तमान में चैटबॉट विकास के लिए कौन से मुफ्त या ओपन-सोर्स AI मॉडल का उपयोग कर रहे हैं और अपनी पसंद के कारण क्या हैं।
Hugging Face फोरम पर एक उपयोगकर्ता जटिल विषयों पर तर्क करने में सक्षम असीमित AI मॉडलों के लिए सिफारिशें मांग रहा है, वर्तमान संस्करणों की तुलना में GPT-4 के पूर्व संस्करणों को प्राथमिकता देने का उल्लेख करते हुए।
llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।
llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।
AgentSeal v5 ऑडिट टूल ने संभावित दूषण जोखिमों का आकलन करने के लिए SWE-bench Pro बेंचमार्क में आर्टिफैक्ट्स की सार्वजनिक उपलब्धता का मूल्यांकन किया। अध्ययन से पता चला कि जबकि 12 उदाहरणों में निर्धारित सामग्री ओवरलैप दिखाया गया और 76 रिपॉजिटरी संभावित कोरस सदस्य थे, अधिकांश सबूत प्रमाणित पूर्व-कटऑफ दूषण के बजाय तारीख-अज्ञात सार्वजनिक पुनरुत्पादन पर आधारित था।
Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।
llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।
LangGraph संस्करण 1.2.7 जारी किया गया है, जिसमें LangChain इकोसिस्टम के लिए बग फिक्स और निर्भरता अपडेट शामिल हैं।
ट्रांसफॉर्मर्स के आंतरिक कार्यप्रणाली का विवरण देने वाला एक ओपन-सोर्स, द्विभाषी गाइड अंग्रेजी और स्पैनिश में प्रकाशित हुआ है। संसाधन एटेंशन कॉलाप्स और KV-कैश कंप्रेशन के पीछे की सटीक गणित और मैकेनिक्स को कवर करता है।
स्वतंत्र शोध परियोजना LIMEN सात ओपन-सोर्स Transformer मॉडल्स के आंतरिक गतिशीलता का विश्लेषण करती है, यह प्रकट करते हुए कि अर्थवैयक्तिक अस्पष्टता ट्रेजेक्टरी ज्यामिति को बदल देती है और आर्किटेक्चर में एक सार्वभौमिक गतिशील व्याकरण की खोज करती है।
माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।
क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।
लेख DiScoFormer का परिचय देता है, जो एक एकीकृत transformer मॉडल है जो विभिन्न डेटा वितरणों में घनत्व अनुमान और स्कोर-आधारित जनरेटिव कार्यों को करने में सक्षम है।
प्रोजेक्ट UCTF को एकल प्रस्ताव से पुनर्गठित करके एक खुले, परिकल्पना-चालित शोध कार्यक्रम में बदल दिया गया है ताकि यह जांचा जा सके कि क्या मशीन-नेटिव मध्यवर्ती प्रतिनिधित्व बहुभाषी AI ट्रेनिंग में अंतर-भाषाई व्याकरणिक अतिरेक को कम कर सकते हैं।
एक उपयोगकर्ता ने Hugging Face पर डीप RL कोर्स के लिए पूर्णता प्रमाणपत्र उत्पन्न करते समय एक त्रुटि का सामना करने की रिपोर्ट की है। आवश्यक उपयोगकर्ता नाम और नाम विवरण दर्ज करने के बावजूद समस्या बनी हुई है, और ऑनलाइन कोई मौजूदा मार्गदर्शन उपलब्ध नहीं है।
एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।
llama.cpp b9842 रिलीज में /v1/models एंडपॉइंट में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़ को डुप्लिकेट से हटाने के लिए एक बदलाव शामिल है। यह अपडेट Hugging Face से Adrien Gallouët द्वारा अनुमोदित है।
वेब तकनीकों में 25 साल से अधिक के अनुभव वाले एक डेवलपर टूल्स का उपयोग करने से परे जाने और उन्हें बनाना समझने के लिए AI इंजीनियरिंग में संक्रमण कर रहे हैं।
एक उपयोगकर्ता ने रिपोर्ट की है कि उनका निजी Hugging Face Space, विशेष रूप से 'Ark-kun/tangent', अचानक काम करना बंद कर दिया और इसे पुनः आरंभ नहीं किया जा सकता है। इसे पुनः आरम्रभ करने या फैक्ट्री रीबिल्ड करने के प्रयास "503. इस Space को पुनः आरंभ करते समय कुछ गलत हो गया" त्रुटि के साथ विफल रहते हैं।
शोधकर्ताओं ने Brain2Qwerty v2 जारी किया है, जो एक गैर-आक्रामक AI पाइपलाइन है जो सर्जिकल इम्प्लांट के बिना मैग्नेटोएन्सेफेलोग्राफी (MEG) रिकॉर्डिंग से वास्तविक समय की वाक्यों को डिकोड करती है। सिस्टम ने समग्र रूप से 61% शब्द सटीकता दर हासिल की है और शीर्ष प्रदर्शनकर्ताओं के लिए यह 78% तक पहुंचती है, जो पिछले गैर-आक्रामक तरीकों से काफी बेहतर है।