llama.cpp b9847 रिलीज में Gemma E4B MTP FlashAttention की मरम्मत
llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
llama.cpp प्रोजेक्ट ने संस्करण b9847 जारी किया है, जिसमें CUDA पर Gemma E4B MTP FlashAttention के लिए एक मरम्मत और एक अनावश्यक टेम्पलेट घोषणा को हटाया गया है।
लेखक ने Hugging Face Hub पर LeRobotDataset श्रेणी के लिए Trajlens, एक ओपन-सोर्स लिंटर का परिचय दिया है, और 'lerobot' टैग वाले 100 यादृच्छिक सार्वजनिक डेटासेट की ऑडिट से प्राप्त परिणामों की रिपोर्ट की है। ऑडिट ने दिखाया कि केवल 19 डेटासेट वैलिडेशन में पास हुए, जबकि 13 विशिष्ट अपस्ट्रीम बग्स के कारण विफल रहे और 47 लोड त्रुटियों या टाइमआउट का सामना किया।
एक फीचर अनुरोध में ज्ञानमीमांसात्मक विरोधाभासी नेटवर्क (EAN) का प्रस्ताव है, एक वास्तुकला जो AI को संस्थागत सहमति को प्रतिबिंबित करने वाले सिस्टम से एक विकेंद्रीकृत, बहु-दृष्टिकोणीय सत्यापन इंजन में बदलने के लिए डिज़ाइन की गई है। यह दृष्टिकोण किसी भी एकल "सत्य का स्रोत" मॉडल को हटाकर राजनीतिक और कॉर्पोरेट शक्ति खेलों को खत्म करने का लक्ष्य रखता है।
Hugging Face फोरम पर एक चर्चा थ्रेड उपयोगकर्ताओं से पूछता है कि वे वर्तमान में चैटबॉट विकास के लिए कौन से मुफ्त या ओपन-सोर्स AI मॉडल का उपयोग कर रहे हैं और अपनी पसंद के कारण क्या हैं।
Hugging Face फोरम पर एक उपयोगकर्ता जटिल विषयों पर तर्क करने में सक्षम असीमित AI मॉडलों के लिए सिफारिशें मांग रहा है, वर्तमान संस्करणों की तुलना में GPT-4 के पूर्व संस्करणों को प्राथमिकता देने का उल्लेख करते हुए।
llama.cpp प्रोजेक्ट ने संस्करण b9846 जारी किया है, जिसमें Asahi Linux के लिए Vulkan बैकएंड अनुकूलन शामिल है। यह अपडेट Apple Silicon हार्डवेयर पर चलने वाले Linux में संगतता और प्रदर्शन को बेहतर बनाने के लिए मैट्रिक्स गुणन में ब्लॉक साइज़ लूप को पीछे की ओर ले जाता है।
llama.cpp प्रोजेक्ट ने संस्करण b9844 जारी किया है, जो NVFP4 क्वांटाइज़ेशन फॉर्मेट के लिए ggml-webgpu सपोर्ट पेश करता है। इस अपडेट में विभिन्न हार्डवेयर बैकएंड्स पर macOS, iOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरी भी उपलब्ध कराई गई हैं।
AgentSeal v5 ऑडिट टूल ने संभावित दूषण जोखिमों का आकलन करने के लिए SWE-bench Pro बेंचमार्क में आर्टिफैक्ट्स की सार्वजनिक उपलब्धता का मूल्यांकन किया। अध्ययन से पता चला कि जबकि 12 उदाहरणों में निर्धारित सामग्री ओवरलैप दिखाया गया और 76 रिपॉजिटरी संभावित कोरस सदस्य थे, अधिकांश सबूत प्रमाणित पूर्व-कटऑफ दूषण के बजाय तारीख-अज्ञात सार्वजनिक पुनरुत्पादन पर आधारित था।
Google UK ने अपने देश में AI-संचालित तकनीकों के लाभों को अनलॉक करने में अधिक लोगों की मदद करने के लिए रणनीतियों का विवरण देने वाला अपनी नवीनतम आर्थिक प्रभाव रिपोर्ट जारी की है।
llama.cpp प्रोजेक्ट ने b9843 रिलीज प्रकाशित की है, जिसमें विभिन्न हार्डवेयर आर्किटेक्चर के लिए macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं।
LangGraph संस्करण 1.2.7 जारी किया गया है, जिसमें LangChain इकोसिस्टम के लिए बग फिक्स और निर्भरता अपडेट शामिल हैं।
ट्रांसफॉर्मर्स के आंतरिक कार्यप्रणाली का विवरण देने वाला एक ओपन-सोर्स, द्विभाषी गाइड अंग्रेजी और स्पैनिश में प्रकाशित हुआ है। संसाधन एटेंशन कॉलाप्स और KV-कैश कंप्रेशन के पीछे की सटीक गणित और मैकेनिक्स को कवर करता है।
स्वतंत्र शोध परियोजना LIMEN सात ओपन-सोर्स Transformer मॉडल्स के आंतरिक गतिशीलता का विश्लेषण करती है, यह प्रकट करते हुए कि अर्थवैयक्तिक अस्पष्टता ट्रेजेक्टरी ज्यामिति को बदल देती है और आर्किटेक्चर में एक सार्वभौमिक गतिशील व्याकरण की खोज करती है।
माइक्रोसॉफ्ट रिसर्च मेमोरा का परिचय देता है, एक स्केलेबल एजेंटिक मेमोरी फ्रेमवर्क जिसे लॉंग-होरिज़न AI टास्क के लिए एब्सट्रैक्शन और स्पेसिफिसिटी को संतुलित करने के लिए डिज़ाइन किया गया है। सिस्टम समृद्ध मेमोरी सामग्री को लाइटवेट रिट्रीवल स्ट्रक्चर्स से अलग करता है, जो बेंचमार्क्स पर नए स्टेट-ऑफ़-द-आर्ट परिणाम स्थापित करते हुए 98% तक कम कॉन्टेक्स्ट टोकन का उपयोग करता है।
क्लॉड कोड संस्करण 2.1.196 में संगठन डिफ़ॉल्ट मॉडल, क्लिक करने योग्य फ़ाइल अटैचमेंट और MCP सर्वर अनुमोदन के लिए बेहतर सुरक्षा शामिल है। अपडेट में बैकग्राउंड सत्र की विश्वसनीयता को बढ़ाया गया है, विभिन्न एजेंट स्थिति रिपोर्टिंग समस्याओं को ठीक किया गया है, और कोड रिव्यू वर्कफ़्लो में टोकन उपयोग को अनुकूलित किया गया है।
लेख DiScoFormer का परिचय देता है, जो एक एकीकृत transformer मॉडल है जो विभिन्न डेटा वितरणों में घनत्व अनुमान और स्कोर-आधारित जनरेटिव कार्यों को करने में सक्षम है।
प्रोजेक्ट UCTF को एकल प्रस्ताव से पुनर्गठित करके एक खुले, परिकल्पना-चालित शोध कार्यक्रम में बदल दिया गया है ताकि यह जांचा जा सके कि क्या मशीन-नेटिव मध्यवर्ती प्रतिनिधित्व बहुभाषी AI ट्रेनिंग में अंतर-भाषाई व्याकरणिक अतिरेक को कम कर सकते हैं।
एक उपयोगकर्ता ने Hugging Face पर डीप RL कोर्स के लिए पूर्णता प्रमाणपत्र उत्पन्न करते समय एक त्रुटि का सामना करने की रिपोर्ट की है। आवश्यक उपयोगकर्ता नाम और नाम विवरण दर्ज करने के बावजूद समस्या बनी हुई है, और ऑनलाइन कोई मौजूदा मार्गदर्शन उपलब्ध नहीं है।
एक गूगल विशेषज्ञ कृत्रिम बुद्धिमत्ता में पूर्ण-स्टैक दृष्टिकोण अपनाने की अवधारणा को समझाते हैं। लेख पर प्रकाश डालता है कि यह व्यापक विधि गूगल के एआई कार्य के लिए एक लंबे समय से आधार के रूप में काम कर रही है।
llama.cpp b9842 रिलीज में /v1/models एंडपॉइंट में डेडप्रेसेट और कैशेड मॉडल एंट्रीज़ को डुप्लिकेट से हटाने के लिए एक बदलाव शामिल है। यह अपडेट Hugging Face से Adrien Gallouët द्वारा अनुमोदित है।