सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 1 / 19

जनरेशनल कॉन्टेक्स्ट आर्किटेक्चर: LLM कॉन्टेक्स्ट रोट को हल करना

जनरेशनल कॉन्टेक्स्ट आर्किटेक्चर (GCA) एक LLM के संदर्भ विंडो को अनंत स्टोरेज के बजाय एक सीमित जीवनकाल मानने का प्रस्ताव देता है ताकि मल्टी-एजेंट सिस्टम में "संदर्भ क्षरण" और ध्यान पतली होने की समस्या को हल किया जा सके। कृत्रिम मृत्युशक्ति लागू करके, एजेंटों को प्रदर्शन गिरने से पहले समाप्त कर दिया जाता है, जो अपनी स्थिति को एक फ्लैट-फ़ाइल Markdown वॉल्ट के माध्यम से नई पीढ़ियों में सौंपते हैं।

media Hugging Face Forums · 3 दिन पहले

वर्ल्ड कप 2026 पूर्वानुमानक

एक डेवलपर ने एक वर्ल्ड कप 2026 पूर्वानुमान टूल बनाया है जो टूर्नामेंट के परिणामों को सिमुलेट करने के लिए ऐतिहासिक डेटा का उपयोग करता है। यह एप्लिकेशन लगभग 50,000 अंतर्राष्ट्रीय मैचों से सीखे गए पैटर्न के आधार पर किसी भी दो राष्ट्रीय टीमों के लिए जीत की संभावना और स्कोर पूर्वानुमान प्रदान करता है।

media Hugging Face Forums · 3 दिन पहले

ट्रांसफॉर्मर्स के लिए एक व्यापक, द्विभाषी मार्गदर्शिका: बुनियादी बातों से KV-cache संपीड़न और ध्यान गतिशीलता तक

कार्लेस मारिन ने एक ओपन-सोर्स, द्विभाषी (अंग्रेजी और स्पैनिश) मार्गदर्शिका जारी की है जो ट्रांसफॉर्मर आर्किटेक्चर के गणितीय आधार को उनके व्यावहारिक कार्यान्वयन से जोड़ती है। संसाधन निचले स्तर की यांत्रिकी पर केंद्रित है, जटिल विषयों को समझाने के लिए पुनरुत्पादक कोड और इंटरैक्टिव तत्व प्रदान करता है।

media Hugging Face Forums · 3 दिन पहले

Transformer यांत्रिकी पर ओपन-सोर्स द्विभाषी गाइड प्रकाशित

Transformers के आंतरिक कार्यों का विवरण देने वाला एक ओपन-सोर्स, द्विभाषी (अंग्रेजी/स्पैनिश) गाइड प्रकाशित किया गया है। संसाधन ध्यान पतन और KV-cache संपीड़न जैसे अवधारणाओं के पीछे सटीक गणित और यांत्रिकी को कवर करता है।

lab OpenAI News · 4 दिन पहले

HP Inc. ने OpenAI के साथ Frontier रणनीतिक साझेदारी शुरू की

सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।

github llama.cpp · 4 दिन पहले

llama.cpp b9837 रिलीज में --reasoning-preserve फ्लैग और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9837 जारी किया है, जिसने Jinja चैट टेम्पलेट के लिए एक नया `--reasoning-preserve` फ्लैग पेश किया है ताकि तर्क टोकन को बनाए रखा जा सके। इस अपडेट में सुधारी गई मदद संदेश भी शामिल हैं और विभिन्न हार्डवेयर बैकएंड पर macOS, Linux, Windows, Android और openEuler के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।

media Hugging Face Forums · 4 दिन पहले

HoLo-ToLk: शून्य-पैरामीटर HSL सबस्ट्रेट पर टोकनाइज़र-फ्री स्पीच मॉडल

लेखक HoLo-ToLk का परिचय देते हैं, जो टोकनाइज़र्स या सीखे गए इनपुट एम्बेडिंग्स के बिना शून्य-पैरामीटर HSL बाइट सबस्ट्रेट का उपयोग करके स्पीच-टू-टेक्स्ट (STT) और टेक्स्ट-टू-स्पीच (TTS) मॉडल बनाने वाला एक शोध परियोजना है। यह कार्य दिखाता है कि विशिष्ट आर्किटेक्चरल संशोधनों के साथ संयोजन में कच्चे HSL बाइट्स ऑडियो प्रोसेसिंग के लिए एक वैध सिग्नल के रूप में काम कर सकते हैं।

github llama.cpp · 4 दिन पहले

UI स्टॉप और रीजनिंग स्किप फिक्स के साथ llama.cpp b9835 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।

media Hugging Face Forums · 4 दिन पहले

AI द्वारा बाइनरी कोड सीखने पर एक काल्पनिक पूछताछ

एक फोरम उपयोगकर्ता ने यह अनुमानित प्रश्न उठाया है कि न्यूरल नेटवर्क्स या AI सिस्टम को बाइनरी कोड को समझने के लिए प्रशिक्षित करने से उनकी सामान्य क्षमताओं, विशेष रूप से कोडिंग कार्यों में, क्या महत्वपूर्ण रूप से वृद्धि होगी।

media Hugging Face Forums · 4 दिन पहले

अवधारणा: AI मॉडल को प्रशिक्षित करने के लिए डेटा के बदले डेटा का आदान-प्रदान

एक उपयोगकर्ता एक वेबसाइट की अवधारणा का प्रस्ताव देते हैं जहां व्यक्ति AI मॉडल को प्रशिक्षित करने के लिए डेटा का आदान-प्रदान करते हैं, जिससे मौद्रिक लेनदेन की आवश्यकता समाप्त हो जाती है। सिस्टम एक क्रेडिट-आधारित अर्थव्यवस्था पर काम करता है जहां उपयोगकर्ता क्रेडिट्स की एक निर्धारित राशि के साथ शुरू होते हैं और विशिष्ट डेटा आवश्यकताओं के लिए बounty पोस्ट करते हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9833 रिलीज़: MiniCPM5 पार्सर और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।

github llama.cpp · 4 दिन पहले

llama.cpp b9832 रिलीज में --dump-prog डीबगिंग फ्लैग जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9831 रिलीज में DFlash समर्थन और नए बाइनरी शामिल हैं

llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।

github llama.cpp · 4 दिन पहले

llama.cpp b9830 रिलीज में --offline फ्लैग जोड़ा गया और मेमोरी बग ठीक किया

llama.cpp की b9830 रिलीज में llama download कमांड के साथ --offline फ्लैग का उपयोग करने की क्षमता शामिल है, जिससे स्क्रिप्ट्स नेटवर्क एक्सेस के बिना कैश किए गए मॉडलों की जांच कर सकते हैं। यह अपडेट URL-टास्क on_done कॉलबैक में first_path को गलत तरीके से रेफरेंस द्वारा कैप्चर किए जाने के कारण उत्पन्न हुए use-after-free दोष को भी ठीक करता है।

media Hugging Face Forums · 4 दिन पहले

उपयोगकर्ता ने zhoucantd के लिए खाता पुनर्प्राप्ति की मांग की

Hugging Face फोरम पर एक उपयोगकर्ता यह पूछ रहा है कि क्या उनका खाता पुनर्प्राप्त करना संभव है, विशेष रूप से उपयोगकर्ता नाम "zhoucantd" को पहचानते हुए। पोस्ट में इस अनुरोध के संबंध में दो भागीदारों वाले चर्चा थ्रेड का संकेत मिलता है।

media Hugging Face Forums · 4 दिन पहले

UCTF: बहुभाषी AI के लिए एक सार्वभौमिक संकुचित प्रशिक्षण प्रारूप

UCTF (Universal Compressed Training Format) नामक एक नया अवधारणा बहुभाषी LLM प्रशिक्षण में अर्थव्यवस्था की अतिरेक को दूर करने के लिए एक मध्यस्थ परत का प्रस्ताव देती है, जिसमें विविध भाषाओं को एक एकीकृत, भाषा-अज्ञेय टोकन प्रारूप में संकुचित किया जाता है।

media Hugging Face Forums · 4 दिन पहले

Gradio के साथ वेबसाइट चैट विजेट बनाना भाग IV

एक उपयोगकर्ता की रिपोर्ट है कि उनकी वेबसाइट पर उनके पहले काम करने वाले AI चैटबॉट विजेट में हाल ही में Gradio अपडेट के बाद CORS नीति त्रुटि के कारण काम करना बंद हो गया है। त्रुटि संकेत देती है कि प्रतिक्रिया में 'Access-Control-Allow-Credentials' हेडर खाली है, जो क्लाइंट के अनुरोध प्रमाण पत्र मोड के साथ टकराता है।

media Hugging Face Forums · 4 दिन पहले

बुद्धिमत्ता का वाहक के रूप में भाषा: टोकन पूर्वानुमान से परे

यह लेख तर्क देता है कि बड़े भाषा मॉडल अपनी apparent बुद्धिमत्ता स्वयं भाषा के भीतर गहरे ज्यामितीय संबंधों और छिपी हुई अवस्थाओं से प्राप्त करते हैं, न कि स्वतंत्र यांत्रिक गणना या सरल टोकन पूर्वानुमान से।

github llama.cpp · 4 दिन पहले

llama.cpp b9829 रिलीज़: कम लॉग और मल्टी-प्लेटफ़ॉर्म बाइनरी

llama.cpp प्रोजेक्ट ने संस्करण b9829 जारी किया है, जिसमें सर्वर, सामान्य घटकों और स्पेकुलेटिव डिकोडिंग मॉड्यूल में लॉग आउटपुट की कमी शामिल है। यह अपडेट CMN_ को COM_ से बदलकर नामकरण रूढ़ियों को मानकीकृत भी करता है।

media Hugging Face Forums · 5 दिन पहले

एक नए एमएल सुडोकू डेटासेट प्रोजेक्ट के लिए सहयोगी की तलाश में उपयोगकर्ता

Hugging Face फोरम पर एक उपयोगकर्ता सुडोकू पर केंद्रित मशीन लर्निंग और डीप लर्निंग प्रोजेक्ट बनाने के लिए सहयोगियों की तलाश कर रहा है। लेखक ने शून्य से एक डेटाबेस बनाना शुरू किया है और इस उद्देश्य के लिए एक स्वतंत्र संगठन स्थापित करने का लक्ष्य रखता है।