सभी लेख
media Hugging Face Forums · 3 दिन पहले

जनरेशनल कॉन्टेक्स्ट आर्किटेक्चर: LLM कॉन्टेक्स्ट रोट को हल करना

जनरेशनल कॉन्टेक्स्ट आर्किटेक्चर (GCA) एक LLM के संदर्भ विंडो को अनंत स्टोरेज के बजाय एक सीमित जीवनकाल मानने का प्रस्ताव देता है ताकि मल्टी-एजेंट सिस्टम में "संदर्भ क्षरण" और ध्यान पतली होने की समस्या को हल किया जा सके। कृत्रिम मृत्युशक्ति लागू करके, एजेंटों को प्रदर्शन गिरने से पहले समाप्त कर दिया जाता है, जो अपनी स्थिति को एक फ्लैट-फ़ाइल Markdown वॉल्ट के माध्यम से नई पीढ़ियों में सौंपते हैं।

lab OpenAI News · 4 दिन पहले

HP Inc. ने OpenAI के साथ Frontier रणनीतिक साझेदारी शुरू की

सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।

github llama.cpp · 4 दिन पहले

llama.cpp b9837 रिलीज में --reasoning-preserve फ्लैग और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9837 जारी किया है, जिसने Jinja चैट टेम्पलेट के लिए एक नया `--reasoning-preserve` फ्लैग पेश किया है ताकि तर्क टोकन को बनाए रखा जा सके। इस अपडेट में सुधारी गई मदद संदेश भी शामिल हैं और विभिन्न हार्डवेयर बैकएंड पर macOS, Linux, Windows, Android और openEuler के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।

media Hugging Face Forums · 4 दिन पहले

HoLo-ToLk: शून्य-पैरामीटर HSL सबस्ट्रेट पर टोकनाइज़र-फ्री स्पीच मॉडल

लेखक HoLo-ToLk का परिचय देते हैं, जो टोकनाइज़र्स या सीखे गए इनपुट एम्बेडिंग्स के बिना शून्य-पैरामीटर HSL बाइट सबस्ट्रेट का उपयोग करके स्पीच-टू-टेक्स्ट (STT) और टेक्स्ट-टू-स्पीच (TTS) मॉडल बनाने वाला एक शोध परियोजना है। यह कार्य दिखाता है कि विशिष्ट आर्किटेक्चरल संशोधनों के साथ संयोजन में कच्चे HSL बाइट्स ऑडियो प्रोसेसिंग के लिए एक वैध सिग्नल के रूप में काम कर सकते हैं।

github llama.cpp · 4 दिन पहले

UI स्टॉप और रीजनिंग स्किप फिक्स के साथ llama.cpp b9835 रिलीज़

llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।

media Hugging Face Forums · 4 दिन पहले

AI द्वारा बाइनरी कोड सीखने पर एक काल्पनिक पूछताछ

एक फोरम उपयोगकर्ता ने यह अनुमानित प्रश्न उठाया है कि न्यूरल नेटवर्क्स या AI सिस्टम को बाइनरी कोड को समझने के लिए प्रशिक्षित करने से उनकी सामान्य क्षमताओं, विशेष रूप से कोडिंग कार्यों में, क्या महत्वपूर्ण रूप से वृद्धि होगी।

media Hugging Face Forums · 4 दिन पहले

अवधारणा: AI मॉडल को प्रशिक्षित करने के लिए डेटा के बदले डेटा का आदान-प्रदान

एक उपयोगकर्ता एक वेबसाइट की अवधारणा का प्रस्ताव देते हैं जहां व्यक्ति AI मॉडल को प्रशिक्षित करने के लिए डेटा का आदान-प्रदान करते हैं, जिससे मौद्रिक लेनदेन की आवश्यकता समाप्त हो जाती है। सिस्टम एक क्रेडिट-आधारित अर्थव्यवस्था पर काम करता है जहां उपयोगकर्ता क्रेडिट्स की एक निर्धारित राशि के साथ शुरू होते हैं और विशिष्ट डेटा आवश्यकताओं के लिए बounty पोस्ट करते हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9833 रिलीज़: MiniCPM5 पार्सर और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।

github llama.cpp · 4 दिन पहले

llama.cpp b9832 रिलीज में --dump-prog डीबगिंग फ्लैग जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9831 रिलीज में DFlash समर्थन और नए बाइनरी शामिल हैं

llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।

github llama.cpp · 4 दिन पहले

llama.cpp b9830 रिलीज में --offline फ्लैग जोड़ा गया और मेमोरी बग ठीक किया

llama.cpp की b9830 रिलीज में llama download कमांड के साथ --offline फ्लैग का उपयोग करने की क्षमता शामिल है, जिससे स्क्रिप्ट्स नेटवर्क एक्सेस के बिना कैश किए गए मॉडलों की जांच कर सकते हैं। यह अपडेट URL-टास्क on_done कॉलबैक में first_path को गलत तरीके से रेफरेंस द्वारा कैप्चर किए जाने के कारण उत्पन्न हुए use-after-free दोष को भी ठीक करता है।

media Hugging Face Forums · 4 दिन पहले

उपयोगकर्ता ने zhoucantd के लिए खाता पुनर्प्राप्ति की मांग की

Hugging Face फोरम पर एक उपयोगकर्ता यह पूछ रहा है कि क्या उनका खाता पुनर्प्राप्त करना संभव है, विशेष रूप से उपयोगकर्ता नाम "zhoucantd" को पहचानते हुए। पोस्ट में इस अनुरोध के संबंध में दो भागीदारों वाले चर्चा थ्रेड का संकेत मिलता है।

media Hugging Face Forums · 4 दिन पहले

UCTF: बहुभाषी AI के लिए एक सार्वभौमिक संकुचित प्रशिक्षण प्रारूप

UCTF (Universal Compressed Training Format) नामक एक नया अवधारणा बहुभाषी LLM प्रशिक्षण में अर्थव्यवस्था की अतिरेक को दूर करने के लिए एक मध्यस्थ परत का प्रस्ताव देती है, जिसमें विविध भाषाओं को एक एकीकृत, भाषा-अज्ञेय टोकन प्रारूप में संकुचित किया जाता है।

media Hugging Face Forums · 4 दिन पहले

Gradio के साथ वेबसाइट चैट विजेट बनाना भाग IV

एक उपयोगकर्ता की रिपोर्ट है कि उनकी वेबसाइट पर उनके पहले काम करने वाले AI चैटबॉट विजेट में हाल ही में Gradio अपडेट के बाद CORS नीति त्रुटि के कारण काम करना बंद हो गया है। त्रुटि संकेत देती है कि प्रतिक्रिया में 'Access-Control-Allow-Credentials' हेडर खाली है, जो क्लाइंट के अनुरोध प्रमाण पत्र मोड के साथ टकराता है।

media Hugging Face Forums · 4 दिन पहले

बुद्धिमत्ता का वाहक के रूप में भाषा: टोकन पूर्वानुमान से परे

यह लेख तर्क देता है कि बड़े भाषा मॉडल अपनी apparent बुद्धिमत्ता स्वयं भाषा के भीतर गहरे ज्यामितीय संबंधों और छिपी हुई अवस्थाओं से प्राप्त करते हैं, न कि स्वतंत्र यांत्रिक गणना या सरल टोकन पूर्वानुमान से।

github llama.cpp · 4 दिन पहले

llama.cpp b9829 रिलीज़: कम लॉग और मल्टी-प्लेटफ़ॉर्म बाइनरी

llama.cpp प्रोजेक्ट ने संस्करण b9829 जारी किया है, जिसमें सर्वर, सामान्य घटकों और स्पेकुलेटिव डिकोडिंग मॉड्यूल में लॉग आउटपुट की कमी शामिल है। यह अपडेट CMN_ को COM_ से बदलकर नामकरण रूढ़ियों को मानकीकृत भी करता है।

media Hugging Face Forums · 4 दिन पहले

एक नए एमएल सुडोकू डेटासेट प्रोजेक्ट के लिए सहयोगी की तलाश में उपयोगकर्ता

Hugging Face फोरम पर एक उपयोगकर्ता सुडोकू पर केंद्रित मशीन लर्निंग और डीप लर्निंग प्रोजेक्ट बनाने के लिए सहयोगियों की तलाश कर रहा है। लेखक ने शून्य से एक डेटाबेस बनाना शुरू किया है और इस उद्देश्य के लिए एक स्वतंत्र संगठन स्थापित करने का लक्ष्य रखता है।

github llama.cpp · 5 दिन पहले

llama.cpp b9828 रिलीज़: OpenCL Flash Attention में सुधार और नए बाइनरी

llama.cpp की b9828 रिलीज़ ने महत्वपूर्ण OpenCL बढ़तों को पेश किया, विशेष रूप से f16 और f32 प्रिसिजन के लिए Flash Attention kernels को फिर से डिजाइन किया। इस अपडेट में नए prefill prepass kernels और q4_0 व q8_0 क्वांटीज़ेशन फॉर्मेट्स के लिए समर्थन शामिल है।

media Hugging Face Forums · 5 दिन पहले

विषम भाषा एब्लेशन के साथ अनुभव?

एक उपयोगकर्ता एक मॉडल से मंदारिन, रूसी और अरबी को हटाकर मुख्य रूप से लैटिन-आधारित संस्करण बनाने के संबंध में अनुभव पूछता है। लक्ष्य उन संदर्भों में जहां अंग्रेजी का कोई सक्रियण नहीं है, आगे के प्रशिक्षण या सुरक्षित प्रuning के लिए स्थान मुक्त करना है।

github llama.cpp · 5 दिन पहले

llama.cpp b9827 रिलीज में CUDA 2D async copy ऑप्टिमाइज़ेशन जोड़ा गया

llama.cpp की b9827 रिलीज ने ggml_cuda_cpy फ़ंक्शन में cudaMemcpy2DAsync फास्ट पथ जोड़कर CUDA के लिए एक प्रदर्शन ऑप्टिमाइज़ेशन पेश किया है। यह बदलाव उन स्ट्राइडेड कॉपीज को तेज़ करता है जहाँ टेंसर पूरी तरह से कंटिग्यूस नहीं होते लेकिन प्रत्येक पंक्ति कंटिग्यूस होती है, जिसमें धीमे एलिमेंट-वाइज स्केलर कॉपी kernels की जगह लेता है।