सभी लेख
github llama.cpp · 4 दिन पहले

llama.cpp b9833 रिलीज़: MiniCPM5 पार्सर और मल्टी-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।

github llama.cpp · 4 दिन पहले

llama.cpp b9832 रिलीज में --dump-prog डीबगिंग फ्लैग जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9832 जारी किया है, जिसमें Jinja टेम्पलेट इंजन के लिए एक नया `--dump-prog` कमांड-लाइन विकल्प पेश किया गया है ताकि डीबगिंग में मदद मिल सके। इस अपडेट में विभिन्न CPU और GPU आर्किटेक्चर पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी शामिल हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9831 रिलीज में DFlash समर्थन और नए बाइनरी शामिल हैं

llama.cpp b9831 रिलीज में DFlash v2 समर्थन पेश किया गया है, जिसमें परत प्रकारों के अनुसार स्लाइडिंग विंडो एटेंशन शामिल है, साथ ही कई प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी का एक व्यापक सेट भी उपलब्ध है।

github llama.cpp · 4 दिन पहले

llama.cpp b9830 रिलीज में --offline फ्लैग जोड़ा गया और मेमोरी बग ठीक किया

llama.cpp की b9830 रिलीज में llama download कमांड के साथ --offline फ्लैग का उपयोग करने की क्षमता शामिल है, जिससे स्क्रिप्ट्स नेटवर्क एक्सेस के बिना कैश किए गए मॉडलों की जांच कर सकते हैं। यह अपडेट URL-टास्क on_done कॉलबैक में first_path को गलत तरीके से रेफरेंस द्वारा कैप्चर किए जाने के कारण उत्पन्न हुए use-after-free दोष को भी ठीक करता है।

media Hugging Face Forums · 4 दिन पहले

उपयोगकर्ता ने zhoucantd के लिए खाता पुनर्प्राप्ति की मांग की

Hugging Face फोरम पर एक उपयोगकर्ता यह पूछ रहा है कि क्या उनका खाता पुनर्प्राप्त करना संभव है, विशेष रूप से उपयोगकर्ता नाम "zhoucantd" को पहचानते हुए। पोस्ट में इस अनुरोध के संबंध में दो भागीदारों वाले चर्चा थ्रेड का संकेत मिलता है।

media Hugging Face Forums · 4 दिन पहले

UCTF: बहुभाषी AI के लिए एक सार्वभौमिक संकुचित प्रशिक्षण प्रारूप

UCTF (Universal Compressed Training Format) नामक एक नया अवधारणा बहुभाषी LLM प्रशिक्षण में अर्थव्यवस्था की अतिरेक को दूर करने के लिए एक मध्यस्थ परत का प्रस्ताव देती है, जिसमें विविध भाषाओं को एक एकीकृत, भाषा-अज्ञेय टोकन प्रारूप में संकुचित किया जाता है।

media Hugging Face Forums · 4 दिन पहले

Gradio के साथ वेबसाइट चैट विजेट बनाना भाग IV

एक उपयोगकर्ता की रिपोर्ट है कि उनकी वेबसाइट पर उनके पहले काम करने वाले AI चैटबॉट विजेट में हाल ही में Gradio अपडेट के बाद CORS नीति त्रुटि के कारण काम करना बंद हो गया है। त्रुटि संकेत देती है कि प्रतिक्रिया में 'Access-Control-Allow-Credentials' हेडर खाली है, जो क्लाइंट के अनुरोध प्रमाण पत्र मोड के साथ टकराता है।

media Hugging Face Forums · 4 दिन पहले

बुद्धिमत्ता का वाहक के रूप में भाषा: टोकन पूर्वानुमान से परे

यह लेख तर्क देता है कि बड़े भाषा मॉडल अपनी apparent बुद्धिमत्ता स्वयं भाषा के भीतर गहरे ज्यामितीय संबंधों और छिपी हुई अवस्थाओं से प्राप्त करते हैं, न कि स्वतंत्र यांत्रिक गणना या सरल टोकन पूर्वानुमान से।

github llama.cpp · 4 दिन पहले

llama.cpp b9829 रिलीज़: कम लॉग और मल्टी-प्लेटफ़ॉर्म बाइनरी

llama.cpp प्रोजेक्ट ने संस्करण b9829 जारी किया है, जिसमें सर्वर, सामान्य घटकों और स्पेकुलेटिव डिकोडिंग मॉड्यूल में लॉग आउटपुट की कमी शामिल है। यह अपडेट CMN_ को COM_ से बदलकर नामकरण रूढ़ियों को मानकीकृत भी करता है।

media Hugging Face Forums · 4 दिन पहले

एक नए एमएल सुडोकू डेटासेट प्रोजेक्ट के लिए सहयोगी की तलाश में उपयोगकर्ता

Hugging Face फोरम पर एक उपयोगकर्ता सुडोकू पर केंद्रित मशीन लर्निंग और डीप लर्निंग प्रोजेक्ट बनाने के लिए सहयोगियों की तलाश कर रहा है। लेखक ने शून्य से एक डेटाबेस बनाना शुरू किया है और इस उद्देश्य के लिए एक स्वतंत्र संगठन स्थापित करने का लक्ष्य रखता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9828 रिलीज़: OpenCL Flash Attention में सुधार और नए बाइनरी

llama.cpp की b9828 रिलीज़ ने महत्वपूर्ण OpenCL बढ़तों को पेश किया, विशेष रूप से f16 और f32 प्रिसिजन के लिए Flash Attention kernels को फिर से डिजाइन किया। इस अपडेट में नए prefill prepass kernels और q4_0 व q8_0 क्वांटीज़ेशन फॉर्मेट्स के लिए समर्थन शामिल है।

media Hugging Face Forums · 5 दिन पहले

विषम भाषा एब्लेशन के साथ अनुभव?

एक उपयोगकर्ता एक मॉडल से मंदारिन, रूसी और अरबी को हटाकर मुख्य रूप से लैटिन-आधारित संस्करण बनाने के संबंध में अनुभव पूछता है। लक्ष्य उन संदर्भों में जहां अंग्रेजी का कोई सक्रियण नहीं है, आगे के प्रशिक्षण या सुरक्षित प्रuning के लिए स्थान मुक्त करना है।

github llama.cpp · 5 दिन पहले

llama.cpp b9827 रिलीज में CUDA 2D async copy ऑप्टिमाइज़ेशन जोड़ा गया

llama.cpp की b9827 रिलीज ने ggml_cuda_cpy फ़ंक्शन में cudaMemcpy2DAsync फास्ट पथ जोड़कर CUDA के लिए एक प्रदर्शन ऑप्टिमाइज़ेशन पेश किया है। यह बदलाव उन स्ट्राइडेड कॉपीज को तेज़ करता है जहाँ टेंसर पूरी तरह से कंटिग्यूस नहीं होते लेकिन प्रत्येक पंक्ति कंटिग्यूस होती है, जिसमें धीमे एलिमेंट-वाइज स्केलर कॉपी kernels की जगह लेता है।

github llama.cpp · 5 दिन पहले

llama.cpp b9825 रिलीज़: Vulkan फिक्स और क्रॉस-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9825 जारी किया है, जिसमें शून्य इनपुट हैंडल करते समय Vulkan स्टेप ऑपरेटर के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Windows, Android और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 5 दिन पहले

SYCL norm फिक्स के साथ llama.cpp b9826 रिलीज

llama.cpp प्रोजेक्ट ने b9826 रिलीज जारी की है, जिसमें SYCL में norm फ़ंक्शन से जुड़े विफल यूनिट टेस्ट केसों के लिए एक फिक्स शामिल है। यह अपडेट कई प्लेटफॉर्म और हार्डवेयर एक्सेलेरेटर पर पूर्व-बिल्ड बाइनरी और फ्रेमवर्क प्रदान करता है।

media Hugging Face Forums · 5 दिन पहले

वह चेकलिस्ट जो आप लिखते हैं AI को रोकने पर मजबूर करती है

यह लेख तर्क देता है कि AI एजेंट अक्सर अधूरी निर्देशों के आधार पर कार्य करते हुए, गायब जानकारी की अनुमान लगाते हैं, जिसे "प्री-एक्जीक्यूशन कन्फर्मेशन फेलियर" कहा जाता है। यह किसी भी कार्य लेने से पहले ज्ञात और अज्ञात चीजों की पुष्टि करने की आवश्यकता वाले रनटाइम-प्रवर्धित संरचना का प्रस्ताव देता है।

github llama.cpp · 5 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9822 रिलीज

llama.cpp प्रोजेक्ट ने b9822 रिलीज प्रकाशित की है, जिसमें macOS, iOS, Linux, Android और Windows के लिए पूर्व-निर्मित बाइनरी शामिल हैं। इस अपडेट में test-chat-template --no-common विकल्प के लिए एक सुधार शामिल है और विभिन्न हार्डवेयर आर्किटेक्चर और एक्सेलेरेटर पर बिल्ड वितरित किए गए हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9823 रिलीज में विंडोज ओपेनवीनो और बाइनरी अपडेट्स शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9823 प्रकाशित किया है, जिसमें macOS, iOS, Linux, Android, Windows, और openEuler प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं। इस रिलीज में एक प्रमुख बदलाव चेक-रिलीज पाइपलाइन में विंडोज ओपेनवीनो बिल्ड का जोड़ना है।

github llama.cpp · 5 दिन पहले

llama.cpp b9824 रिलीज़: बाइनरी नामांतरण और नए बिल्ड

llama.cpp प्रोजेक्ट ने संस्करण b9824 जारी किया है, जिसमें rpc-server और export-graph-ops बाइनरी में सुधार शामिल हैं। `export-graph-ops` टूल को टेस्ट नामकरण अनुपालन का पालन करने के लिए नामांतरित किया गया है, जबकि `rpc-server` को सिस्टम निर्देशिकाओं में संघर्षों से बचने के लिए `ggml-rpc-server` में नामांतरित किया गया है।