सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 1 / 19

क्षमता वजन में नहीं है: MLP वजन प्रक्षेपण पर एक अनुभवजन्य नकारात्मक परिणाम

एक अनुभवजन्य अध्ययन ने पाया कि एक ट्रांसफॉर्मर मॉडल से दूसरे में MLP वजन को प्रक्षेपित करना अर्थवैज्ञानिक क्षमता को स्थानांतरित करने में विफल रहा। प्रत्येक परीक्षण किए गए विकल्प ने संशोधित नहीं किए गए होस्ट मॉडल की तुलना में खराब प्रदर्शन किया, जो वजन प्रक्षेपण में एक संरचनात्मक सीमा को दर्शाता है। परिणाम बेंचमार्क के आधार पर मॉडल क्षमताओं के बारे में सार्वजनिक दावों को चुनौती देते हैं, यह दिखाते हुए कि ऐसे दावे वास्तविक आंतरिक वजन ज्यामिति को प्रतिबिंबित नहीं करते हैं।

media Hugging Face Forums · 10 दिन पहले

द क्लॉकवर्क डार्क: एक लोकल-फर्स्ट AI नैरेटिव-RPG इंजन

द क्लॉकवर्क डार्क एक लोकल-फर्स्ट, AI-संचालित नैरेटिव-RPG इंजन है जो सभी गेम मैकेनिक्स को हल करने के लिए एक निर्धारित स्टेट मशीन का उपयोग करता है। इसमें दो स्वतंत्र LLMs हैं जो कहानी की कथा सुनाते हैं, जहाँ एक धैर्यवान दुनिया की आवाज़ के रूप में कार्य करता है और दूसरा एक अविश्वसनीय, देवता जैसे सहायक के रूप में। गेम खेलने वालों को एक विकल्प प्रदान करता है: बढ़ती हुई अलौकिक भ्रष्टाचार से लड़ें या एक बेकरी में शांत जीवन अपनाएं, और दोनों रास्तों को वैध अंत माना जाता है।

media Hugging Face Forums · 10 दिन पहले

Docker कंटेनर चल रहे होने के बावजूद 'शुरू' पर अनंत रूप से फंसा हुआ

एक उपयोगकर्ता की रिपोर्ट है कि rocker/r2u पर R/Shiny वाले उनके Docker कंटेनर ने सफलतापूर्वक बिल्ड किया और लॉग में 'Listening on http://0.0.0.0:7860' दिखाया, फिर भी स्थान 'starting' अवस्था में बना हुआ है और अदृश्य है। कोड में कोई त्रुटि न होने के बावजूद समस्या बनी हुई है, और उपयोगकर्ता व्यापक ध्यान चाहते हैं, यह नोट करते हुए कि यह Hugging Face की प्लेटफ़ॉर्म-साइड समस्या हो सकती है।

media Hugging Face Forums · 10 दिन पहले

शोर भरे ऑडियो पर NOVA-VAD ने 93% सटीकता के साथ Silero, Pyannote और WebRTC को हराया

NOVA-VAD, एक हल्का और व्याख्या योग्य वॉयस एक्टिविटी डिटेक्टर, UrbanSound8K डेटासेट से शोर भरे ऑडियो पर 93% सटीकता प्राप्त करता है, जो WebRTC (58%), Pyannote (62%) और Silero (87%) को पीछे छोड़ता है। यह केवल scikit-learn का उपयोग करता है, GPU की आवश्यकता नहीं होती है, और साधारण अंग्रेजी में फीचर महत्व और आत्मविश्वास स्कोर प्रदान करता है।

media Hugging Face Forums · 10 दिन पहले

OLMo-core और Engram ग्राफ्ट का छोटे पैमाने पर डीबग तुलना

एक बेस OLMo3 600M मॉडल और एक DeepSeek-शैली Engram ग्राफ्ट वाले संस्करण के बीच 200-स्टेप प्रशिक्षण तुलना में कम प्रशिक्षण और मूल्यांकन हानि, तेज़ grad-norm स्थिरीकरण, और बेहतर शुरुआती शिक्षण व्यवहार दिखाई देता है। Engram ग्राफ्ट, जो परतों 1 और 5 में इंजेक्ट किया गया है, ट्रेनेबल पैरामीटर को ~1.7B तक बढ़ाता है लेकिन प्रति टोकन सक्रिय पैरामीटर में केवल 40k की वृद्धि बनाए रखता है, जो कि दक्षतापूर्ण मेमोरी उपयोग को संकेत करता है।

media Hugging Face Forums · 10 दिन पहले

ज्ञानात्मक त्वरक के रूप में LLMs: जोखिम केवल भ्रम नहीं है

LLM केवल भ्रम (hallucinate) नहीं करते; वे कमजोर परिकल्पनाओं को साक्ष्यों की पुष्टि होने से पहले सुसंगत और परिष्कृत दावों में बदलकर मानव ज्ञानात्मक अतिआत्मविश्वास को बढ़ाते हैं। यह शोध, नीति और अन्य क्षेत्रों में समय से पहले निश्चितता का जोखिम पैदा करता है, न कि इसलिए क्योंकि मॉडल झूठ बोलते हैं, बल्कि इसलिए क्योंकि वे सुंदर व्याख्याओं पर अनिश्चितता को प्राथमिकता देने की मानव प्रवृत्तियों को तेज करते हैं।

media Hugging Face Forums · 10 दिन पहले

Tenstorrent AI एक्सेलेरेटर कार्ड उपलब्ध

Tenstorrent ने Wormhole और Blackhole AI एक्सेलेरेटर कार्ड जारी किए हैं। हार्डवेयर खंड इन कार्डों की सूची देता है, जिसमें चर्चा है कि कौन से मॉडल संभवतः संगत होंगे।

media Hugging Face Forums · 10 दिन पहले

Space पुराने commit पर 16+ घंटों से 'Restarting' में फंसा हुआ है

एक Hugging Face Space commit 8240352 पर 16+ घंटों से 'Restarting' दिखा रहा है, हालांकि कई नए commits सफलतापूर्वक build हो रहे हैं। लॉग में container स्वस्थ रूप से शुरू होता है, लेकिन traffic कभी भी नए version पर नहीं जाता है, और factory rebuild या restart जैसे recovery actions का कोई प्रभाव नहीं होता है।

github llama.cpp · 10 दिन पहले

llama.cpp Release b9751: नए बाइनरी और फिक्स

llama.cpp ने macOS, Linux, Android, Windows, और openEuler के लिए अपडेटेड बाइनरी के साथ version b9751 जारी किया। इस रिलीज में मेमोरी उपयोग के लिए फिक्स शामिल हैं और यह Vulkan, CUDA, OpenVINO, और SYCL जैसे कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों का समर्थन करती है।

github llama.cpp · 10 दिन पहले

llama.cpp रिलीज b9752: सर्वर रिफैक्टर और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp ने संस्करण b9752 जारी किया है, जिसमें बैट कन्स्ट्रक्शन पर ध्यान केंद्रित करते हुए सर्वर रिफैक्टर शामिल है, जिसमें बैट फुल केस का बेहतर हैंडलिंग और बग फिक्स शामिल हैं। इस रिलीज में macOS, Linux, Android, Windows, और openEuler के लिए प्रीबिल्ट बाइनरी शामिल हैं, जो CUDA, Vulkan, OpenVINO, और SYCL जैसे विभिन्न आर्किटेक्चर और एक्सेलरेशन फ्रेमवर्क का समर्थन करती हैं।

github llama.cpp · 10 दिन पहले

llama.cpp Release b9753: नए बाइनरी और प्रगति रिपोर्टिंग

llama.cpp संस्करण b9753 में स्पेसिफिकेशन मॉडल लोड करने के लिए बेहतर प्रगति रिपोर्टिंग पेश की गई है, जिसमें एक नया "stages" सूची शामिल है। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए बाइनरी शामिल हैं, जो कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों जैसे Vulkan, CUDA, OpenVINO और SYCL पर उपलब्ध हैं।

github llama.cpp · 10 दिन पहले

llama.cpp रिलीज़ b9754: नया AC पार्सर और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp संस्करण b9754 में common/peg मॉड्यूल के लिए कठोर व्याकरण जनरेशन के लिए एक AC पार्सर शामिल है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए प्रीकंपाइंड बाइनरी शामिल हैं, जो Vulkan, CUDA, OpenVINO और SYCL जैसे विभिन्न आर्किटेक्चर और एक्सेलरेशन तकनीकों का समर्थन करती हैं।

github llama.cpp · 10 दिन पहले

Android बिल्ड के लिए libandroid-spawn निर्भरता जोड़ें

Android बिल्ड दस्तावेज़ीकरण को libandroid-spawn पर निर्भरता शामिल करने के लिए अपडेट किया गया है। यह जोड़ विशेष वातावरण के भीतर बिल्डिंग प्रक्रिया का समर्थन करने के लिए किया गया है।

lab OpenAI News · 10 दिन पहले

सैमसंग ने कर्मचारियों के लिए ChatGPT और Codex को तैनात किया

सैमसंग इलेक्ट्रॉनिक्स ने अपने वैश्विक कार्यबल के लिए OpenAI के ChatGPT Enterprise और Codex को लॉन्च किया है। यह डिप्लॉयमेंट अभी तक के OpenAI के सबसे बड़े एंटरप्राइज़ AI पहलों में से एक है।

github llama.cpp · 11 दिन पहले

llama.cpp रिलीज b9750: नया call स्टेटमेंट और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp संस्करण b9750 में एक call स्टेटमेंट कार्यान्वयन पेश किया गया है और एक अनचाहे बदलाव को वापस ले लिया गया है। इस रिलीज में macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-कंपाइल किए गए बाइनरी शामिल हैं, जो कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों जैसे Vulkan, CUDA, OpenVINO, और SYCL पर उपलब्ध हैं।

github llama.cpp · 11 दिन पहले

llama.cpp ने b9748 संस्करण नए बाइनरी और फीचर्स के साथ जारी किया

llama.cpp ने b9748 संस्करण जारी किया, जिसमें अपने स्कीमा में एक "verbose" फ़ील्ड जोड़ी गई है और macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी प्रदान किए गए हैं। इस रिलीज में कई आर्किटेक्चर पर CPU, Vulkan, OpenVINO, SYCL, और ROCm समर्थन शामिल है, साथ ही iOS और Windows CUDA और Vulkan बिल्ड्स उपलब्ध हैं।

media Hugging Face Forums · 11 दिन पहले

फंसे हुए Hugging Face Space को जबरन हटाने का अनुरोध

उपयोगकर्ता "Building" स्थिति में फंसे Hugging Face Space "kayinda/rxsteward" को जबरन हटाने का अनुरोध करता है। सभी हटाने की प्रयास 403 त्रुटियों या 400 अमान्य इनपुट त्रुटियों के साथ विफल हो जाते हैं, जिससे नाम का पुनः उपयोग नहीं हो पाता।

lab Hugging Face Blog · 11 दिन पहले

क्या आप फाइन-ट्यूनिंग में LoRA को हरा सकते हैं?

एक नई अध्ययन लोकप्रिय फाइन-ट्यूनिंग तकनीक LoRA के विकल्पों का अन्वेषण करती है, यह मूल्यांकन करते हुए कि क्या अन्य विधियाँ कम कंप्यूटेशनल लागत के साथ बेहतर प्रदर्शन प्राप्त कर सकती हैं। शोध पाता है कि हालांकि कुछ दृष्टिकोण वादा दिखाते हैं, लेकिन कोई भी विविध कार्यों और डेटासेट्स पर लगातार LoRA को हरा नहीं पाता है।

lab Google DeepMind Blog · 11 दिन पहले

आंतरिक सिस्टम सुरक्षा के लिए एआई कंट्रोल रोडमैप

एक एआई कंट्रोल रोडमैप पेश किया गया है, जो पारंपरिक सुरक्षा उपायों को रियल-टाइम मॉनिटिंग क्षमताओं के साथ एकीकृत करके आंतरिक सिस्टम को सुरक्षित बना रहा है।

lab OpenAI News · 11 दिन पहले

GPT-5.5 Instant ने ChatGPT के स्वास्थ्य प्रतिक्रियाओं में सुधार किया है

GPT-5.5 Instant मजबूत तर्कशक्ति, बेहतर संदर्भ हैंडलिंग, स्पष्ट संचार और चिकित्सकों द्वारा दी गई प्रतिक्रियाओं के माध्यम से ChatGPT की स्वास्थ्य और कल्याण संबंधी प्रतिक्रियाओं में सुधार करता है।