हम सब कहीं से शुरू करते हैं
वेब तकनीकों में 25 साल से अधिक के अनुभव वाले एक डेवलपर टूल्स का उपयोग करने से परे जाने और उन्हें बनाना समझने के लिए AI इंजीनियरिंग में संक्रमण कर रहे हैं।
वेब तकनीकों में 25 साल से अधिक के अनुभव वाले एक डेवलपर टूल्स का उपयोग करने से परे जाने और उन्हें बनाना समझने के लिए AI इंजीनियरिंग में संक्रमण कर रहे हैं।
एक उपयोगकर्ता ने रिपोर्ट की है कि उनका निजी Hugging Face Space, विशेष रूप से 'Ark-kun/tangent', अचानक काम करना बंद कर दिया और इसे पुनः आरंभ नहीं किया जा सकता है। इसे पुनः आरम्रभ करने या फैक्ट्री रीबिल्ड करने के प्रयास "503. इस Space को पुनः आरंभ करते समय कुछ गलत हो गया" त्रुटि के साथ विफल रहते हैं।
एक इंजीनियरिंग सिमुलेशन पेशेवर महंगे कंप्यूटेशनल फ्लुइड डायनामिक्स (CFD) और फाइनाइट एलिमेंट एनालिसिस (FEA) सॉल्वर रन के खर्च को कम करने के लिए मशीन लर्निंग सर्फोगेट्स की वास्तविक दुनिया की तैनाती अनुभवों की तलाश कर रहा है।
llama.cpp की b9840 रिलीज में DeepSeek V4 मॉडल के लिए कन्वर्जन सपोर्ट पेश किया गया है, जिसमें Pro वेरिएंट के लिए विशेष हैंडलिंग भी शामिल है। इस अपडेट ने लाइब्रेरी में नई आर्किटेक्चर को विभिन्न इंटरनल ऑप्टिमाइज़ेशन और बग फिक्स के साथ एकीकृत किया है।
OpenAI Economic Research ने अपनी AI Jobs Transition Framework को यूरोपीय संघ तक विस्तारित किया है, जिसमें ESCO टैक्सोनॉमी और Eurostat डेटा का उपयोग करके यह विश्लेषण किया गया है कि एआई क्षमताएं सदस्य राज्यों में श्रम बाजारों को कैसे बदल सकती हैं।
llama.cpp प्रोजेक्ट ने संस्करण b9839 जारी किया है, जिसमें अनदेखी वुडट्रीज़ में Tailwind स्कैनिंग को पुनर्स्थापित करने के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न आर्किटेक्चर्स और हार्डवेयर एक्सेलरेशन बैकएंड्स पर macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।
llama.cpp प्रोजेक्ट ने संस्करण b9838 जारी किया है, जो विभिन्न ऑपरेटिंग सिस्टम और हार्डवेयर एक्सेलेरेटरों के लिए पूर्व-बिल्ड बाइनरी प्रदान करता है। इस रिलीज में macOS, Linux, Windows, Android, और openEuler पर CPU, GPU (CUDA, Vulkan, ROCm, OpenCL), और विशेष AI एक्सेलेरेटर्स के लिए समर्थन शामिल है।
जनरेशनल कॉन्टेक्स्ट आर्किटेक्चर (GCA) एक LLM के संदर्भ विंडो को अनंत स्टोरेज के बजाय एक सीमित जीवनकाल मानने का प्रस्ताव देता है ताकि मल्टी-एजेंट सिस्टम में "संदर्भ क्षरण" और ध्यान पतली होने की समस्या को हल किया जा सके। कृत्रिम मृत्युशक्ति लागू करके, एजेंटों को प्रदर्शन गिरने से पहले समाप्त कर दिया जाता है, जो अपनी स्थिति को एक फ्लैट-फ़ाइल Markdown वॉल्ट के माध्यम से नई पीढ़ियों में सौंपते हैं।
एक स्वतंत्र शोधकर्ता ने GPT-2, OPT-125M और Llama-3.2-1B सहित सात खुले-वजन मॉडलों में निष्पादन के दौरान छिपी प्रतिनिधित्वों के विकास का विश्लेषण किया है, मानक आउटपुट बेंचमार्क्स से परे आंतरिक गतिशीलता शासनों की पहचान करने के लिए।
यह स्वतंत्र शोध परियक्ति छह छोटे और मध्यम आकार के भाषा मॉडलों की आंतरिक गतिशीलता का वर्णन करता है, जो मानक आउटपुट बेंचमार्क्स पर निर्भर करने के बजाय इनफरेंस के दौरान छिपी हुई निरूपणों के विकास का विश्लेषण करती है। अध्ययन विभिन्न वास्तुकलाओं के बीच पुनरुत्पादित पैटर्न की पहचान करने के लिए गतिशील व्यवहार, कार्यात्मक संगठन और निरूपण ज्यामिति की जांच करता है।
एक डेवलपर ने एक वर्ल्ड कप 2026 पूर्वानुमान टूल बनाया है जो टूर्नामेंट के परिणामों को सिमुलेट करने के लिए ऐतिहासिक डेटा का उपयोग करता है। यह एप्लिकेशन लगभग 50,000 अंतर्राष्ट्रीय मैचों से सीखे गए पैटर्न के आधार पर किसी भी दो राष्ट्रीय टीमों के लिए जीत की संभावना और स्कोर पूर्वानुमान प्रदान करता है।
कार्लेस मारिन ने एक ओपन-सोर्स, द्विभाषी (अंग्रेजी और स्पैनिश) मार्गदर्शिका जारी की है जो ट्रांसफॉर्मर आर्किटेक्चर के गणितीय आधार को उनके व्यावहारिक कार्यान्वयन से जोड़ती है। संसाधन निचले स्तर की यांत्रिकी पर केंद्रित है, जटिल विषयों को समझाने के लिए पुनरुत्पादक कोड और इंटरैक्टिव तत्व प्रदान करता है।
Transformers के आंतरिक कार्यों का विवरण देने वाला एक ओपन-सोर्स, द्विभाषी (अंग्रेजी/स्पैनिश) गाइड प्रकाशित किया गया है। संसाधन ध्यान पतन और KV-cache संपीड़न जैसे अवधारणाओं के पीछे सटीक गणित और यांत्रिकी को कवर करता है।
सफल पायलट के बाद HP Inc. अपनी OpenAI के साथ रणनीतिक साझेदारी को बढ़ा रहा है, ग्राहक अनुभवों, कर्मचारी उत्पादकता और सॉफ्टवेयर विकास में AI तैनात कर रहा है। कंपनी संदर्भ, अनुमतियों और मूल्यांकन को नियंत्रित करने के लिए एक एकीकृत परिचालन मॉडल के रूप में OpenAI Frontier प्लेटफ़ॉर्म का उपयोग कर रही है, जैसे कि यह प्रयोगात्मक उपयोग मामलों से व्यापक उद्योग-व्यापी उत्पादन की ओर बढ़ रही है।
llama.cpp प्रोजेक्ट ने संस्करण b9837 जारी किया है, जिसने Jinja चैट टेम्पलेट के लिए एक नया `--reasoning-preserve` फ्लैग पेश किया है ताकि तर्क टोकन को बनाए रखा जा सके। इस अपडेट में सुधारी गई मदद संदेश भी शामिल हैं और विभिन्न हार्डवेयर बैकएंड पर macOS, Linux, Windows, Android और openEuler के लिए पूर्व-निर्मित बाइनरी प्रदान की गई हैं।
लेखक HoLo-ToLk का परिचय देते हैं, जो टोकनाइज़र्स या सीखे गए इनपुट एम्बेडिंग्स के बिना शून्य-पैरामीटर HSL बाइट सबस्ट्रेट का उपयोग करके स्पीच-टू-टेक्स्ट (STT) और टेक्स्ट-टू-स्पीच (TTS) मॉडल बनाने वाला एक शोध परियोजना है। यह कार्य दिखाता है कि विशिष्ट आर्किटेक्चरल संशोधनों के साथ संयोजन में कच्चे HSL बाइट्स ऑडियो प्रोसेसिंग के लिए एक वैध सिग्नल के रूप में काम कर सकते हैं।
llama.cpp प्रोजेक्ट ने संस्करण b9835 जारी किया है, जिसमें सिंगल-मोड में स्टॉप और रीजनिंग स्किप फंक्शनलिटी के लिए एक फिक्स शामिल है। यह अपडेट मॉडल इनफरेंस के दौरान बेहतर नियंत्रण सुनिश्चित करने के लिए यूज़र इंटरफ़ेस में विशिष्ट समस्याओं को हल करता है।
एक फोरम उपयोगकर्ता ने यह अनुमानित प्रश्न उठाया है कि न्यूरल नेटवर्क्स या AI सिस्टम को बाइनरी कोड को समझने के लिए प्रशिक्षित करने से उनकी सामान्य क्षमताओं, विशेष रूप से कोडिंग कार्यों में, क्या महत्वपूर्ण रूप से वृद्धि होगी।
एक उपयोगकर्ता एक वेबसाइट की अवधारणा का प्रस्ताव देते हैं जहां व्यक्ति AI मॉडल को प्रशिक्षित करने के लिए डेटा का आदान-प्रदान करते हैं, जिससे मौद्रिक लेनदेन की आवश्यकता समाप्त हो जाती है। सिस्टम एक क्रेडिट-आधारित अर्थव्यवस्था पर काम करता है जहां उपयोगकर्ता क्रेडिट्स की एक निर्धारित राशि के साथ शुरू होते हैं और विशिष्ट डेटा आवश्यकताओं के लिए बounty पोस्ट करते हैं।
llama.cpp प्रोजेक्ट ने संस्करण b9833 जारी किया है, जिसमें MiniCPM5 मॉडल के लिए एक समर्पित पार्सर के साथ विभिन्न बग फिक्स और रीफैक्टरिंग शामिल हैं। इस अपडेट में टूल कॉल पार्सिंग, ग्रामर सरलीकरण, और Jinja2 मानकों के साथ संगतता सुनिश्चित करने के लिए संशोधित Jinja API व्यवहार का समर्थन शामिल है।