सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 3 / 5

llama.cpp b9827 रिलीज में CUDA 2D async copy ऑप्टिमाइज़ेशन जोड़ा गया

llama.cpp की b9827 रिलीज ने ggml_cuda_cpy फ़ंक्शन में cudaMemcpy2DAsync फास्ट पथ जोड़कर CUDA के लिए एक प्रदर्शन ऑप्टिमाइज़ेशन पेश किया है। यह बदलाव उन स्ट्राइडेड कॉपीज को तेज़ करता है जहाँ टेंसर पूरी तरह से कंटिग्यूस नहीं होते लेकिन प्रत्येक पंक्ति कंटिग्यूस होती है, जिसमें धीमे एलिमेंट-वाइज स्केलर कॉपी kernels की जगह लेता है।

github llama.cpp · 4 दिन पहले

llama.cpp b9825 रिलीज़: Vulkan फिक्स और क्रॉस-प्लेटफ़ॉर्म बाइनरीज़

llama.cpp प्रोजेक्ट ने संस्करण b9825 जारी किया है, जिसमें शून्य इनपुट हैंडल करते समय Vulkan स्टेप ऑपरेटर के लिए एक फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Windows, Android और openEuler के लिए प्री-बिल्ड बाइनरीज़ प्रदान करता है।

github llama.cpp · 4 दिन पहले

SYCL norm फिक्स के साथ llama.cpp b9826 रिलीज

llama.cpp प्रोजेक्ट ने b9826 रिलीज जारी की है, जिसमें SYCL में norm फ़ंक्शन से जुड़े विफल यूनिट टेस्ट केसों के लिए एक फिक्स शामिल है। यह अपडेट कई प्लेटफॉर्म और हार्डवेयर एक्सेलेरेटर पर पूर्व-बिल्ड बाइनरी और फ्रेमवर्क प्रदान करता है।

github llama.cpp · 4 दिन पहले

macOS, Linux, Windows बाइनरी के साथ llama.cpp b9822 रिलीज

llama.cpp प्रोजेक्ट ने b9822 रिलीज प्रकाशित की है, जिसमें macOS, iOS, Linux, Android और Windows के लिए पूर्व-निर्मित बाइनरी शामिल हैं। इस अपडेट में test-chat-template --no-common विकल्प के लिए एक सुधार शामिल है और विभिन्न हार्डवेयर आर्किटेक्चर और एक्सेलेरेटर पर बिल्ड वितरित किए गए हैं।

github llama.cpp · 4 दिन पहले

llama.cpp b9823 रिलीज में विंडोज ओपेनवीनो और बाइनरी अपडेट्स शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9823 प्रकाशित किया है, जिसमें macOS, iOS, Linux, Android, Windows, और openEuler प्लेटफॉर्म के लिए पूर्व-निर्मित बाइनरी उपलब्ध हैं। इस रिलीज में एक प्रमुख बदलाव चेक-रिलीज पाइपलाइन में विंडोज ओपेनवीनो बिल्ड का जोड़ना है।

github llama.cpp · 4 दिन पहले

llama.cpp b9824 रिलीज़: बाइनरी नामांतरण और नए बिल्ड

llama.cpp प्रोजेक्ट ने संस्करण b9824 जारी किया है, जिसमें rpc-server और export-graph-ops बाइनरी में सुधार शामिल हैं। `export-graph-ops` टूल को टेस्ट नामकरण अनुपालन का पालन करने के लिए नामांतरित किया गया है, जबकि `rpc-server` को सिस्टम निर्देशिकाओं में संघर्षों से बचने के लिए `ggml-rpc-server` में नामांतरित किया गया है।

github vLLM · 4 दिन पहले

v0.24.0

v0.24.0 रिलीज में MoE Refactor Qwen3 NVFP4 कॉन्फ़िगरेशन के लिए GSM8K स्टार्टअप टाइमआउट बढ़ाने के लिए एक निरंतर एकीकरण अद्यतन शामिल है।

lab OpenAI News · 4 दिन पहले

OpenAI ने GPT-5.6 Sol, Terra और Luna मॉडलों का पूर्वावलोकन प्रस्तुत किया

OpenAI ने GPT-5.6 श्रृंखला की सीमित पूर्वावलोकन शुरू की है, जिसमें तीन नए मॉडल शामिल हैं: Sol फ्लैगशिप के रूप में, Terra संतुलित दैनिक कार्यों के लिए, और Luna तेज़ और किफ़ायती कार्यों के लिए। कंपनी इन मॉडलों को भरोसेमंद भागीदारों के साथ इस प्रारंभिक चरण के बाद आने वाली कुछ हफ्तों में सामान्य रूप से उपलब्ध कराने की योजना बना रही है।

lab Claude Code Releases · 5 दिन पहले

Claude Code v2.1.195 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.195 में कई फिक्स और सुधार शामिल हैं, जिनमें फुलस्क्रीन मोड में माउस नियंत्रण के लिए नए पर्यावरण चर और हुक मैचर लॉजिक में सुधार शामिल हैं।

github MCP (GitHub org) · 5 दिन पहले

MCP Python SDK v2.0.0a3 रिलीज नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना तीसरा अल्फा संस्करण, v2.0.0a3 जारी किया है, जिसमें महत्वपूर्ण प्रोटोकॉल और आर्किटेक्चरल बदलाव शामिल हैं जबकि स्थिर 1.x उपयोगकर्ताओं के लिए बैकवर्ड कंपैटिबिलिटी बनाए रखी गई है।

github MCP (GitHub org) · 5 दिन पहले

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK v1.28.1 रिलीज

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK ने संस्करण 1.28.1 जारी किया है, जिसमें स्ट्रीम हैंडलिंग और ट्रांसपोर्ट सुरक्षा में अपडेट शामिल हैं।

github SGLang · 5 दिन पहले

v0.5.14

लेख में संस्करण 0.5.14 के रिलीज़ की घोषणा की गई है।

lab Claude Code Releases · 5 दिन पहले

क्लाउड कोड v2.1.193 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.193 ऑटो-मोड वर्गीकरण, टेलीमेट्री लॉगिंग और बैकग्राउंड एजेंट प्रबंधन में कई सुधार लाता है। इस अपडेट में UI स्टेट समस्याओं, MCP सर्वरों में प्रमाणीकरण हैंडलिंग और विभिन्न बैकग्राउंडिंग बग के लिए फिक्स भी शामिल हैं।

lab Cohere Blog · 6 दिन पहले

AI एजेंट्स के साथ फॉर्क रखरखाव को स्वचालित करना

यह लेख AI कोडिंग एजेंट्स का उपयोग करके सॉफ्टवेयर फॉर्क्स के रखरखाव को स्वचालित करने की एक विधि का वर्णन करता है, जिसका अनुप्रयोग Cohere के vLLM के फॉर्क पर किया गया है। यह दृष्टिकोण मैन्युअल हस्तक्षेप को एक स्वचालित फीडबैक लूप से बदलकर अपस्ट्रीम रिलीजों को एकीकृत करने में लगने वाले समय को सप्ताहों से दिनों तक कम कर देता है।

lab Microsoft Research Blog · 6 दिन पहले

AI-संचालित व्याख्याओं और प्रयोगों के साथ मस्तिष्क को समझना

शोधकर्ताओं ने जनरेटिव काज़ुअल टेस्टिंग (GCT) विकसित की है, एक फ्रेमवर्क जो अविश्लेषणीय LLM-आधारित मस्तिष्क-पूर्वानुमान मॉडलों को कॉर्टिकल कार्य के बारे में संक्षिप्त, परीक्षण योग्य मौखिक परिकल्पनाओं में परिवर्तित करता है। यह विधि मॉडल पैरामीटरों को छोटे वाक्यांशों में निचोड़ती है जो वर्णन करते हैं कि विशिष्ट मस्तिष्क क्षेत्र किसके प्रति प्रतिक्रिया करते हैं, जैसे "खाना तैयार करना", और फिर लक्षित fMRI प्रयोगों के माध्यम से इन व्याख्याओं की पुष्टि करते हैं।

lab Google — The Keyword (AI) · 6 दिन पहले

Google Finance ने नए Android ऐप के साथ बेटा चरण समाप्त किया

Google Finance आधिकारिक तौर पर अपने बेटा चरण से बाहर निकल रहा है और Android डिवाइसों के लिए एक समर्पित एप्लिकेशन लॉन्च कर रहा है।

github vLLM · 6 दिन पहले

v0.24.0rc2: DP Supervisor के साथ P/D को ठीक करें (#46628)

यह रिलीज कैंडिडेट vLLM प्रोजेक्ट में डेटा पैरेलेलिज्म (DP) सुपरवाइजर के साथ Prefill/Decode (P/D) फंक्शनलिटी के लिए एक फिक्स को संबोधित करता है।

lab Cohere Blog · 6 दिन पहले

कॉहेर ने कस्टम MCP सर्वर के जरिए नॉर्थ और विज़ के साथ इंसिडेंट रिस्पॉन्स को ऑटोमेट किया

कॉहेर ने अपने एंटरप्राइज़ AI प्लेटफ़ॉर्म, कॉहेर नॉर्थ का उपयोग करके एक सुरक्षा एजेंट विकसित किया, जिसे कस्टम मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर के जरिए क्लाउड सुरक्षा प्लेटफ़ॉर्म विज़ के साथ इंटीग्रेट किया गया। यह आर्किटेक्चर नॉर्थ को विज़ के GraphQL API से आठ एटॉमिक टूल्स के जरिए कनेक्ट करता है, जिससे एकल प्रॉम्प्ट से ऑटोमेटेड इंसिडेंट रिस्पॉन्स वर्कफ़्लो सक्षम होते हैं। सिस्टम अटैक चेन का मूल्यांकन करने और इंटरनेट एक्सपोज़र और प्राइविलेज लेवल के आधार पर जोखिमों को रैंक करने के जरिए टॉक्सिक कॉम्बिनेशन ब्लास्ट रेडियस विश्लेषण लगभग 20 सेकंड में करता है। यह मुद्दे की जानकारी प्राप्त करना, लीनियर टिकट बनाना, विज़ स्थिति अपडेट करना और संरचित इंसिडेंट रिस्पॉन्स रिपोर्ट तैयार करके एंड-टू-एंड जांच को भी ऑटोमेट करता है। इसके अलावा, एक शेड्यूल्ड वीकली ऑटोमेशन बिना किसी मैन्युअल हस्तक्षेप के हर सोमवार सुबह एक सुरक्षा पोस्चर ब्रीफ़ जनरेट करता है। यह इंटीग्रेशन प्रति फाइंडिंग पहले के 30 मिनट से दो घंटे के ट्रायज लूप को समाप्त कर देता है, जिससे इंजीनियर कच्चे अलर्टों पर ध्यान देने के बजाय एसेसमेंट का मूल्यांकन करने पर ध्यान केंद्रित कर सकते हैं।

lab OpenAI News · 6 दिन पहले

OpenAI शोध दिखाता है कि AI एजेंट्स काम को बदल रहे हैं

OpenAI से एक नया शोध पत्र प्रदर्शित करता है कि कृत्रिम बुद्धिमत्ता एजेंट्स काम की प्रकृति को मौलिक रूप से कैसे बदल रहे हैं। अध्ययन इन एजेंट्स की क्षमता पर प्रकाश डालता है कि वे पहले की तुलना में लंबे और अधिक जटिल कार्यों को कैसे निष्पादित कर सकते हैं। इस तकनीकी उन्नति को विभिन्न पेशा भूमिकाओं में उत्पादकता का विस्तार करने के लिए जिम्मेदार ठहराया गया है। निष्कर्ष सुझाव देते हैं कि स्वचालन के माध्यम से श्रम को कैसे संगठित और निष्पादित किया जाता है, उसमें एक महत्वपूर्ण बदलाव आ रहा है। जटिल कार्यप्रवाह को संभालकर, AI एजेंट्स उपयोगकर्ताओं को अधिक दक्षता प्राप्त करने में सक्षम बना रहे हैं। पत्र आधुनिक रोजगार पर स्वतंत्र प्रणालियों के बढ़ते प्रभाव का सबूत के रूप में कार्य करता है।

lab Claude Code Releases · 7 दिन पहले

Claude Code v2.1.191 रिलीज नोट्स

Claude Code संस्करण 2.1.191 में /rewind समर्थन पेश किया गया है, जिससे उपयोगकर्ता /clear कमांड चलाने से पहले की बातचीत को फिर से शुरू कर सकते हैं। इस अपडेट ने कई महत्वपूर्ण समस्याओं को ठीक किया है, जिनमें रोके जाने के बाद बैकग्राउंड एजेंट्स का पुनर्जीवित होना और स्ट्रीमिंग प्रतिक्रियाओं के दौरान स्क्रॉल स्थिति का कूदना शामिल हैं। यह /voice द्वारा सामान्य त्रुटि संदेश दिखाने और Windows Terminal में /login URLs के truncated होने की व्यवस्था को भी ठीक करता है। MCP सर्वरों के लिए विश्वसनीयता में महत्वपूर्ण सुधार किए गए हैं, जिनमें क्षमता खोज और OAuth प्रवाह के दौरान अस्थायी नेटवर्क त्रुटियों के लिए पुनः प्रयास तर्क जोड़ा गया है। हेडलेस वातावरण अब OAuth के लिए ब्राउज़र पॉपअप को छोड़ देते हैं, जबकि सैंडबॉक्स नेटवर्क अनुमतियां सत्र की अवधि के लिए याद रखी जाती हैं। प्रदर्शन अनुकूलन टेक्स्ट अपडेट कोalescing के माध्यम से स्ट्रीमिंग के दौरान CPU उपयोग को लगभग 37% कम करते हैं और टर्मिनल आउटपुट कैश से लंबे-सत्र मेमोरी वृद्धि को रोकते हैं।