सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 1 / 10

OpenAI ने GPT-5.6 Sol, Terra और Luna मॉडलों का पूर्वावलोकन प्रस्तुत किया

OpenAI ने GPT-5.6 श्रृंखला की सीमित पूर्वावलोकन शुरू की है, जिसमें तीन नए मॉडल शामिल हैं: Sol फ्लैगशिप के रूप में, Terra संतुलित दैनिक कार्यों के लिए, और Luna तेज़ और किफ़ायती कार्यों के लिए। कंपनी इन मॉडलों को भरोसेमंद भागीदारों के साथ इस प्रारंभिक चरण के बाद आने वाली कुछ हफ्तों में सामान्य रूप से उपलब्ध कराने की योजना बना रही है।

github llama.cpp · 5 दिन पहले

llama.cpp b9817 रिलीज़: OpenVINO 2026.2.1 अपडेट और ऑपरेटर में सुधार

llama.cpp b9817 रिलीज़ OpenVINO बैकएंड को संस्करण 2026.2.1 पर अपडेट करता है और अपने रिलीज़ पैकेजों को स्वयं-समर्थित बनाता है। इस अपडेट में OpenVINO बैकएंड के भीतर कई ऑपरेटर सुधार शामिल हैं, जैसे कि हार्डकोडेड compute_op_type सेट्स को हटा देना और sink इनपुट के साथ softmax को सक्षम करना।

github llama.cpp · 5 दिन पहले

llama.cpp b9813 रिलीज में Intel Xe-LPG Plus Vulkan समर्थन जोड़ा गया

llama.cpp की b9813 रिलीज ने INTEL_XE1 आर्किटेक्चर एनम को जोड़ने और coopmat1 को सक्षम करने के माध्यम से Intel Xe-LPG Plus हार्डवेयर के लिए Vulkan समर्थन पेश किया है। यह अपडेट पिछले कोड टिप्पणियों को संबोधित करता है, आर्किटेक्चर पहचानकर्ता का नाम बदलता है, और एक Windows ड्राइवर जांच शामिल करता है।

github llama.cpp · 5 दिन पहले

mi50 के लिए Vulkan अनुकूलन के साथ llama.cpp b9814 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9814 जारी किया है, जिसमें AMD mi50 GPU को विशेष रूप से लक्षित करते हुए Vulkan में `mul_mat_vecq` ऑपरेशन के लिए एक अनुकूलन शामिल है। इस अपडेट के साथ कई ऑपरेटिंग सिस्टम और हार्डवेयर आर्किटेक्चर पर व्यापक रूप से पूर्व-निर्मित बाइनरीज़ उपलब्ध हैं।

github MCP (GitHub org) · 5 दिन पहले

MCP Python SDK v2.0.0a3 रिलीज नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना तीसरा अल्फा संस्करण, v2.0.0a3 जारी किया है, जिसमें महत्वपूर्ण प्रोटोकॉल और आर्किटेक्चरल बदलाव शामिल हैं जबकि स्थिर 1.x उपयोगकर्ताओं के लिए बैकवर्ड कंपैटिबिलिटी बनाए रखी गई है।

github llama.cpp · 5 दिन पहले

Vulkan कंपाइलर वर्कअराउंड के साथ llama.cpp b9811 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9811 जारी किया है, जिसमें Vulkan में conv2d coopmat2 पथ को प्रभावित करने वाले कंपाइलर बग के लिए एक फिक्स शामिल है। NVIDIA इंजीनियर Jeff Bolz की सलाह पर इस वर्कअराउंड को CONV_3D इम्प्लीमेंटेशन पर भी लागू किया गया है।

github llama.cpp · 5 दिन पहले

llama.cpp b9810 रिलीज में cublasSgemmBatched मैपिंग और नए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने संस्करण b9810 जारी किया है, जिसमें HIP/MUSA वेंडर हेडर्स के लिए `cublasSgemmBatched` का CUDA मैपिंग पेश किया गया है। इस अपडेट के साथ macOS, Linux, Windows, Android और openEuler प्लेटफ़ॉर्म के लिए प्री-बिल्ड बाइनरी का एक व्यापक सेट भी शामिल है।

github MCP (GitHub org) · 5 दिन पहले

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK v1.28.1 रिलीज

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK ने संस्करण 1.28.1 जारी किया है, जिसमें स्ट्रीम हैंडलिंग और ट्रांसपोर्ट सुरक्षा में अपडेट शामिल हैं।

github llama.cpp · 6 दिन पहले

llama.cpp b9804 रिलीज़: Mamba2 फिक्स और नए बाइनरी

llama.cpp b9804 रिलीज़ में Mamba2 आर्किटेक्चर के लिए एक फिक्स शामिल है, जिसमें एक हार्डकोडेड 2x एक्सपेंशन फैक्टर और एक अमान्य पैरामीटर चेक को हटाया गया है, जिससे किसी भी expand मान का समर्थन संभव हो जाता है। यह बदलाव `convert_hf_to_gguf.py` स्क्रिप्ट को अपडेट करता है ताकि expand पैरामीटर वैकल्पिक हो जाए और इसका डिफ़ॉल्ट मान 2 हो।

github llama.cpp · 6 दिन पहले

OpenCL प्रोफाइलिंग फिक्स के साथ llama.cpp b9803 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9803 जारी किया है, जिसमें OpenCL को अपूर्ण बैचों के लिए शटडाउन पर प्रोफाइलिंग बैच फ्लश करने का फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स के लिए macOS, Linux, Windows, Android और openEuler के लिए बाइनरीज प्रदान करता है।

github llama.cpp · 6 दिन पहले

llama.cpp b9802 रिलीज में macOS, Linux, Windows और Android के लिए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने b9802 रिलीज जारी की है, जिसमें कई ऑपरेटिंग सिस्टम और हार्डवेयर आर्किटेक्चर पर पहले से बनाए गए बाइनरी उपलब्ध हैं। इस अपडेट में macOS, Linux, Windows, Android और openEuler जैसे प्लेटफॉर्म पर CPU, GPU और विशेष AI एक्सेलेरेटर के लिए समर्थन शामिल है।

github SGLang · 6 दिन पहले

v0.5.14

लेख में संस्करण 0.5.14 के रिलीज़ की घोषणा की गई है।

lab Claude Code Releases · 6 दिन पहले

क्लाउड कोड v2.1.193 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.193 ऑटो-मोड वर्गीकरण, टेलीमेट्री लॉगिंग और बैकग्राउंड एजेंट प्रबंधन में कई सुधार लाता है। इस अपडेट में UI स्टेट समस्याओं, MCP सर्वरों में प्रमाणीकरण हैंडलिंग और विभिन्न बैकग्राउंडिंग बग के लिए फिक्स भी शामिल हैं।

lab Cohere Blog · 6 दिन पहले

AI एजेंट्स के साथ फॉर्क रखरखाव को स्वचालित करना

यह लेख AI कोडिंग एजेंट्स का उपयोग करके सॉफ्टवेयर फॉर्क्स के रखरखाव को स्वचालित करने की एक विधि का वर्णन करता है, जिसका अनुप्रयोग Cohere के vLLM के फॉर्क पर किया गया है। यह दृष्टिकोण मैन्युअल हस्तक्षेप को एक स्वचालित फीडबैक लूप से बदलकर अपस्ट्रीम रिलीजों को एकीकृत करने में लगने वाले समय को सप्ताहों से दिनों तक कम कर देता है।

lab Microsoft Research Blog · 6 दिन पहले

AI-संचालित व्याख्याओं और प्रयोगों के साथ मस्तिष्क को समझना

शोधकर्ताओं ने जनरेटिव काज़ुअल टेस्टिंग (GCT) विकसित की है, एक फ्रेमवर्क जो अविश्लेषणीय LLM-आधारित मस्तिष्क-पूर्वानुमान मॉडलों को कॉर्टिकल कार्य के बारे में संक्षिप्त, परीक्षण योग्य मौखिक परिकल्पनाओं में परिवर्तित करता है। यह विधि मॉडल पैरामीटरों को छोटे वाक्यांशों में निचोड़ती है जो वर्णन करते हैं कि विशिष्ट मस्तिष्क क्षेत्र किसके प्रति प्रतिक्रिया करते हैं, जैसे "खाना तैयार करना", और फिर लक्षित fMRI प्रयोगों के माध्यम से इन व्याख्याओं की पुष्टि करते हैं।

lab Google — The Keyword (AI) · 6 दिन पहले

Google Finance ने नए Android ऐप के साथ बेटा चरण समाप्त किया

Google Finance आधिकारिक तौर पर अपने बेटा चरण से बाहर निकल रहा है और Android डिवाइसों के लिए एक समर्पित एप्लिकेशन लॉन्च कर रहा है।

github vLLM · 6 दिन पहले

v0.24.0rc2: DP Supervisor के साथ P/D को ठीक करें (#46628)

यह रिलीज कैंडिडेट vLLM प्रोजेक्ट में डेटा पैरेलेलिज्म (DP) सुपरवाइजर के साथ Prefill/Decode (P/D) फंक्शनलिटी के लिए एक फिक्स को संबोधित करता है।

lab Cohere Blog · 6 दिन पहले

कॉहेर ने कस्टम MCP सर्वर के जरिए नॉर्थ और विज़ के साथ इंसिडेंट रिस्पॉन्स को ऑटोमेट किया

कॉहेर ने अपने एंटरप्राइज़ AI प्लेटफ़ॉर्म, कॉहेर नॉर्थ का उपयोग करके एक सुरक्षा एजेंट विकसित किया, जिसे कस्टम मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर के जरिए क्लाउड सुरक्षा प्लेटफ़ॉर्म विज़ के साथ इंटीग्रेट किया गया। यह आर्किटेक्चर नॉर्थ को विज़ के GraphQL API से आठ एटॉमिक टूल्स के जरिए कनेक्ट करता है, जिससे एकल प्रॉम्प्ट से ऑटोमेटेड इंसिडेंट रिस्पॉन्स वर्कफ़्लो सक्षम होते हैं। सिस्टम अटैक चेन का मूल्यांकन करने और इंटरनेट एक्सपोज़र और प्राइविलेज लेवल के आधार पर जोखिमों को रैंक करने के जरिए टॉक्सिक कॉम्बिनेशन ब्लास्ट रेडियस विश्लेषण लगभग 20 सेकंड में करता है। यह मुद्दे की जानकारी प्राप्त करना, लीनियर टिकट बनाना, विज़ स्थिति अपडेट करना और संरचित इंसिडेंट रिस्पॉन्स रिपोर्ट तैयार करके एंड-टू-एंड जांच को भी ऑटोमेट करता है। इसके अलावा, एक शेड्यूल्ड वीकली ऑटोमेशन बिना किसी मैन्युअल हस्तक्षेप के हर सोमवार सुबह एक सुरक्षा पोस्चर ब्रीफ़ जनरेट करता है। यह इंटीग्रेशन प्रति फाइंडिंग पहले के 30 मिनट से दो घंटे के ट्रायज लूप को समाप्त कर देता है, जिससे इंजीनियर कच्चे अलर्टों पर ध्यान देने के बजाय एसेसमेंट का मूल्यांकन करने पर ध्यान केंद्रित कर सकते हैं।

github llama.cpp · 7 दिन पहले

llama.cpp b9788 में dual-GPU सेटअप के लिए SYCL tensor parallelism जोड़ा गया

llama.cpp का release b9788 SYCL backend में --split-mode tensor फ्लैग के माध्यम से tensor parallelism के लिए समर्थन पेश करता है। यह कार्यान्वयन meta-backend में comm_init, comm_free, और comm_allreduce_tensor फ़ंक्शंस जोड़कर dual-GPU संचार को सक्षम बनाता है। दो डिवाइसों के लिए, यह ring all-reduce रणनीति का उपयोग करता है जो छोटे tensors के लिए FP32 direct memcpy और बड़े tensors के लिए BF16 compression के बीच स्विच करता है। OneCCL से बचा जाता है क्योंकि इसकी single-device-per-process सीमा है, इसके बजाय SYCL pool invariants बनाए रखने के लिए persistent buffers का उपयोग किया जाता है। dual Intel Arc Pro B70 GPUs पर प्रदर्शन परीक्षण Llama-3.3-70B और Qwen3-Coder-Next-80B-A3B मॉडल्स के लिए layer mode की तुलना में महत्वपूर्ण गति वृद्धि दिखाते हैं। अपडेट में CPU, CUDA, ROCm, Vulkan, और SYCL लक्ष्यों के लिए macOS, Linux, Windows, Android, और openEuler के लिए नए binaries शामिल हैं।

github llama.cpp · 7 दिन पहले

llama.cpp b9789 रिलीज में MoE क्वांटीकरण की मरम्मत और बहु-प्लेटफ़ॉर्म बाइनरीज़ प्रदान की गई

llama.cpp परियोजना ने संस्करण b9789 जारी किया है, जिसमें मल्टी-टोकन भविष्यवाणी के साथ मिक्सचर ऑफ एक्सपर्ट्स (MoE) मॉडल्स को क्वांटाइज़ करने के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट पुल अनुरोध #24986 में पहचाने गए मुद्दों को दूर करता है ताकि इन विशिष्ट मॉडल आर्किटेक्चर्स का उचित प्रबंधन सुनिश्चित किया जा सके। इस रिलीज में macOS Apple Silicon और Intel के लिए पूर्व-बिल्ड बाइनरीज़, साथ ही एक iOS XCFramework प्रदान करता है। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड्स के लिए Ubuntu पर बिल्ड डाउनलोड कर सकते हैं। Windows समर्थन में CPU, CUDA 12.4 और 13.3, Vulkan, OpenVINO, SYCL, और HIP वेरिएंट शामिल हैं। अतिरिक्त प्लेटफ़ॉर्म जैसे Android arm64 और openEuler भी विशिष्ट हार्डवेयर कॉन्फ़िगरेशन के साथ समर्थित हैं।