सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 4 / 7

MCP Python SDK v2.0.0a3 रिलीज नोट्स

मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) पायथन SDK ने अपना तीसरा अल्फा संस्करण, v2.0.0a3 जारी किया है, जिसमें महत्वपूर्ण प्रोटोकॉल और आर्किटेक्चरल बदलाव शामिल हैं जबकि स्थिर 1.x उपयोगकर्ताओं के लिए बैकवर्ड कंपैटिबिलिटी बनाए रखी गई है।

github MCP (GitHub org) · 5 दिन पहले

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK v1.28.1 रिलीज

मॉडल कॉन्टेक्स्ट प्रोटोकोल पायथन SDK ने संस्करण 1.28.1 जारी किया है, जिसमें स्ट्रीम हैंडलिंग और ट्रांसपोर्ट सुरक्षा में अपडेट शामिल हैं।

github llama.cpp · 5 दिन पहले

llama.cpp b9804 रिलीज़: Mamba2 फिक्स और नए बाइनरी

llama.cpp b9804 रिलीज़ में Mamba2 आर्किटेक्चर के लिए एक फिक्स शामिल है, जिसमें एक हार्डकोडेड 2x एक्सपेंशन फैक्टर और एक अमान्य पैरामीटर चेक को हटाया गया है, जिससे किसी भी expand मान का समर्थन संभव हो जाता है। यह बदलाव `convert_hf_to_gguf.py` स्क्रिप्ट को अपडेट करता है ताकि expand पैरामीटर वैकल्पिक हो जाए और इसका डिफ़ॉल्ट मान 2 हो।

github llama.cpp · 6 दिन पहले

OpenCL प्रोफाइलिंग फिक्स के साथ llama.cpp b9803 रिलीज

llama.cpp प्रोजेक्ट ने संस्करण b9803 जारी किया है, जिसमें OpenCL को अपूर्ण बैचों के लिए शटडाउन पर प्रोफाइलिंग बैच फ्लश करने का फिक्स शामिल है। यह अपडेट विभिन्न हार्डवेयर बैकएंड्स के लिए macOS, Linux, Windows, Android और openEuler के लिए बाइनरीज प्रदान करता है।

github llama.cpp · 6 दिन पहले

llama.cpp b9802 रिलीज में macOS, Linux, Windows और Android के लिए बाइनरी शामिल हैं

llama.cpp प्रोजेक्ट ने b9802 रिलीज जारी की है, जिसमें कई ऑपरेटिंग सिस्टम और हार्डवेयर आर्किटेक्चर पर पहले से बनाए गए बाइनरी उपलब्ध हैं। इस अपडेट में macOS, Linux, Windows, Android और openEuler जैसे प्लेटफॉर्म पर CPU, GPU और विशेष AI एक्सेलेरेटर के लिए समर्थन शामिल है।

github SGLang · 6 दिन पहले

v0.5.14

लेख में संस्करण 0.5.14 के रिलीज़ की घोषणा की गई है।

lab Claude Code Releases · 6 दिन पहले

क्लाउड कोड v2.1.193 रिलीज नोट्स

क्लाउड कोड संस्करण 2.1.193 ऑटो-मोड वर्गीकरण, टेलीमेट्री लॉगिंग और बैकग्राउंड एजेंट प्रबंधन में कई सुधार लाता है। इस अपडेट में UI स्टेट समस्याओं, MCP सर्वरों में प्रमाणीकरण हैंडलिंग और विभिन्न बैकग्राउंडिंग बग के लिए फिक्स भी शामिल हैं।

lab Cohere Blog · 6 दिन पहले

AI एजेंट्स के साथ फॉर्क रखरखाव को स्वचालित करना

यह लेख AI कोडिंग एजेंट्स का उपयोग करके सॉफ्टवेयर फॉर्क्स के रखरखाव को स्वचालित करने की एक विधि का वर्णन करता है, जिसका अनुप्रयोग Cohere के vLLM के फॉर्क पर किया गया है। यह दृष्टिकोण मैन्युअल हस्तक्षेप को एक स्वचालित फीडबैक लूप से बदलकर अपस्ट्रीम रिलीजों को एकीकृत करने में लगने वाले समय को सप्ताहों से दिनों तक कम कर देता है।

lab Microsoft Research Blog · 6 दिन पहले

AI-संचालित व्याख्याओं और प्रयोगों के साथ मस्तिष्क को समझना

शोधकर्ताओं ने जनरेटिव काज़ुअल टेस्टिंग (GCT) विकसित की है, एक फ्रेमवर्क जो अविश्लेषणीय LLM-आधारित मस्तिष्क-पूर्वानुमान मॉडलों को कॉर्टिकल कार्य के बारे में संक्षिप्त, परीक्षण योग्य मौखिक परिकल्पनाओं में परिवर्तित करता है। यह विधि मॉडल पैरामीटरों को छोटे वाक्यांशों में निचोड़ती है जो वर्णन करते हैं कि विशिष्ट मस्तिष्क क्षेत्र किसके प्रति प्रतिक्रिया करते हैं, जैसे "खाना तैयार करना", और फिर लक्षित fMRI प्रयोगों के माध्यम से इन व्याख्याओं की पुष्टि करते हैं।

lab Google — The Keyword (AI) · 6 दिन पहले

Google Finance ने नए Android ऐप के साथ बेटा चरण समाप्त किया

Google Finance आधिकारिक तौर पर अपने बेटा चरण से बाहर निकल रहा है और Android डिवाइसों के लिए एक समर्पित एप्लिकेशन लॉन्च कर रहा है।

github vLLM · 6 दिन पहले

v0.24.0rc2: DP Supervisor के साथ P/D को ठीक करें (#46628)

यह रिलीज कैंडिडेट vLLM प्रोजेक्ट में डेटा पैरेलेलिज्म (DP) सुपरवाइजर के साथ Prefill/Decode (P/D) फंक्शनलिटी के लिए एक फिक्स को संबोधित करता है।

lab Cohere Blog · 6 दिन पहले

कॉहेर ने कस्टम MCP सर्वर के जरिए नॉर्थ और विज़ के साथ इंसिडेंट रिस्पॉन्स को ऑटोमेट किया

कॉहेर ने अपने एंटरप्राइज़ AI प्लेटफ़ॉर्म, कॉहेर नॉर्थ का उपयोग करके एक सुरक्षा एजेंट विकसित किया, जिसे कस्टम मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर के जरिए क्लाउड सुरक्षा प्लेटफ़ॉर्म विज़ के साथ इंटीग्रेट किया गया। यह आर्किटेक्चर नॉर्थ को विज़ के GraphQL API से आठ एटॉमिक टूल्स के जरिए कनेक्ट करता है, जिससे एकल प्रॉम्प्ट से ऑटोमेटेड इंसिडेंट रिस्पॉन्स वर्कफ़्लो सक्षम होते हैं। सिस्टम अटैक चेन का मूल्यांकन करने और इंटरनेट एक्सपोज़र और प्राइविलेज लेवल के आधार पर जोखिमों को रैंक करने के जरिए टॉक्सिक कॉम्बिनेशन ब्लास्ट रेडियस विश्लेषण लगभग 20 सेकंड में करता है। यह मुद्दे की जानकारी प्राप्त करना, लीनियर टिकट बनाना, विज़ स्थिति अपडेट करना और संरचित इंसिडेंट रिस्पॉन्स रिपोर्ट तैयार करके एंड-टू-एंड जांच को भी ऑटोमेट करता है। इसके अलावा, एक शेड्यूल्ड वीकली ऑटोमेशन बिना किसी मैन्युअल हस्तक्षेप के हर सोमवार सुबह एक सुरक्षा पोस्चर ब्रीफ़ जनरेट करता है। यह इंटीग्रेशन प्रति फाइंडिंग पहले के 30 मिनट से दो घंटे के ट्रायज लूप को समाप्त कर देता है, जिससे इंजीनियर कच्चे अलर्टों पर ध्यान देने के बजाय एसेसमेंट का मूल्यांकन करने पर ध्यान केंद्रित कर सकते हैं।

github llama.cpp · 6 दिन पहले

llama.cpp b9788 में dual-GPU सेटअप के लिए SYCL tensor parallelism जोड़ा गया

llama.cpp का release b9788 SYCL backend में --split-mode tensor फ्लैग के माध्यम से tensor parallelism के लिए समर्थन पेश करता है। यह कार्यान्वयन meta-backend में comm_init, comm_free, और comm_allreduce_tensor फ़ंक्शंस जोड़कर dual-GPU संचार को सक्षम बनाता है। दो डिवाइसों के लिए, यह ring all-reduce रणनीति का उपयोग करता है जो छोटे tensors के लिए FP32 direct memcpy और बड़े tensors के लिए BF16 compression के बीच स्विच करता है। OneCCL से बचा जाता है क्योंकि इसकी single-device-per-process सीमा है, इसके बजाय SYCL pool invariants बनाए रखने के लिए persistent buffers का उपयोग किया जाता है। dual Intel Arc Pro B70 GPUs पर प्रदर्शन परीक्षण Llama-3.3-70B और Qwen3-Coder-Next-80B-A3B मॉडल्स के लिए layer mode की तुलना में महत्वपूर्ण गति वृद्धि दिखाते हैं। अपडेट में CPU, CUDA, ROCm, Vulkan, और SYCL लक्ष्यों के लिए macOS, Linux, Windows, Android, और openEuler के लिए नए binaries शामिल हैं।

github llama.cpp · 6 दिन पहले

llama.cpp b9789 रिलीज में MoE क्वांटीकरण की मरम्मत और बहु-प्लेटफ़ॉर्म बाइनरीज़ प्रदान की गई

llama.cpp परियोजना ने संस्करण b9789 जारी किया है, जिसमें मल्टी-टोकन भविष्यवाणी के साथ मिक्सचर ऑफ एक्सपर्ट्स (MoE) मॉडल्स को क्वांटाइज़ करने के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट पुल अनुरोध #24986 में पहचाने गए मुद्दों को दूर करता है ताकि इन विशिष्ट मॉडल आर्किटेक्चर्स का उचित प्रबंधन सुनिश्चित किया जा सके। इस रिलीज में macOS Apple Silicon और Intel के लिए पूर्व-बिल्ड बाइनरीज़, साथ ही एक iOS XCFramework प्रदान करता है। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड्स के लिए Ubuntu पर बिल्ड डाउनलोड कर सकते हैं। Windows समर्थन में CPU, CUDA 12.4 और 13.3, Vulkan, OpenVINO, SYCL, और HIP वेरिएंट शामिल हैं। अतिरिक्त प्लेटफ़ॉर्म जैसे Android arm64 और openEuler भी विशिष्ट हार्डवेयर कॉन्फ़िगरेशन के साथ समर्थित हैं।

lab OpenAI News · 6 दिन पहले

OpenAI शोध दिखाता है कि AI एजेंट्स काम को बदल रहे हैं

OpenAI से एक नया शोध पत्र प्रदर्शित करता है कि कृत्रिम बुद्धिमत्ता एजेंट्स काम की प्रकृति को मौलिक रूप से कैसे बदल रहे हैं। अध्ययन इन एजेंट्स की क्षमता पर प्रकाश डालता है कि वे पहले की तुलना में लंबे और अधिक जटिल कार्यों को कैसे निष्पादित कर सकते हैं। इस तकनीकी उन्नति को विभिन्न पेशा भूमिकाओं में उत्पादकता का विस्तार करने के लिए जिम्मेदार ठहराया गया है। निष्कर्ष सुझाव देते हैं कि स्वचालन के माध्यम से श्रम को कैसे संगठित और निष्पादित किया जाता है, उसमें एक महत्वपूर्ण बदलाव आ रहा है। जटिल कार्यप्रवाह को संभालकर, AI एजेंट्स उपयोगकर्ताओं को अधिक दक्षता प्राप्त करने में सक्षम बना रहे हैं। पत्र आधुनिक रोजगार पर स्वतंत्र प्रणालियों के बढ़ते प्रभाव का सबूत के रूप में कार्य करता है।

github llama.cpp · 6 दिन पहले

SYCL में conv_3d के लिए विफल यूनिट टेस्ट केस ठीक करें

llama.cpp रिपॉजिटरी ने SYCL बैकएंड से संबंधित एक विशिष्ट मुद्दे को संबोधित किया है। conv_3d ऑपरेशन से जुड़े विफल यूनिट टेस्ट केस को ठीक करने के लिए एक पुल रिक्वेस्ट जमा की गई थी। यह अपडेट GitHub पर ggml-org/llama.cpp प्रोजेक्ट को लक्षित करता है। ये बदलाव उन त्रुटियों को हल करते हैं जो पहले इन टेस्ट के सफल निष्पादन में बाधा डाल रही थीं। यह फिक्स SYCL-आधारित हार्डवेयर एक्सेलरेशन पर निर्भर उपयोगकर्ताओं के लिए बेहतर स्थिरता सुनिश्चित करता है।

github llama.cpp · 7 दिन पहले

llama.cpp b9786 रिलीज़ में ओपनसीएल नॉन-कंटिगियस रो सपोर्ट जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9786 जारी किया है, जिसमें ओपनसीएल के माध्यम से नॉर्मलाइजेशन में नॉन-कंटिगियस रो के लिए सपोर्ट पेश किया गया है। यह अपडेट विभिन्न प्लेटफॉर्म्स पर हार्डवेयर संगतता और प्रदर्शन को बेहतर बनाने के लिए ggml-org टीम द्वारा चल रहे विकास का हिस्सा है। इस रिलीज़ में macOS एप्पल सिلىकॉन, इंटेल मैक्स और iOS XCFrameworks के लिए बाइनरी उपलब्ध हैं। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO और SYCL बैकएंड्स का उपयोग करके Ubuntu x64, arm64 और s390x आर्किटेक्चर के लिए बिल्ड्स तक पहुंच सकते हैं। Android के लिए arm64 CPU डिवाइसेस पर सपोर्ट उपलब्ध है, जबकि Windows में CPU, CUDA 12 और 13, Vulkan, OpenVINO, SYCL और HIP सहित व्यापक विकल्प प्रदान किए गए हैं। इस रिलीज़ में macOS और openEuler प्लेटफॉर्म्स पर KleidiAI के लिए बिल्ड्स को अक्षम करने की सूची भी दी गई है।

github llama.cpp · 7 दिन पहले

llama.cpp b9785 रिलीज हार्डेन कैप्स चेक और मल्टी-प्लेटफ़ॉर्म बाइनरी के साथ

llama.cpp प्रोजेक्ट ने संस्करण b9785 जारी किया है, जिसमें पुल रिक्वेस्ट #24973 में विस्तार से बताए गए अनुसार कैप्स चेक्स को मजबूत बनाने के लिए कोड में बदलाव शामिल है। यह अपडेट macOS Apple Silicon, Intel Macs, और XCFramework के माध्यम से iOS के लिए प्री-बिल्ड बाइनरी प्रदान करता है, जहाँ Apple Silicon पर KleidiAI समर्थन अक्षम किया गया है। Ubuntu सहित Linux वितरण x64, arm64, और s390x आर्किटेक्चर पर CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड के लिए समर्थित हैं। Android उपयोगकर्ता arm64 CPU बाइनरी तक पहुँच सकते हैं, जबकि Windows CPU, OpenCL Adreno, CUDA 12 और 13, Vulkan, OpenVINO, SYCL, और HIP को कवर करने वाले व्यापक विकल्प प्रदान करता है। इस रिलीज में x86 और aarch64 प्रोसेसरों को लक्षित करने वाले openEuler के लिए ACL ग्राफ़ समर्थन के साथ बिल्ड्स भी शामिल हैं। स्थानीय मॉडल इनफरेंस को सुविधाजनक बनाने के लिए प्लेटफ़ॉर्म-विशिष्ट रिलीजों के साथ एक स्टैंडअलोन UI पैकेज उपलब्ध है।

lab Claude Code Releases · 7 दिन पहले

Claude Code v2.1.191 रिलीज नोट्स

Claude Code संस्करण 2.1.191 में /rewind समर्थन पेश किया गया है, जिससे उपयोगकर्ता /clear कमांड चलाने से पहले की बातचीत को फिर से शुरू कर सकते हैं। इस अपडेट ने कई महत्वपूर्ण समस्याओं को ठीक किया है, जिनमें रोके जाने के बाद बैकग्राउंड एजेंट्स का पुनर्जीवित होना और स्ट्रीमिंग प्रतिक्रियाओं के दौरान स्क्रॉल स्थिति का कूदना शामिल हैं। यह /voice द्वारा सामान्य त्रुटि संदेश दिखाने और Windows Terminal में /login URLs के truncated होने की व्यवस्था को भी ठीक करता है। MCP सर्वरों के लिए विश्वसनीयता में महत्वपूर्ण सुधार किए गए हैं, जिनमें क्षमता खोज और OAuth प्रवाह के दौरान अस्थायी नेटवर्क त्रुटियों के लिए पुनः प्रयास तर्क जोड़ा गया है। हेडलेस वातावरण अब OAuth के लिए ब्राउज़र पॉपअप को छोड़ देते हैं, जबकि सैंडबॉक्स नेटवर्क अनुमतियां सत्र की अवधि के लिए याद रखी जाती हैं। प्रदर्शन अनुकूलन टेक्स्ट अपडेट कोalescing के माध्यम से स्ट्रीमिंग के दौरान CPU उपयोग को लगभग 37% कम करते हैं और टर्मिनल आउटपुट कैश से लंबे-सत्र मेमोरी वृद्धि को रोकते हैं।

github llama.cpp · 7 दिन पहले

LLaMA.cpp Release b9784: Hexagon MM Optimizations और Cross-Platform Binaries

LLaMA.cpp ने hexagon-आधारित MM ऑपरेशन के लिए प्रमुख अनुकूलन के साथ संस्करण b9784 जारी किया है, जिसमें 32x32 टाइल्ड वेट रीपैक, सुधारा हुआ dyn.quant हैंडलिंग और एकीकृत kernel पैरामीटर प्रबंधन शामिल हैं। इस रिलीज में macOS (arm64 और x64), iOS, और Vulkan, ROCm, और OpenVINO के साथ कई Linux आर्किटेक्चर के लिए नए binaries शामिल हैं।