सभी लेख — korshunov.ai — ML समाचार

सभी लेख पृष्ठ 1 / 13

lab Microsoft Research Blog · 6 दिन पहले

AI-संचालित व्याख्याओं और प्रयोगों के साथ मस्तिष्क को समझना

शोधकर्ताओं ने जनरेटिव काज़ुअल टेस्टिंग (GCT) विकसित की है, एक फ्रेमवर्क जो अविश्लेषणीय LLM-आधारित मस्तिष्क-पूर्वानुमान मॉडलों को कॉर्टिकल कार्य के बारे में संक्षिप्त, परीक्षण योग्य मौखिक परिकल्पनाओं में परिवर्तित करता है। यह विधि मॉडल पैरामीटरों को छोटे वाक्यांशों में निचोड़ती है जो वर्णन करते हैं कि विशिष्ट मस्तिष्क क्षेत्र किसके प्रति प्रतिक्रिया करते हैं, जैसे "खाना तैयार करना", और फिर लक्षित fMRI प्रयोगों के माध्यम से इन व्याख्याओं की पुष्टि करते हैं।

lab Google — The Keyword (AI) · 6 दिन पहले

Google Finance ने नए Android ऐप के साथ बेटा चरण समाप्त किया

Google Finance आधिकारिक तौर पर अपने बेटा चरण से बाहर निकल रहा है और Android डिवाइसों के लिए एक समर्पित एप्लिकेशन लॉन्च कर रहा है।

lab Hugging Face Blog · 6 दिन पहले

एक कमांड में HF Jobs पर vLLM सर्वर चलाएं

Hugging Face ने एक नई सुविधा पेश की है जो उपयोगकर्ताओं को एकल कमांड का उपयोग करके Hugging Face Jobs प्लेटफ़ॉर्म के माध्यम से सीधे vLLM सर्वर तैनात करने की अनुमति देती है।

github vLLM · 6 दिन पहले

v0.24.0rc2: DP Supervisor के साथ P/D को ठीक करें (#46628)

यह रिलीज कैंडिडेट vLLM प्रोजेक्ट में डेटा पैरेलेलिज्म (DP) सुपरवाइजर के साथ Prefill/Decode (P/D) फंक्शनलिटी के लिए एक फिक्स को संबोधित करता है।

github CrewAI · 6 दिन पहले

crewAI 1.14.8a5 रिलीज़ नोट्स

crewAI संस्करण 1.14.8a5 अपडेट में फ़्लो स्टेट मैनेजमेंट, दस्तावेज़ीकरण अद्यतन और पुनर्लेखन प्रयासों में परिवर्तन शामिल हैं।

lab Hugging Face Blog · 6 दिन पहले

हाइब्रिड भाषा मॉडल में टोकन भविष्यवाणी सटीकता का विश्लेषण

एक हालिया अध्ययन जांचता है कि मानक घन संरचनाओं की तुलना में हाइब्रिड भाषा मॉडल किस विशिष्ट टोकन को अधिक सटीकता से भविष्यवाणी करते हैं। शोध दुर्लभ शब्दों और कोड स्निपेट्स जैसे विभिन्न टोकन प्रकारों के अनुमान त्रुटियों के वितरण को समझने पर केंद्रित है। हानि परिदृश्य का विश्लेषण करने से, लेखकों ने पहचाना कि हाइब्रिड मॉडल विरल डेटा क्षेत्रों में दीर्घ-परास निर्भरताओं को पकड़ने में उत्कृष्ट हैं। निष्कर्ष सुझाव देते हैं कि विशेषज्ञ मिश्रण तंत्र अनुमान के दौरान अधिक कुशल पैरामीटर उपयोग की अनुमति देता है। यह सुधरी हुई सटीकता प्रशिक्षण कॉर्पस में कम आवृत्ति वाले टोकन के लिए विशेष रूप से उल्लेखनीय है। पेपर विभिन्न बेंचमार्क डेटासेट पर प्रदर्शन मेट्रिक्स का एक विस्तृत विभाजन प्रदान करता है। ये परिणाम हाइब्रिड संरचनाओं की विविध भाषाई संरचनाओं को प्रभावी ढंग से संभालने की क्षमता को उजागर करते हैं।

lab Cohere Blog · 6 दिन पहले

कॉहेर ने कस्टम MCP सर्वर के जरिए नॉर्थ और विज़ के साथ इंसिडेंट रिस्पॉन्स को ऑटोमेट किया

कॉहेर ने अपने एंटरप्राइज़ AI प्लेटफ़ॉर्म, कॉहेर नॉर्थ का उपयोग करके एक सुरक्षा एजेंट विकसित किया, जिसे कस्टम मॉडल कॉन्टेक्स्ट प्रोटोकॉल (MCP) सर्वर के जरिए क्लाउड सुरक्षा प्लेटफ़ॉर्म विज़ के साथ इंटीग्रेट किया गया। यह आर्किटेक्चर नॉर्थ को विज़ के GraphQL API से आठ एटॉमिक टूल्स के जरिए कनेक्ट करता है, जिससे एकल प्रॉम्प्ट से ऑटोमेटेड इंसिडेंट रिस्पॉन्स वर्कफ़्लो सक्षम होते हैं। सिस्टम अटैक चेन का मूल्यांकन करने और इंटरनेट एक्सपोज़र और प्राइविलेज लेवल के आधार पर जोखिमों को रैंक करने के जरिए टॉक्सिक कॉम्बिनेशन ब्लास्ट रेडियस विश्लेषण लगभग 20 सेकंड में करता है। यह मुद्दे की जानकारी प्राप्त करना, लीनियर टिकट बनाना, विज़ स्थिति अपडेट करना और संरचित इंसिडेंट रिस्पॉन्स रिपोर्ट तैयार करके एंड-टू-एंड जांच को भी ऑटोमेट करता है। इसके अलावा, एक शेड्यूल्ड वीकली ऑटोमेशन बिना किसी मैन्युअल हस्तक्षेप के हर सोमवार सुबह एक सुरक्षा पोस्चर ब्रीफ़ जनरेट करता है। यह इंटीग्रेशन प्रति फाइंडिंग पहले के 30 मिनट से दो घंटे के ट्रायज लूप को समाप्त कर देता है, जिससे इंजीनियर कच्चे अलर्टों पर ध्यान देने के बजाय एसेसमेंट का मूल्यांकन करने पर ध्यान केंद्रित कर सकते हैं।

github llama.cpp · 7 दिन पहले

llama.cpp b9788 में dual-GPU सेटअप के लिए SYCL tensor parallelism जोड़ा गया

llama.cpp का release b9788 SYCL backend में --split-mode tensor फ्लैग के माध्यम से tensor parallelism के लिए समर्थन पेश करता है। यह कार्यान्वयन meta-backend में comm_init, comm_free, और comm_allreduce_tensor फ़ंक्शंस जोड़कर dual-GPU संचार को सक्षम बनाता है। दो डिवाइसों के लिए, यह ring all-reduce रणनीति का उपयोग करता है जो छोटे tensors के लिए FP32 direct memcpy और बड़े tensors के लिए BF16 compression के बीच स्विच करता है। OneCCL से बचा जाता है क्योंकि इसकी single-device-per-process सीमा है, इसके बजाय SYCL pool invariants बनाए रखने के लिए persistent buffers का उपयोग किया जाता है। dual Intel Arc Pro B70 GPUs पर प्रदर्शन परीक्षण Llama-3.3-70B और Qwen3-Coder-Next-80B-A3B मॉडल्स के लिए layer mode की तुलना में महत्वपूर्ण गति वृद्धि दिखाते हैं। अपडेट में CPU, CUDA, ROCm, Vulkan, और SYCL लक्ष्यों के लिए macOS, Linux, Windows, Android, और openEuler के लिए नए binaries शामिल हैं।

github llama.cpp · 7 दिन पहले

llama.cpp b9789 रिलीज में MoE क्वांटीकरण की मरम्मत और बहु-प्लेटफ़ॉर्म बाइनरीज़ प्रदान की गई

llama.cpp परियोजना ने संस्करण b9789 जारी किया है, जिसमें मल्टी-टोकन भविष्यवाणी के साथ मिक्सचर ऑफ एक्सपर्ट्स (MoE) मॉडल्स को क्वांटाइज़ करने के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट पुल अनुरोध #24986 में पहचाने गए मुद्दों को दूर करता है ताकि इन विशिष्ट मॉडल आर्किटेक्चर्स का उचित प्रबंधन सुनिश्चित किया जा सके। इस रिलीज में macOS Apple Silicon और Intel के लिए पूर्व-बिल्ड बाइनरीज़, साथ ही एक iOS XCFramework प्रदान करता है। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड्स के लिए Ubuntu पर बिल्ड डाउनलोड कर सकते हैं। Windows समर्थन में CPU, CUDA 12.4 और 13.3, Vulkan, OpenVINO, SYCL, और HIP वेरिएंट शामिल हैं। अतिरिक्त प्लेटफ़ॉर्म जैसे Android arm64 और openEuler भी विशिष्ट हार्डवेयर कॉन्फ़िगरेशन के साथ समर्थित हैं।

lab OpenAI News · 7 दिन पहले

OpenAI शोध दिखाता है कि AI एजेंट्स काम को बदल रहे हैं

OpenAI से एक नया शोध पत्र प्रदर्शित करता है कि कृत्रिम बुद्धिमत्ता एजेंट्स काम की प्रकृति को मौलिक रूप से कैसे बदल रहे हैं। अध्ययन इन एजेंट्स की क्षमता पर प्रकाश डालता है कि वे पहले की तुलना में लंबे और अधिक जटिल कार्यों को कैसे निष्पादित कर सकते हैं। इस तकनीकी उन्नति को विभिन्न पेशा भूमिकाओं में उत्पादकता का विस्तार करने के लिए जिम्मेदार ठहराया गया है। निष्कर्ष सुझाव देते हैं कि स्वचालन के माध्यम से श्रम को कैसे संगठित और निष्पादित किया जाता है, उसमें एक महत्वपूर्ण बदलाव आ रहा है। जटिल कार्यप्रवाह को संभालकर, AI एजेंट्स उपयोगकर्ताओं को अधिक दक्षता प्राप्त करने में सक्षम बना रहे हैं। पत्र आधुनिक रोजगार पर स्वतंत्र प्रणालियों के बढ़ते प्रभाव का सबूत के रूप में कार्य करता है।

github llama.cpp · 7 दिन पहले

SYCL में conv_3d के लिए विफल यूनिट टेस्ट केस ठीक करें

llama.cpp रिपॉजिटरी ने SYCL बैकएंड से संबंधित एक विशिष्ट मुद्दे को संबोधित किया है। conv_3d ऑपरेशन से जुड़े विफल यूनिट टेस्ट केस को ठीक करने के लिए एक पुल रिक्वेस्ट जमा की गई थी। यह अपडेट GitHub पर ggml-org/llama.cpp प्रोजेक्ट को लक्षित करता है। ये बदलाव उन त्रुटियों को हल करते हैं जो पहले इन टेस्ट के सफल निष्पादन में बाधा डाल रही थीं। यह फिक्स SYCL-आधारित हार्डवेयर एक्सेलरेशन पर निर्भर उपयोगकर्ताओं के लिए बेहतर स्थिरता सुनिश्चित करता है।

github llama.cpp · 7 दिन पहले

llama.cpp b9786 रिलीज़ में ओपनसीएल नॉन-कंटिगियस रो सपोर्ट जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9786 जारी किया है, जिसमें ओपनसीएल के माध्यम से नॉर्मलाइजेशन में नॉन-कंटिगियस रो के लिए सपोर्ट पेश किया गया है। यह अपडेट विभिन्न प्लेटफॉर्म्स पर हार्डवेयर संगतता और प्रदर्शन को बेहतर बनाने के लिए ggml-org टीम द्वारा चल रहे विकास का हिस्सा है। इस रिलीज़ में macOS एप्पल सिلىकॉन, इंटेल मैक्स और iOS XCFrameworks के लिए बाइनरी उपलब्ध हैं। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO और SYCL बैकएंड्स का उपयोग करके Ubuntu x64, arm64 और s390x आर्किटेक्चर के लिए बिल्ड्स तक पहुंच सकते हैं। Android के लिए arm64 CPU डिवाइसेस पर सपोर्ट उपलब्ध है, जबकि Windows में CPU, CUDA 12 और 13, Vulkan, OpenVINO, SYCL और HIP सहित व्यापक विकल्प प्रदान किए गए हैं। इस रिलीज़ में macOS और openEuler प्लेटफॉर्म्स पर KleidiAI के लिए बिल्ड्स को अक्षम करने की सूची भी दी गई है।

github llama.cpp · 7 दिन पहले

llama.cpp b9785 रिलीज हार्डेन कैप्स चेक और मल्टी-प्लेटफ़ॉर्म बाइनरी के साथ

llama.cpp प्रोजेक्ट ने संस्करण b9785 जारी किया है, जिसमें पुल रिक्वेस्ट #24973 में विस्तार से बताए गए अनुसार कैप्स चेक्स को मजबूत बनाने के लिए कोड में बदलाव शामिल है। यह अपडेट macOS Apple Silicon, Intel Macs, और XCFramework के माध्यम से iOS के लिए प्री-बिल्ड बाइनरी प्रदान करता है, जहाँ Apple Silicon पर KleidiAI समर्थन अक्षम किया गया है। Ubuntu सहित Linux वितरण x64, arm64, और s390x आर्किटेक्चर पर CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड के लिए समर्थित हैं। Android उपयोगकर्ता arm64 CPU बाइनरी तक पहुँच सकते हैं, जबकि Windows CPU, OpenCL Adreno, CUDA 12 और 13, Vulkan, OpenVINO, SYCL, और HIP को कवर करने वाले व्यापक विकल्प प्रदान करता है। इस रिलीज में x86 और aarch64 प्रोसेसरों को लक्षित करने वाले openEuler के लिए ACL ग्राफ़ समर्थन के साथ बिल्ड्स भी शामिल हैं। स्थानीय मॉडल इनफरेंस को सुविधाजनक बनाने के लिए प्लेटफ़ॉर्म-विशिष्ट रिलीजों के साथ एक स्टैंडअलोन UI पैकेज उपलब्ध है।

lab Claude Code Releases · 7 दिन पहले

Claude Code v2.1.191 रिलीज नोट्स

Claude Code संस्करण 2.1.191 में /rewind समर्थन पेश किया गया है, जिससे उपयोगकर्ता /clear कमांड चलाने से पहले की बातचीत को फिर से शुरू कर सकते हैं। इस अपडेट ने कई महत्वपूर्ण समस्याओं को ठीक किया है, जिनमें रोके जाने के बाद बैकग्राउंड एजेंट्स का पुनर्जीवित होना और स्ट्रीमिंग प्रतिक्रियाओं के दौरान स्क्रॉल स्थिति का कूदना शामिल हैं। यह /voice द्वारा सामान्य त्रुटि संदेश दिखाने और Windows Terminal में /login URLs के truncated होने की व्यवस्था को भी ठीक करता है। MCP सर्वरों के लिए विश्वसनीयता में महत्वपूर्ण सुधार किए गए हैं, जिनमें क्षमता खोज और OAuth प्रवाह के दौरान अस्थायी नेटवर्क त्रुटियों के लिए पुनः प्रयास तर्क जोड़ा गया है। हेडलेस वातावरण अब OAuth के लिए ब्राउज़र पॉपअप को छोड़ देते हैं, जबकि सैंडबॉक्स नेटवर्क अनुमतियां सत्र की अवधि के लिए याद रखी जाती हैं। प्रदर्शन अनुकूलन टेक्स्ट अपडेट कोalescing के माध्यम से स्ट्रीमिंग के दौरान CPU उपयोग को लगभग 37% कम करते हैं और टर्मिनल आउटपुट कैश से लंबे-सत्र मेमोरी वृद्धि को रोकते हैं।

github LlamaIndex · 7 दिन पहले

Llama Index v0.14.23 रिलीज़ नोट्स

Llama Index ने 24 जून, 2026 को संस्करण 0.14.23 जारी किया, जिसमें महत्वपूर्ण बहुमोडल क्षमताएं और विभिन्न बग फिक्स शामिल हैं। कोर अपडेट में बहुमोडल सिंथेसिस सुविधाएं और विविध डेटा प्रकारों का समर्थन करने के लिए बहुमोडल क्वेरी इंजिन का परिचय शामिल है। मुख्य फिक्स FunctionTool आउटपुट के भीतर दस्तावेज़ और वीडियो ब्लॉक हैंडलिंग को संबोधित करते हैं और सुनिश्चित करते हैं कि URL-आधारित मेमोरी ब्लॉक सही ढंग से संरक्षित रहें। इनजेशन पाइपलाइन में बैच के भीतर डुप्लिकेट हटाने के लिए सेट का उपयोग करके और टोकन टेक्स्ट स्प्लिटिंग तर्क को अनुकूलित करके प्रदर्शन में सुधार किया गया है। रिलीज़ में खाली इनपुट सीक्वेंस पर ZeroDivisionError को भी हल किया गया है और जब इकाइयाँ चंक आकार से अधिक हो जाती हैं तो स्प्लिटर में पुनरावृत्ति त्रुटियों को ठीक किया गया है। इसके अलावा, फ़ाइल I/O संचालन में स्पष्ट UTF-8 एन्कोडिंग जोड़ी गई है, और प्रारंभिक अवस्थाओं की गहरी कॉपी करने से वर्कफ़्लो रनों के बीच म्यूटेशन लीक से बचा जाता है।

github CrewAI · 7 दिन पहले

v1.14.8a4 रिलीज़ नोट्स

v1.14.8a4 में CLI TUI में कनवर्सेशनल फ्लो सपोर्ट जोड़ा गया है। इसमें स्किल आर्काइव एक्सट्रैक्शन और डेक्लेरेटिव फ्लो डिफिनिशन पथ्स की वैलिडेशन के दौरान सिम्लंक पथ ट्रावर्सल के लिए फिक्स शामिल हैं। v1.14.8a3 के लिए दस्तावेज़ अपडेट किए गए हैं।

github llama.cpp · 7 दिन पहले

LLaMA.cpp Release b9784: Hexagon MM Optimizations और Cross-Platform Binaries

LLaMA.cpp ने hexagon-आधारित MM ऑपरेशन के लिए प्रमुख अनुकूलन के साथ संस्करण b9784 जारी किया है, जिसमें 32x32 टाइल्ड वेट रीपैक, सुधारा हुआ dyn.quant हैंडलिंग और एकीकृत kernel पैरामीटर प्रबंधन शामिल हैं। इस रिलीज में macOS (arm64 और x64), iOS, और Vulkan, ROCm, और OpenVINO के साथ कई Linux आर्किटेक्चर के लिए नए binaries शामिल हैं।

github llama.cpp · 7 दिन पहले

llama.cpp ने b9782 नए बाइनरी और समर्थन के साथ जारी किया

llama.cpp ने संस्करण b9782 जारी किया, जिसमें macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी शामिल हैं। इस रिलीज में कई आर्किटेक्चर पर Vulkan, OpenVINO, SYCL, ROCm, और CUDA के लिए समर्थन जोड़ा गया है, साथ ही अपडेटेड UI और KleidiAI व openEuler समर्थन जैसे फीचर्स को अक्षम किया गया है।

lab Google DeepMind Blog · 7 दिन पहले

जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ क्षमता जोड़ी गई

गूगल ने जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ पेश किया है, जिससे मॉडल कोड निष्पादित कर सकता है और बाहरी टूल्स के साथ इंटरैक्ट कर सकता है। इस सुविधा से उपयोगकर्ता प्रोग्रामिंग कार्य चला सकते हैं और एकीकृत कंप्यूटिंग फंक्शन्स के माध्यम से रियल-टाइम जानकारी तक पहुंच सकते हैं।

lab Hugging Face Blog · 7 दिन पहले

FFASR लीडरबोर्ड का परिचय: वास्तविक दुनिया में ASR का बेंचमार्किंग

वास्तविक दुनिया की स्थितियों में वॉइस रिकग्निशन सिस्टम का मूल्यांकन करने के लिए FFASR लीडरबोर्ड शुरू किया गया था। यह विविध वातावरण और उपयोग मामलों में स्वचालित वॉइस रिकग्निशन मॉडल के प्रदर्शन का आकलन करने के लिए एक बेंचमार्क प्रदान करता है।