सभी लेख
github llama.cpp · 7 दिन पहले

llama.cpp b9789 रिलीज में MoE क्वांटीकरण की मरम्मत और बहु-प्लेटफ़ॉर्म बाइनरीज़ प्रदान की गई

llama.cpp परियोजना ने संस्करण b9789 जारी किया है, जिसमें मल्टी-टोकन भविष्यवाणी के साथ मिक्सचर ऑफ एक्सपर्ट्स (MoE) मॉडल्स को क्वांटाइज़ करने के लिए एक महत्वपूर्ण मरम्मत शामिल है। यह अपडेट पुल अनुरोध #24986 में पहचाने गए मुद्दों को दूर करता है ताकि इन विशिष्ट मॉडल आर्किटेक्चर्स का उचित प्रबंधन सुनिश्चित किया जा सके। इस रिलीज में macOS Apple Silicon और Intel के लिए पूर्व-बिल्ड बाइनरीज़, साथ ही एक iOS XCFramework प्रदान करता है। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड्स के लिए Ubuntu पर बिल्ड डाउनलोड कर सकते हैं। Windows समर्थन में CPU, CUDA 12.4 और 13.3, Vulkan, OpenVINO, SYCL, और HIP वेरिएंट शामिल हैं। अतिरिक्त प्लेटफ़ॉर्म जैसे Android arm64 और openEuler भी विशिष्ट हार्डवेयर कॉन्फ़िगरेशन के साथ समर्थित हैं।

lab OpenAI News · 7 दिन पहले

OpenAI शोध दिखाता है कि AI एजेंट्स काम को बदल रहे हैं

OpenAI से एक नया शोध पत्र प्रदर्शित करता है कि कृत्रिम बुद्धिमत्ता एजेंट्स काम की प्रकृति को मौलिक रूप से कैसे बदल रहे हैं। अध्ययन इन एजेंट्स की क्षमता पर प्रकाश डालता है कि वे पहले की तुलना में लंबे और अधिक जटिल कार्यों को कैसे निष्पादित कर सकते हैं। इस तकनीकी उन्नति को विभिन्न पेशा भूमिकाओं में उत्पादकता का विस्तार करने के लिए जिम्मेदार ठहराया गया है। निष्कर्ष सुझाव देते हैं कि स्वचालन के माध्यम से श्रम को कैसे संगठित और निष्पादित किया जाता है, उसमें एक महत्वपूर्ण बदलाव आ रहा है। जटिल कार्यप्रवाह को संभालकर, AI एजेंट्स उपयोगकर्ताओं को अधिक दक्षता प्राप्त करने में सक्षम बना रहे हैं। पत्र आधुनिक रोजगार पर स्वतंत्र प्रणालियों के बढ़ते प्रभाव का सबूत के रूप में कार्य करता है।

github llama.cpp · 7 दिन पहले

SYCL में conv_3d के लिए विफल यूनिट टेस्ट केस ठीक करें

llama.cpp रिपॉजिटरी ने SYCL बैकएंड से संबंधित एक विशिष्ट मुद्दे को संबोधित किया है। conv_3d ऑपरेशन से जुड़े विफल यूनिट टेस्ट केस को ठीक करने के लिए एक पुल रिक्वेस्ट जमा की गई थी। यह अपडेट GitHub पर ggml-org/llama.cpp प्रोजेक्ट को लक्षित करता है। ये बदलाव उन त्रुटियों को हल करते हैं जो पहले इन टेस्ट के सफल निष्पादन में बाधा डाल रही थीं। यह फिक्स SYCL-आधारित हार्डवेयर एक्सेलरेशन पर निर्भर उपयोगकर्ताओं के लिए बेहतर स्थिरता सुनिश्चित करता है।

github llama.cpp · 7 दिन पहले

llama.cpp b9786 रिलीज़ में ओपनसीएल नॉन-कंटिगियस रो सपोर्ट जोड़ा गया

llama.cpp प्रोजेक्ट ने संस्करण b9786 जारी किया है, जिसमें ओपनसीएल के माध्यम से नॉर्मलाइजेशन में नॉन-कंटिगियस रो के लिए सपोर्ट पेश किया गया है। यह अपडेट विभिन्न प्लेटफॉर्म्स पर हार्डवेयर संगतता और प्रदर्शन को बेहतर बनाने के लिए ggml-org टीम द्वारा चल रहे विकास का हिस्सा है। इस रिलीज़ में macOS एप्पल सिلىकॉन, इंटेल मैक्स और iOS XCFrameworks के लिए बाइनरी उपलब्ध हैं। Linux उपयोगकर्ता CPU, Vulkan, ROCm 7.2, OpenVINO और SYCL बैकएंड्स का उपयोग करके Ubuntu x64, arm64 और s390x आर्किटेक्चर के लिए बिल्ड्स तक पहुंच सकते हैं। Android के लिए arm64 CPU डिवाइसेस पर सपोर्ट उपलब्ध है, जबकि Windows में CPU, CUDA 12 और 13, Vulkan, OpenVINO, SYCL और HIP सहित व्यापक विकल्प प्रदान किए गए हैं। इस रिलीज़ में macOS और openEuler प्लेटफॉर्म्स पर KleidiAI के लिए बिल्ड्स को अक्षम करने की सूची भी दी गई है।

github llama.cpp · 7 दिन पहले

llama.cpp b9785 रिलीज हार्डेन कैप्स चेक और मल्टी-प्लेटफ़ॉर्म बाइनरी के साथ

llama.cpp प्रोजेक्ट ने संस्करण b9785 जारी किया है, जिसमें पुल रिक्वेस्ट #24973 में विस्तार से बताए गए अनुसार कैप्स चेक्स को मजबूत बनाने के लिए कोड में बदलाव शामिल है। यह अपडेट macOS Apple Silicon, Intel Macs, और XCFramework के माध्यम से iOS के लिए प्री-बिल्ड बाइनरी प्रदान करता है, जहाँ Apple Silicon पर KleidiAI समर्थन अक्षम किया गया है। Ubuntu सहित Linux वितरण x64, arm64, और s390x आर्किटेक्चर पर CPU, Vulkan, ROCm 7.2, OpenVINO, और SYCL बैकएंड के लिए समर्थित हैं। Android उपयोगकर्ता arm64 CPU बाइनरी तक पहुँच सकते हैं, जबकि Windows CPU, OpenCL Adreno, CUDA 12 और 13, Vulkan, OpenVINO, SYCL, और HIP को कवर करने वाले व्यापक विकल्प प्रदान करता है। इस रिलीज में x86 और aarch64 प्रोसेसरों को लक्षित करने वाले openEuler के लिए ACL ग्राफ़ समर्थन के साथ बिल्ड्स भी शामिल हैं। स्थानीय मॉडल इनफरेंस को सुविधाजनक बनाने के लिए प्लेटफ़ॉर्म-विशिष्ट रिलीजों के साथ एक स्टैंडअलोन UI पैकेज उपलब्ध है।

lab Claude Code Releases · 7 दिन पहले

Claude Code v2.1.191 रिलीज नोट्स

Claude Code संस्करण 2.1.191 में /rewind समर्थन पेश किया गया है, जिससे उपयोगकर्ता /clear कमांड चलाने से पहले की बातचीत को फिर से शुरू कर सकते हैं। इस अपडेट ने कई महत्वपूर्ण समस्याओं को ठीक किया है, जिनमें रोके जाने के बाद बैकग्राउंड एजेंट्स का पुनर्जीवित होना और स्ट्रीमिंग प्रतिक्रियाओं के दौरान स्क्रॉल स्थिति का कूदना शामिल हैं। यह /voice द्वारा सामान्य त्रुटि संदेश दिखाने और Windows Terminal में /login URLs के truncated होने की व्यवस्था को भी ठीक करता है। MCP सर्वरों के लिए विश्वसनीयता में महत्वपूर्ण सुधार किए गए हैं, जिनमें क्षमता खोज और OAuth प्रवाह के दौरान अस्थायी नेटवर्क त्रुटियों के लिए पुनः प्रयास तर्क जोड़ा गया है। हेडलेस वातावरण अब OAuth के लिए ब्राउज़र पॉपअप को छोड़ देते हैं, जबकि सैंडबॉक्स नेटवर्क अनुमतियां सत्र की अवधि के लिए याद रखी जाती हैं। प्रदर्शन अनुकूलन टेक्स्ट अपडेट कोalescing के माध्यम से स्ट्रीमिंग के दौरान CPU उपयोग को लगभग 37% कम करते हैं और टर्मिनल आउटपुट कैश से लंबे-सत्र मेमोरी वृद्धि को रोकते हैं।

github llama.cpp · 7 दिन पहले

LLaMA.cpp Release b9784: Hexagon MM Optimizations और Cross-Platform Binaries

LLaMA.cpp ने hexagon-आधारित MM ऑपरेशन के लिए प्रमुख अनुकूलन के साथ संस्करण b9784 जारी किया है, जिसमें 32x32 टाइल्ड वेट रीपैक, सुधारा हुआ dyn.quant हैंडलिंग और एकीकृत kernel पैरामीटर प्रबंधन शामिल हैं। इस रिलीज में macOS (arm64 और x64), iOS, और Vulkan, ROCm, और OpenVINO के साथ कई Linux आर्किटेक्चर के लिए नए binaries शामिल हैं।

github llama.cpp · 7 दिन पहले

llama.cpp ने b9782 नए बाइनरी और समर्थन के साथ जारी किया

llama.cpp ने संस्करण b9782 जारी किया, जिसमें macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी शामिल हैं। इस रिलीज में कई आर्किटेक्चर पर Vulkan, OpenVINO, SYCL, ROCm, और CUDA के लिए समर्थन जोड़ा गया है, साथ ही अपडेटेड UI और KleidiAI व openEuler समर्थन जैसे फीचर्स को अक्षम किया गया है।

lab Google DeepMind Blog · 7 दिन पहले

जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ क्षमता जोड़ी गई

गूगल ने जेमीनी 3.5 फ्लैश में कंप्यूटर यूज़ पेश किया है, जिससे मॉडल कोड निष्पादित कर सकता है और बाहरी टूल्स के साथ इंटरैक्ट कर सकता है। इस सुविधा से उपयोगकर्ता प्रोग्रामिंग कार्य चला सकते हैं और एकीकृत कंप्यूटिंग फंक्शन्स के माध्यम से रियल-टाइम जानकारी तक पहुंच सकते हैं।

github llama.cpp · 7 दिन पहले

llama.cpp ने Vulkan और मल्टी-प्लेटफ़ॉर्म सपोर्ट के साथ b9781 जारी किया

llama.cpp ने Linux और Windows के लिए Vulkan सपोर्ट जोड़ते हुए, macOS, Linux, Android, और Windows पर ARM64 और x64 सहित कई आर्किटेक्चरों का विस्तार करते हुए संस्करण b9781 जारी किया। इस रिलीज़ में CPU, CUDA, OpenVINO, SYCL, और ROCm बिल्ड्स शामिल हैं, साथ ही एक UI कंपोनेंट भी उपलब्ध है।

lab Mistral AI News · 7 दिन पहले

एंटरप्राइज सुरक्षा और एक्सेस के लिए नए कनेक्टर नियंत्रण

Mistral Studio अब प्रत्येक वर्कस्पेस और टूल के लिए कनेक्टर एक्सेस को शासित करने के लिए समृद्ध एडमिन नियंत्रण प्रदान करता है, जिसमें सूक्ष्म-स्तर की अनुमतियां शामिल हैं। इसमें स्कॉप्स के साथ API कुंजियां, मल्टी-अकाउंट कनेक्टर्स और रूट कारण विश्लेषण के लिए एक नया Connectors डीबगर शामिल हैं, जो सभी एंटरप्राइज सिस्टम के साथ सुरक्षित और ऑडिट करने योग्य इंटीग्रेशन का समर्थन करते हैं।

lab Microsoft Research Blog · 7 दिन पहले

Talos: दुर्लभ रोग निदान के लिए स्वचालित जीनोमिक पुनर्विश्लेषण

Talos एक ओपन-सोर्स टूल है जो दुर्लभ रोग निदान की पहचान के लिए जीनोमिक डेटा का आवर्ती पुनर्विश्लेषण स्वचालित करता है। इसने केवल 1.3 उम्मीदवार वेरिएंट्स प्रति मरीज के साथ स्कोप में आने वाले निदानों की 90% पुनः प्राप्ति दर हासिल की, और 5,000 अनिर्धारित मरीजों में 241 नए निदान प्रदान किए, जिनमें से अधिकांश नई खोजें साक्ष्य के प्रकाशन के 32 दिनों के भीतर सामने आईं।

lab OpenAI News · 7 दिन पहले

OpenAI और Broadcom ने LLM-अनुकूलित इनफरेंस चिप का अनावरण किया

OpenAI और Broadcom ने Jalapeño पेश किया है, जो बड़े भाषा मॉडल इनफरेंस के लिए डिज़ाइन किया गया एक कस्टम AI चिप है। इस चिप का उद्देश्य AI सिस्टम में प्रदर्शन, दक्षता और स्केलेबिलिटी को बढ़ाना है।

github llama.cpp · 8 दिन पहले

vulkan-shaders-gen अब शेडर कंपाइलेशन त्रुटियों पर बिल्ड विफल हो जाता है

vulkan-shaders-gen टूल अब शेडर कंपाइलेशन विफल होने पर बिल्ड को विफल कर देता है, जिससे एक दोषपूर्ण libggml-vulkan का निर्माण रोका जाता है। यह सुधार उस पूर्व की समस्या को हल करता है जहां सफल बिल्ड रनटाइम विफलताओं को छिपा रहा था, और इसमें प्लेटफॉर्म भर में त्रुटि हैंडलिंग और एटॉमिक फ्लैग प्रबंधन में सुधार शामिल हैं।

github llama.cpp · 8 दिन पहले

LLaMA.cpp Release b9777 में नए मॉडल और क्रॉस-प्लेटफ़ॉर्म बाइनरी शामिल हैं

LLaMA.cpp release b9777 ने LFM2.5-ColBERT-350M और LFM2.5-Embedding-350M मॉडल जोड़े हैं। इस रिलीज़ में macOS, Linux, Android, Windows, और openEuler के लिए प्री-बिल्ट बाइनरी शामिल हैं, जो CUDA, Vulkan, OpenVINO, और SYCL जैसे विभिन्न आर्किटेक्चर और एक्सेलरेशन तकनीकों का समर्थन करती हैं।

github vLLM · 8 दिन पहले

v0.24.0rc1: SM75 पर topk histogram बिल्ड को ठीक करें

vllm ने v0.24.0rc1 जारी किया, जिसमें SM75 पर topk histogram बिल्ड समस्याओं के लिए एक सुधार शामिल है। यह परिवर्तन commit 191826e से cherry-picked किया गया है और Mohammad Miadh Angkad द्वारा signed off किया गया है।

github OpenAI Agents SDK · 8 दिन पहले

openai-agents-python v0.17.7 का रिलीज़

openai-agents-python लाइब्रेरी का संस्करण 0.17.7 में कॉन्फ़िगर करने योग्य WebSocket अधिकतम आकार और बफर्ड Chat Completions टूल-कॉल स्ट्रीमिंग जैसे नए फीचर्स शामिल हैं। इसमें सैंडबॉक्स बफरिंग, एरर हैंडलिंग और टूल डिस्पैच सहित कई मुद्दों के लिए मल्टीपल फिक्स, दस्तावेज़ अपडेट और बेहतर एरर मैसेजिंग भी शामिल है।

github llama.cpp · 8 दिन पहले

llama.cpp रिलीज b9776 में Vulkan और कई हार्डवेयर सपोर्ट जोड़ा गया

llama.cpp संस्करण b9776 में Linux और Windows के लिए Vulkan सपोर्ट, साथ ही macOS, Linux, Android और Windows पर CPU, OpenCL, CUDA, और SYCL वेरिएंट शामिल हैं। इस रिलीज में OpenVINO और ROCm के लिए भी सपोर्ट है, जिसका UI एक स्टैंडअलोन पैकेज में उपलब्ध है।

lab Claude Code Releases · 8 दिन पहले

Claude v2.1.187 रिलीज़ नोट्स

Claude v2.1.187 में सैंडबॉक्स क्रेडेंशियल ब्लॉकिंग, ऑर्ग-कॉन्फ़िगर किए गए मॉडल प्रतिबंध, फुलस्क्रीन में माउस क्लिक समर्थन, और कमांड विफलताओं, टूल हैंग्स, और UI स्थिरता के लिए सुधार शामिल हैं। अपडेट में स्ट्रक्चर्ड आउटपुट हैंडलिंग, एजेंट डेप्थ ट्रैकिंग, और प्लगइन मैनेजमेंट में भी सुधार किया गया है, साथ ही VSCode और टर्मिनल संगतता में भी वृद्धि की गई है।