सभी लेख
github llama.cpp · 9 दिन पहले

Android बिल्ड के लिए libandroid-spawn निर्भरता जोड़ें

Android बिल्ड दस्तावेज़ीकरण को libandroid-spawn पर निर्भरता शामिल करने के लिए अपडेट किया गया है। यह जोड़ विशेष वातावरण के भीतर बिल्डिंग प्रक्रिया का समर्थन करने के लिए किया गया है।

lab OpenAI News · 10 दिन पहले

सैमसंग ने कर्मचारियों के लिए ChatGPT और Codex को तैनात किया

सैमसंग इलेक्ट्रॉनिक्स ने अपने वैश्विक कार्यबल के लिए OpenAI के ChatGPT Enterprise और Codex को लॉन्च किया है। यह डिप्लॉयमेंट अभी तक के OpenAI के सबसे बड़े एंटरप्राइज़ AI पहलों में से एक है।

github llama.cpp · 10 दिन पहले

llama.cpp रिलीज b9750: नया call स्टेटमेंट और क्रॉस-प्लेटफ़ॉर्म बाइनरी

llama.cpp संस्करण b9750 में एक call स्टेटमेंट कार्यान्वयन पेश किया गया है और एक अनचाहे बदलाव को वापस ले लिया गया है। इस रिलीज में macOS, Linux, Android, Windows, और openEuler के लिए पूर्व-कंपाइल किए गए बाइनरी शामिल हैं, जो कई आर्किटेक्चर और हार्डवेयर एक्सेलरेशन विकल्पों जैसे Vulkan, CUDA, OpenVINO, और SYCL पर उपलब्ध हैं।

github llama.cpp · 10 दिन पहले

llama.cpp ने b9748 संस्करण नए बाइनरी और फीचर्स के साथ जारी किया

llama.cpp ने b9748 संस्करण जारी किया, जिसमें अपने स्कीमा में एक "verbose" फ़ील्ड जोड़ी गई है और macOS, Linux, Android, Windows, और openEuler के लिए बाइनरी प्रदान किए गए हैं। इस रिलीज में कई आर्किटेक्चर पर CPU, Vulkan, OpenVINO, SYCL, और ROCm समर्थन शामिल है, साथ ही iOS और Windows CUDA और Vulkan बिल्ड्स उपलब्ध हैं।

lab Google DeepMind Blog · 10 दिन पहले

आंतरिक सिस्टम सुरक्षा के लिए एआई कंट्रोल रोडमैप

एक एआई कंट्रोल रोडमैप पेश किया गया है, जो पारंपरिक सुरक्षा उपायों को रियल-टाइम मॉनिटिंग क्षमताओं के साथ एकीकृत करके आंतरिक सिस्टम को सुरक्षित बना रहा है।

lab OpenAI News · 10 दिन पहले

GPT-5.5 Instant ने ChatGPT के स्वास्थ्य प्रतिक्रियाओं में सुधार किया है

GPT-5.5 Instant मजबूत तर्कशक्ति, बेहतर संदर्भ हैंडलिंग, स्पष्ट संचार और चिकित्सकों द्वारा दी गई प्रतिक्रियाओं के माध्यम से ChatGPT की स्वास्थ्य और कल्याण संबंधी प्रतिक्रियाओं में सुधार करता है।

lab Google — The Keyword (AI) · 10 दिन पहले

नई शोध बताती है कि AMIE रोग प्रबंधन में डॉक्टरों के बराबर है

नेचर में प्रकाशित एक अध्ययन से पता चलता है कि AMIE, एक कथोपकथन AI सिस्टम, जटिल स्वास्थ्य स्थितियों के प्रबंधन में प्राथमिक देखभाल चिकित्सकों के बराबर प्रदर्शन करता है।

lab Google DeepMind Blog · 10 दिन पहले

UK सरकार और Google DeepMind ने AI-संचालित आवास योजना प्रोटोटाइप लॉन्च किया

UK सरकार ने आवास योजना निर्णयों को तेज करने के लिए डिज़ाइन किए गए AI-संचालित प्रोटोटाइप को विकसित करने के लिए Google DeepMind के साथ भागीदारी की है। यह पहल निर्णय लेने की दक्षता में सुधार करके आर्टिफिशियल इंटेलिजेंस का लाभ उठाकर घर बनाने की प्रक्रिया को सरल बनाने का लक्ष्य रखती है।

lab OpenAI News · 10 दिन पहले

OpenAI ने ChatGPT Enterprise के लिए खर्च नियंत्रण और उपयोग विश्लेषण शुरू किए

OpenAI ने ChatGPT Enterprise के लिए नए खर्च नियंत्रण और उपयोग विश्लेषण पेश किए हैं। ये सुविधाएं उद्यमों को AI उपयोग को बढ़ाते समय लागत का प्रबंधन करने और सूचित निर्णय लेने में मदद करती हैं।

github llama.cpp · 10 दिन पहले

llama.cpp रिलीज b9747 में रियल-टाइम मॉडल लोड ट्रैकिंग और नए प्लेटफ़ॉर्म बाइनरीज़ शामिल हैं

llama.cpp संस्करण b9747 में SSE एंडपॉइंट्स के माध्यम से रियल-टाइम मॉडल लोड प्रोग्रेस ट्रैकिंग पेश की गई है। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए बाइनरीज़ शामिल हैं, जो Vulkan, CUDA, OpenVINO और SYCL जैसे विभिन्न आर्किटेक्चर्स और एक्सेलरेशन तकनीकों का समर्थन करती हैं।

github llama.cpp · 10 दिन पहले

llama.cpp रिलीज b9745 में MTP3 सपोर्ट और क्रॉस-प्लेटफ़ॉर्म बाइनरीज़ शामिल हैं

llama.cpp संस्करण b9745 में Step3.5/3.7 फ्लैश MTP3 के लिए सपोर्ट, लेयर ऑफसेट और nextn फ्लैग्स के लिए नए APIs शामिल हैं। इस रिलीज में macOS, Linux, Android, Windows, और openEuler के लिए प्रीबिल्ड बाइनरीज़ उपलब्ध हैं, CPU, Vulkan, CUDA, OpenVINO, और SYCL एक्सेलरेशन के विकल्पों के साथ।

github llama.cpp · 11 दिन पहले

LLaMA.cpp Release b9744: नए बाइनरी और फीचर्स

LLaMA.cpp ने macOS, Linux, Android, Windows, और openEuler के लिए अपडेटेड बाइनरी के साथ version b9744 जारी किया है। इस रिलीज में Vulkan, CUDA, OpenVINO, SYCL, और ROCm जैसे कई आर्किटेक्चर्स और हार्डवेयर एक्सेलेरेटरों का समर्थन शामिल है। यूजर इंटरफेस एक्सेस के लिए एक UI पैकेज भी उपलब्ध है।

github llama.cpp · 11 दिन पहले

llama.cpp Release b9742: SSM-conv weights के लिए padded stride के साथ अपडेट

llama.cpp version b9742 में SSM-conv weights के लिए padded stride शामिल है, जो न्यूरल नेटवर्क ऑपरेशन की दक्षता को बढ़ाता है। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए बाइनरी शामिल हैं, जो Vulkan, CUDA, OpenVINO और SYCL सहित कई आर्किटेक्चर और APIs पर उपलब्ध हैं।

github llama.cpp · 11 दिन पहले

llama.cpp Release b9743 में नए बाइनरी और GPU सपोर्ट जोड़े गए

llama.cpp संस्करण b9743 ने macOS, Linux, Android, Windows, और openEuler के लिए कई आर्किटेक्चर पर नए बाइनरी पेश किए। रिलीज में Vulkan, CUDA 12.4 और 13.3, OpenVINO, SYCL, और ROCm का सपोर्ट शामिल है, साथ ही JSON स्कीमा से ग्रामर एलाइनमेंट के माध्यम से अपडेटेड UI और बेहतर पार्सर स्पेसिंग नियम भी हैं।

github llama.cpp · 11 दिन पहले

llama.cpp Release b9741 में नए बाइनरी और समर्थन जोड़े गए

llama.cpp संस्करण b9741 macOS, Linux, Android, Windows, और openEuler के लिए कई आर्किटेक्चर पर नए बाइनरी पेश करता है। रिलीज में Vulkan, CUDA 12.4 और 13.3, OpenVINO, SYCL, और ROCm के लिए समर्थन शामिल है, साथ ही iOS और Ubuntu के लिए अपडेटेड संस्करण भी हैं।

github llama.cpp · 11 दिन पहले

Windows पर test-args-parser के यादृच्छिक विफलताओं के लिए समाधान

एक पॅच argv ओवरराइड को केवल तभी लागू करने के लिए संशोधित करके Windows पर test-args-parser में यादृच्छिक विफलताओं को दूर करता है, जब argc मेल खाता है, जिससे प्रोग्रामेटिक आर्ग्युमेंट्स के कबड़ने से रोका जाता है। यह OpenVINO Windows वर्कफ़्लो में एक fastfail assertion को ठीक करता है, जबकि वास्तविक बाइनरीज़ के लिए UTF-8 हैंडलिंग को बनाए रखता है।

github llama.cpp · 11 दिन पहले

LLaMA.cpp Release b9739 में Win OpenCL Adreno ARM64 सपोर्ट जोड़ा गया

LLaMA.cpp version b9739 ने Windows ARM64 के लिए OpenCL Adreno का समर्थन जोड़ा है। इस रिलीज में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और APIs जैसे Vulkan, CUDA, OpenVINO और SYCL के साथ बाइनरी शामिल हैं।

github llama.cpp · 11 दिन पहले

llama.cpp रिलीज़ b9738: CORS auth हेडर फॉरवर्डिंग में सुधार और नए बाइनरी बिल्ड्स

llama.cpp संस्करण b9738 CORS प्रॉक्सी को प्रमाणीकरण हेडर्स को आगे बढ़ाने से रोकने के लिए ठीक करता है। इस रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और Vulkan, CUDA, OpenVINO, और SYCL सहित हार्डवेयर एक्सेलरेशन विकल्पों के लिए बाइनरी बिल्ड्स शामिल हैं।

github llama.cpp · 11 दिन पहले

ggml ने partition flattening के साथ AMX को अनुकूलित किया

ggml प्रोजेक्ट ने n_batch * M पर partition को flatten करके AMX प्रदर्शन को अनुकूलित किया, यह सुनिश्चित करते हुए कि सभी threads quantization में भाग लें। इस बदलाव से CPU और GPU प्लेटफॉर्म पर विभिन्न मॉडलों और हार्डवेयर कॉन्फ़िगरेशन के across गति 1.47x तक बढ़ी है, जिसमें inference time में स्थिर लाभ दिखाई दे रहे हैं।