Wmf - एक नई प्रायोगिक तकनीक
लेख का सामग्री लेखक द्वारा हटा दिया गया है, जिससे तकनीक के बारे में कोई सार्वभौमिक जानकारी नहीं बची है।
लेख का सामग्री लेखक द्वारा हटा दिया गया है, जिससे तकनीक के बारे में कोई सार्वभौमिक जानकारी नहीं बची है।
एक गैर-प्रोग्रामर 128GB एकत्रीकृत मेमोरी वाले MacBook M5 Max पर स्थानीय बड़े भाषा मॉडल (LLM) इंफ्रास्ट्रक्चर सेटअप करने के अपने अनुभव को साझा करता है। उपयोगकर्ता स्थिर, दूरस्थ रूप से सुलभ सिस्टम स्थापित करते हुए AI सीखने के अपने उद्देश्यों, मॉडल चयनों और सॉफ़्टवेयर स्टैक का विवरण देते हैं।
Together AI ICML 2026 में अपनी प्लेटफ़ॉर्म विकास के पूरे स्टैक को कवर करने वाले नौ पेपर प्रस्तुत कर रहा है।
Hugging Face और Cerebras ने Google के Gemma 4 मॉडल को अपनी प्लेटफार्मों में एकीकृत किया है ताकि रियल-टाइम वॉइस आर्टिफिशियल इंटेलिजेंस अनुप्रयोग सक्षम हो सकें। इस सहयोग से डेवलपर्स कम लेटेंसी वाले ऑडियो प्रोसेसिंग कार्यों के लिए Gemma 4 की मल्टीमोडल क्षमताओं का लाभ उठा सकते हैं।
कंपनी ने ओपन-सोर्स आर्टिफिशियल इंटेलिजेंस की ओर संक्रमण को तेज करने के उद्देश्य से सीरीज़ C फंडिंग राउंड में $800 मिलियन जुटाए हैं।
यह लेख ScarfBench पेश करता है, एक बेंचमार्क जो विभिन्न फ्रेमवर्क्स के बीच एंटरप्राइज़ जावा एप्लिकेशन को माइग्रेट करने में AI एजेंट्स के प्रदर्शन का मूल्यांकन करने के लिए डिज़ाइन किया गया है। अध्ययन फ्रेमवर्क माइग्रेशन की जटिलता पर प्रकाश डालता है और इस डोमेन में एजेंट क्षमताओं का आकलन करने के लिए एक मानकीकृत मूल्यांकन विधि का सुझाव देता है।
crewAI 1.15.2a1 रिलीज़ एजेंट ऑर्केस्ट्रेशन फ्रेमवर्क के लिए कई नई सुविधाओं, बग फिक्स और दस्तावेज़ीकरण अपडेट पेश करती है।
Google, न्यू यॉर्क जॉब्स CEO काउंसिल और अर्बन असंबली ने Google के कार्यालयों में 150 शिक्षा और उद्योग नेताओं के लिए एक AI शिखर सम्मेलन आयोजित किया। इस कार्यक्रम ने कक्षा के वातावरण के भीतर कृत्रिम बुद्धिमत्ता के एकीकरण के भविष्य पर चर्चा करने और आकार देने के लिए हितधारकों को एकत्र किया।
यह लेख जून 2026 के दौरान गूगल द्वारा जारी कृत्रिम बुद्धिमत्ता अपडेट और घोषणाओं का सारांश प्रस्तुत करता है।
llama.cpp b9859 रिलीज़ OpenCL के लिए लाइब्रेरी से प्रीकंपाइल्ड बाइनरी kernels लोड करने की क्षमता पेश करता है, विशेष रूप से Adreno GPUs को टारगेट करके। यह अपडेट CPU, GPU और विभिन्न एक्सेलेरेटर बैकएंड्स के लिए macOS, Linux, Windows, Android और openEuler के लिए बाइनरी भी प्रदान करता है।
xAI ने Grok Voice पर प्रोडक्शन-ग्रेड वॉइस एजेंट्स को दो मिनट से कम समय में कॉन्फ़िगर करने के लिए डिज़ाइन किए गए एक कोड-रहित प्लेटफ़ॉर्म, Voice Agent Builder का बीटा रिलीज़ घोषित किया। यह टूल ऑपरेटरों और डेवलपर्स को बेसिक टेलीफोनी या AI स्टैक को शून्य से बनाने के बिना उच्च-वॉल्यूम वॉइस एजेंट्स को डिप्लॉय करने की अनुमति देता है।
llama.cpp प्रोजेक्ट ने संस्करण b9858 जारी किया है, जिसमें मॉडल पथ के रूप में Hugging Face प्राथमिक स्प्लिट का उपयोग करने के लिए एक बदलाव शामिल है। यह अपडेट मॉडल लोडिंग पथों से संबंधित मुद्दा #25181 को हल करता है।
llama.cpp b9857 रिलीज़ में Hexagon Flash Attention कार्यान्वयन का व्यापक पुनर्निर्माण पेश किया गया है, जिसमें अनुकूलन और सटीकता में सुधार पर ध्यान केंद्रित किया गया है। इस अपडेट में hex-mm और hex-fa मॉड्यूल में महत्वपूर्ण बदलाव शामिल हैं, जैसे कि मुख्य matmul थ्रेड्स में quant कार्यों को फोल्ड करना, ADD ऑपरेशन के साथ फ्यूज़ करना, और मास्क प्रसंस्करण का अनुकूलन।
llama.cpp प्रोजेक्ट ने संस्करण b9855 जारी किया है, जिसने ggml-cpu बैकएंड के भीतर UE4M3 लुक-अप टेबल (LUT) का उपयोग करके nvfp4 डॉट उत्पाद के लिए AVX2 अनुकूलन पेश किया है।
llama.cpp प्रोजेक्ट ने संस्करण b9856 जारी किया है, जिसमें CUDA में Flash Attention के लिए `restrict` कीवर्ड और PDL का सुसंगत उपयोग शामिल है। इस अपडेट के साथ विभिन्न हार्डवेयर बैकएंड्स पर macOS, Linux, Android, Windows और openEuler के लिए पूर्व-निर्मित बाइनरीज़ भी उपलब्ध हैं।
अपडेट में प्रोग्रेसिव वेब ऐप (PWA) नेविगेट फॉलबैक तंत्र को हटा दिया गया है। यह परिवर्तन विशेष रूप से API एंडपॉइंट अनुरोधों के अनचाहे कैशिंग को रोकने के लिए लागू किया गया है।
llama.cpp प्रोजेक्ट ने संस्करण b9852 जारी किया है, जिसमें q1_0 क्वांटाइज़ेशन फॉर्मेट के लिए प्रारंभिक OpenCL सपोर्ट शामिल है। इस अपडेट में सामान्य q1_0 क्षमताएं और OpenCL डिवाइसों के लिए विशिष्ट Adreno GEMM/GEMV कार्यान्वयन शामिल हैं।
अमेरिकी सरकार द्वारा सभी उपयोगकर्ताओं की उपलब्धता को निलंबित करने वाले निर्यात नियंत्रणों को हटाए जाने के बाद एंथ्रोपिक अपने क्लॉड फेबल 5 और माइथोस 5 मॉडल्स तक वैश्विक पहुंच को पुनर्स्थापित कर रहा है। फेबल 5 1 जुलाई से क्लॉड प्लेटफ़ॉर्म पर वैश्विक रूप में उपलब्ध होगा, जिसमें 7 जुलाई तक उपयोग सीमाएं लागू रहेंगी और उसके बाद क्रेडिट-आधारित पहुंच में बदलाव हो जाएगा।
llama.cpp परियोजना ने संस्करण b9851 जारी किया है, जिसमें flash_attn_mask_to_KV_max kernel में पूर्णांक ट्रंकेशन और ओवरफ्लो त्रुटियों को रोकने के लिए CUDA के लिए एक सुधार शामिल है। यह अपडेट निर्दिष्ट kernel के भीतर KQ मास्क स्टाइड्स से संबंधित समस्याओं को हल करता है।
llama.cpp b9850 रिलीज में विशिष्ट मॉडल समर्थन अपडेट शामिल हैं, जिसमें Qwen3Next के लिए t_layer_inp टेंसर को पंजीकृत करना, लेयर प्रोसेसिंग लूप में इनपुट असाइनमेंट को ठीक करना, और qwen-coder-next के लिए DFLASH मुद्दों को हल करना शामिल है। इसमें Qwen3 मॉडल के लिए एटेंशन नॉर्मलाइजेशन के लिए एक टेंसर भी जोड़ा गया है।