llama.cpp रिलीज़ b9670 में llama-graph में NVFP4 एज केस के लिए सुधार शामिल हैं, जैसे कि पोस्ट-GEMM MUL ऑपरेशन्स को स्थानांतरित करना और build_ffn को समर्थित संयोजनों तक सीमित करना। रिलीज़ में macOS, Linux, Android, Windows और openEuler के लिए कई आर्किटेक्चर और बैकएंड विकल्पों, जैसे CUDA, Vulkan, SYCL और OpenVINO के लिए बाइनरी प्रदान की गई हैं।
llama.cpp रिलीज़ b9670: सुधार और नई बिल्ड्स
अनुवादित English → हिन्दी