llama.cpp merilis b9752: refaktor server dan binari lintas-platform
llama.cpp merilis versi b9752 dengan refaktor server yang berfokus pada konstruksi batch, termasuk penanganan kasus batch penuh yang lebih baik dan perbaikan bug. Rilis ini mencakup binari pra-bangun untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan kerangka akselerasi seperti CUDA, Vulkan, OpenVINO, dan SYCL.