llama.cpp version b9703 inclut une refonte de la gestion des presets du serveur, supprimant le support des presets HF distants et les fonctions dépréciées. La release fournit des binaires pour macOS, Linux, Android, Windows et openEuler sur plusieurs architectures et options d'accélération matérielle, y compris Vulkan, CUDA, OpenVINO et SYCL.