La versión b9699 de llama.cpp introduce soporte para las operaciones MUL_MAT y OUT_PROD con precisión Q1_0 a través del PR #24721. El lanzamiento incluye binarios precompilados para macOS, Linux, Android, Windows y openEuler en múltiples arquitecturas y marcos de aceleración, incluyendo SYCL (FP32 y FP16), Vulkan, CUDA, ROCm y OpenVINO.