O lançamento b9678 do LLaMA.cpp inclui a otimização de mul_mat_f16_f32_l4 para decode e introduz novos builds para macOS, Linux, Android, Windows e openEuler. O lançamento oferece suporte a CPU, Vulkan, ROCm, OpenVINO, SYCL e HIP em várias arquiteturas, com um pacote UI dedicado disponível.