La versión LLaMA.cpp b9674 corrige un error de uso después de liberar en el memcpy asíncrono de SYCL durante la prellenado de MoE. El lanzamiento incluye binarios para macOS, Linux, Android, Windows y openEuler, compatibles con CPU, Vulkan, ROCm, OpenVINO, SYCL y CUDA en múltiples arquitecturas.