LLaMA.cpp 版本 b9674 修复了 MoE 预填充期间 SYCL 的异步 memcpy 中的释放后使用错误。该版本包括适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持跨多种架构的 CPU、Vulkan、ROCm、OpenVINO、SYCL 和 CUDA。