llama.cpp 版本 b9686 修复了在使用 Eagle3 模型处理长提示时发生的段错误。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制文件,支持多种架构和硬件加速选项,包括 Vulkan、CUDA、OpenVINO 和 SYCL。