llama.cpp 版本 b9718 将槽位选择整合为单个函数 get_available_slot,同时保持用于提示缓存更新的 LCP 相似度检查。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项。
llama.cpp 发布 b9718:整合槽位选择与全新二进制构建
译自 English → 中文
llama.cpp 版本 b9718 将槽位选择整合为单个函数 get_available_slot,同时保持用于提示缓存更新的 LCP 相似度检查。该版本包含适用于 macOS、Linux、Android、Windows 和 openEuler 的二进制构建,支持多种架构和硬件加速选项。