llama.cpp 项目发布了版本 b9860,引入了一个新的公共 C API 函数 `llama_ftype_name`,用于暴露模型文件类型(量化)名称。
- `llama_ftype_name` 函数返回诸如 "Q8_0" 或 "Q4_K - Medium" 的字符串,指针在模型生命周期内有效,如果无效则为 nullptr。
- 实现通过前置 "(guessed)" 标签而不是追加它进行了优化,移除了一个非线程安全的静态字符串,使该函数无需分配内存。
- 二进制文件适用于 macOS(Apple Silicon 和 Intel)、Linux(CPU、Vulkan、ROCm、OpenVINO、SYCL)、Android、Windows(CPU、CUDA 12/13、Vulkan、OpenCL、OpenVINO、SYCL、HIP)和 openEuler。
此更新允许开发人员以编程方式识别加载模型的量化格式,而无需依赖外部元数据或猜测。