llama.cpp プロジェクトはバージョン b9860 をリリースし、モデルファイルのタイプ(量子化)名を公開する新しいパブリック C API 関数 `llama_ftype_name` を導入しました。
- `llama_ftype_name` 関数は「Q8_0」や「Q4_K - Medium」などの文字列を返し、ポインターはモデルの存続期間中有効であり、無効な場合は nullptr です。
- 実装では、「(guessed)」ラベルを末尾ではなく先頭に付けることで最適化され、スレッドセーフでない静的文字列が削除され、関数の割り当てが不要になりました。
- macOS (Apple Silicon および Intel)、Linux (CPU、Vulkan、ROCm、OpenVINO、SYCL)、Android、Windows (CPU、CUDA 12/13、Vulkan、OpenCL、OpenVINO、SYCL、HIP)、openEuler のバイナリが利用可能です。
このアップデートにより、開発者は外部メタデータや推測に頼らず、プログラムで読み込まれたモデルの量子化フォーマットを識別できるようになります。