llama.cpp 프로젝트는 버전 b9860을 출시하며 모델 파일 유형(양자화) 이름을 노출하는 새로운 공개 C API 함수 `llama_ftype_name`을 도입했습니다.
- `llama_ftype_name` 함수는 "Q8_0" 또는 "Q4_K - Medium"과 같은 문자열을 반환하며, 포인터는 모델의 수명 동안 유효하고 무효한 경우 nullptr입니다.
- 구현은 "(guessed)" 라벨을 뒤에 추가하는 대신 앞에 붙임으로써 최적화되었으며, 스레드 안전하지 않은 정적 문자열이 제거되어 함수가 할당 없이 동작합니다.
- macOS (Apple Silicon 및 Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP), openEuler용 바이너리가 제공됩니다.
이 업데이트를 통해 개발자는 외부 메타데이터나 추측에 의존하지 않고 로드된 모델의 양자화 형식을 프로그래밍 방식으로 식별할 수 있습니다.