Проект llama.cpp выпустил версию b9860, вводя новую публичную функцию C API с именем `llama_ftype_name` для отображения имени типа файла модели (квантования).

  • Функция `llama_ftype_name` возвращает строки, такие как "Q8_0" или "Q4_K - Medium", указатель действителен в течение времени жизни модели и равен nullptr при ошибке.
  • Реализация была оптимизирована путем добавления метки "(guessed)" в начало вместо конца, что устранило небезопасную для потоков статическую строку и сделало функцию не требующей выделения памяти.
  • Бинарные файлы доступны для macOS (Apple Silicon и Intel), Linux (CPU, Vulkan, ROCm, OpenVINO, SYCL), Android, Windows (CPU, CUDA 12/13, Vulkan, OpenCL, OpenVINO, SYCL, HIP) и openEuler.

Это обновление позволяет разработчикам программно определять формат квантования загруженных моделей без reliance на внешние метаданные или угадывание.