Rilis b9855 llama.cpp menambahkan optimisasi AVX2 nvfp4 dan biner baru

Proyek llama.cpp telah merilis versi b9855, yang memperkenalkan optimisasi AVX2 untuk produk titik nvfp4 menggunakan Tabel Pencarian (LUT) UE4M3 di dalam backend ggml-cpu.

Build macOS Apple Silicon dan Intel tersedia bersama dengan iOS XCFramework.
Biner Linux mendukung arsitektur Ubuntu x64, arm64, dan s390x melalui CPU, Vulkan, ROCm 7.2, OpenVINO, dan SYCL (FP32/FP16).
Rilis Windows mencakup backend CPU, OpenCL Adreno, CUDA 12.4 dan 13.3, Vulkan, OpenVINO, SYCL, dan HIP.
Biner CPU arm64 Android disediakan untuk penyebaran seluler.
Dukungan KleidiAI pada macOS Apple Silicon dinonaktifkan dalam rilis ini.

Pembaruan ini memberikan pengguna kemampuan inferensi yang dioptimalkan untuk konfigurasi perangkat keras tertentu dan memperluas rentang akselerator yang didukung di berbagai sistem operasi utama.