llama.cpp リリース b9757: 新しいバイナリと新機能
llama.cpp は、macOS、Linux、Android、Windows、openEuler 向けの更新されたバイナリを含むバージョン b9757 をリリースしました。このリリースでは、top-n-sigma サンプラーにおける無条件の softmax+sort が削除され、サンプリング効率が向上しました。新しいビルドは、Apple Silicon や ARM64 を含む複数のアーキテクチャ上で Vulkan、OpenVINO、SYCL、ROCm、CUDA をサポートしています。