llama.cppプロジェクトはバージョンb9847をリリースしました。このリリースには、CUDAにおけるGemma E4B MTP FlashAttentionの修正と、未使用のテンプレート宣言の削除が含まれています。
- CUDAバックエンドでのGemma E4B MTP FlashAttentionを修正 (#25148)
- 未使用のテンプレート宣言を削除
- macOS Apple Silicon (arm64) バイナリを提供
- macOS Intel (x64) バイナリを提供
- iOS XCFrameworkを提供
- Ubuntu x64 および arm64 CPUビルドを含める
- Ubuntu Vulkan、ROCm 7.2、OpenVINO、SYCL FP32、SYCL FP16ビルドを提供
- Android arm64 CPUビルドをリリース
- Windows x64 および arm64 CPUビルドを提供
- DLL付きのWindows CUDA 12.4 および 13.3ビルドを提供
- Windows Vulkan、OpenVINO、SYCL、HIPビルドを提供
- openEuler向け 310p および 910b (ACL Graph) プロセッサ用 x86 および aarch64 ビルド
- 一般用UIバイナリをリリース