llama.cppリポジトリへのプルリクエストにより、AMD gfx900アーキテクチャのGPUにおける密集プリフィル操作にhipBLASを利用する変更が導入されました。この修正は、Radeon RX Vega 56/64やRadeon Pro VegaシリーズなどのレガシーVega GPUハードウェアを対象としています。
- テストされたモデル全体で平均約40%のパフォーマンス向上。
- Qwen3.5 4Bはパフォーマンスが36.1%増加。
- Qwen3.6 27Bは18.9%の改善を示す。
- Gemma4 12Bは大幅な65.1%のブーストを達成。
このアップデートは、古いAMD Vegaハードウェアを実行しているユーザーに substantial な速度向上を提供し、この特定のアーキテクチャにおけるパフォーマンスの制限に対処します。