llama.cppリポジトリへのプルリクエストにより、AMD gfx900アーキテクチャのGPUにおける密集プリフィル操作にhipBLASを利用する変更が導入されました。この修正は、Radeon RX Vega 56/64やRadeon Pro VegaシリーズなどのレガシーVega GPUハードウェアを対象としています。

  • テストされたモデル全体で平均約40%のパフォーマンス向上。
  • Qwen3.5 4Bはパフォーマンスが36.1%増加。
  • Qwen3.6 27Bは18.9%の改善を示す。
  • Gemma4 12Bは大幅な65.1%のブーストを達成。

このアップデートは、古いAMD Vegaハードウェアを実行しているユーザーに substantial な速度向上を提供し、この特定のアーキテクチャにおけるパフォーマンスの制限に対処します。