对 llama.cpp 仓库的拉取请求引入了一个更改,该更改利用 hipBLAS 在 AMD gfx900 架构 GPU 上执行密集预填充操作。此修改专门针对遗留 Vega GPU 硬件,包括 Radeon RX Vega 56/64 和 Radeon Pro Vega 系列等型号。
- 在测试模型中平均性能提升约 40%。
- Qwen3.5 4B 性能提升 36.1%。
- Qwen3.6 27B 提升 18.9%。
- Gemma4 12B 实现显著提升 65.1%。
此更新为运行较旧 AMD Vega 硬件的用户提供了实质性的速度改进,解决了该特定架构上的性能限制。