ggml-cpu теперь поддерживает K tails в Power10 Q8/Q4 MMA matmul, устраняя необходимость того, чтобы K делилось на kc. Это позволяет использовать MMA-ядерный модуль для большего количества задач и снижает переключение на mnpack.
ggml-cpu добавляет поддержку K tails для Power10 MMA Q8/Q4
Переведено с English → Русский