ggml-cpu теперь поддерживает K tails в Power10 Q8/Q4 MMA matmul, устраняя необходимость того, чтобы K делилось на kc. Это позволяет использовать MMA-ядерный модуль для большего количества задач и снижает переключение на mnpack.