O ggml-cpu agora suporta K tails na multiplicação de matrizes MMA Q8/Q4 do Power10, removendo o requisito de que K seja divisível por kc. Isso permite que mais cargas de trabalho usem o kernel MMA e reduz a dependência do mnpack.
ggml-cpu adiciona suporte a K tails para Power10 MMA Q8/Q4
Traduzido do English → Português (BR)