O ggml-cpu agora suporta K tails na multiplicação de matrizes MMA Q8/Q4 do Power10, removendo o requisito de que K seja divisível por kc. Isso permite que mais cargas de trabalho usem o kernel MMA e reduz a dependência do mnpack.