ggml-cpu prend désormais en charge les queues K dans la multiplication matricielle MMA Q8/Q4 de Power10, supprimant l'exigence selon laquelle K doit être divisible par kc. Cela permet à davantage de charges de travail d'utiliser le noyau MMA et réduit le recours à mnpack.