La version b9848 de llama.cpp corrige get_rows_back pour CUDA et fournit des binaires
Le projet llama.cpp a publié la version b9848, qui inclut une correction critique pour le backend CUDA afin de résoudre les problèmes avec la fonction `get_rows_back` sur les tables dépassant 65535 lignes. Cette mise à jour corrige le clampage grid-y et les erreurs de stride qui affectaient précédemment les opérations sur de grandes tables.