A versão b9718 do llama.cpp consolida a seleção de slots em uma única função, get_available_slot, mantendo as verificações de similaridade LCP para atualizações do cache de prompts. O release inclui builds binários para macOS, Linux, Android, Windows e openEuler em múltiplas arquiteturas e opções de aceleração de hardware.