Rilis llama.cpp b9767 meningkatkan inferensi MTP menggunakan jalur mat-vec untuk batch kecil dan menyertakan pembaruan dukungan GPU. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan API termasuk Vulkan, CUDA, OpenVINO, dan SYCL.