github llama.cpp · 14 hari lalu · inference

llama.cpp merilis versi b9688 dengan API baru dan binari lintas-platform

Diterjemahkan dari English → Bahasa Indonesia

llama.cpp merilis versi b9688, menambahkan API manajemen model dan pembaruan realtime SSE. Rilis ini mencakup binari pra-bangun untuk macOS, Linux, Android, Windows, dan openEuler, mendukung berbagai arsitektur dan framework akselerasi seperti Vulkan, CUDA, OpenVINO, dan SYCL.

Kepentingan 1/3 Kepercayaan 2/3 llama.cpp API & product launches Code generation Inference efficiency

Baca aslinya