github llama.cpp · 14 hari lalu · inference

llama.cpp Release b9677: Pembaruan dan Binari lintas-platform

Diterjemahkan dari English → Bahasa Indonesia

Versi b9677 dari llama.cpp memperbarui logging untuk memaksakan max_capacity dan menghapus logika ekspansi antrian. Rilis ini mencakup binari untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, OpenVINO, dan SYCL.

Kepentingan 0/3 Kepercayaan 2/3 llama.cpp

Baca aslinya