github llama.cpp · 14 hari lalu · inference

llama.cpp merilis b9673 dengan alokasi sistem USM dan binari lintas-platform

Diterjemahkan dari English → Bahasa Indonesia

Versi llama.cpp b9673 memperkenalkan alokasi sistem USM opsional untuk buffer GPU ≥1GB, memungkinkan overcommit VRAM ketika dukungan perangkat tersedia. Fitur ini memerlukan variabel lingkungan GGML_SYCL_USM_SYSTEM dan dinonaktifkan secara default, kembali ke alokasi reguler jika tidak didukung.

Kepentingan 0/3 Kepercayaan 2/3 llama.cpp

Baca aslinya