github llama.cpp · 13 hari lalu · inference

llama.cpp rilis b9704: memperbaiki penanganan tata bahasa tidak valid dan menambahkan biner baru

Diterjemahkan dari English → Bahasa Indonesia

Versi llama.cpp b9704 sekarang mengembalikan HTTP 400 untuk tata bahasa yang tidak valid alih-alih secara diam-diam membuang batasan. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan akselerator perangkat keras, dengan dukungan untuk Vulkan, ROCm, OpenVINO, SYCL, dan CUDA.

Kepentingan 1/3 Kepercayaan 2/3 llama.cpp Inference efficiency Open weights

Baca aslinya