github llama.cpp · 8 hari lalu · inference

llama.cpp rilis b9767 menambahkan dukungan GPU dan multi-platform

Diterjemahkan dari English → Bahasa Indonesia

Rilis llama.cpp b9767 meningkatkan inferensi MTP menggunakan jalur mat-vec untuk batch kecil dan menyertakan pembaruan dukungan GPU. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan API termasuk Vulkan, CUDA, OpenVINO, dan SYCL.

Kepentingan 1/3 Kepercayaan 2/3 llama.cpp Inference efficiency

Baca aslinya