github llama.cpp · 10 hari lalu · inference

llama.cpp rilis b9745 menambahkan dukungan MTP3 dan biner lintas platform

Diterjemahkan dari English → Bahasa Indonesia

llama.cpp versi b9745 memperkenalkan dukungan untuk Step3.5/3.7 flash MTP3, termasuk API baru untuk offset layer dan flag nextn. Rilis ini menyediakan biner pra-dibangun untuk macOS, Linux, Android, Windows, dan openEuler, dengan opsi akselerasi CPU, Vulkan, CUDA, OpenVINO, dan SYCL.

Kepentingan 0/3 Kepercayaan 2/3 llama.cpp

Baca aslinya