github llama.cpp · 16 hari lalu · inference

llama.cpp Rilis b9699 Menambahkan Dukungan SYCL dan Biner Multi-Platform

Diterjemahkan dari English → Bahasa Indonesia

llama.cpp versi b9699 memperkenalkan dukungan untuk operasi MUL_MAT dan OUT_PROD dengan presisi Q1_0 melalui PR #24721. Rilis ini mencakup biner pra-kompilasi untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan kerangka akselerasi, termasuk SYCL (FP32 dan FP16), Vulkan, CUDA, ROCm, dan OpenVINO.

Kepentingan 0/3 Kepercayaan 1/3 llama.cpp

Baca aslinya