Cabang rilis dibuat untuk v1.38.0
Sebuah cabang rilis telah dibuat untuk versi 1.38.0. Ini menandai awal proses rilis untuk pembaruan tersebut.
Sebuah cabang rilis telah dibuat untuk versi 1.38.0. Ini menandai awal proses rilis untuk pembaruan tersebut.
Versi b96669 llama.cpp menambahkan dukungan sampling backend untuk Eagle3. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, ROCm, OpenVINO, dan SYCL.
Rilis llama.cpp b9670 mencakup perbaikan untuk kasus tepi NVFP4 di llama-graph, seperti memindahkan operasi MUL pasca-GEMM dan membatasi build_ffn ke kombinasi yang didukung. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi backend, termasuk CUDA, Vulkan, SYCL, dan OpenVINO.
Rilis llama.cpp b9667 memperkenalkan dukungan Vulkan dengan S_v=16 melalui gated_delta_net. Ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur, dengan opsi untuk Vulkan, CUDA 12.4 dan 13.3, ROCm, OpenVINO, dan SYCL.
Versi b9668 llama.cpp mengimplementasikan buffer memori host-visible UMA untuk kinerja lebih baik pada perangkat UMA, berdasarkan saran dari 0cc4m. Rilis ini mencakup binari untuk macOS, Linux, Android, Windows, dan openEuler, mendukung CPU, Vulkan, ROCm, OpenVINO, SYCL, dan HIP, dengan paket UI khusus.
Versi llama.cpp b9665 memperkenalkan flag --offline baru untuk benchmarking. Rilis ini mencakup build biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, ROCm, OpenVINO, dan SYCL.
Rilis LLaMA.cpp b9663 menambahkan dukungan untuk OP EXPM1 dan semua kasus uji unit untuk FLOOR, TRUNC, dan ROUND. Ini mencakup binari yang diperbarui untuk macOS, Linux, Android, Windows, dan openEuler, dengan dukungan untuk SYCL (FP32 dan FP16), Vulkan, CUDA 12.4 dan 13.3, serta ROCm 7.2, bersama dengan UI yang diperbarui.
Pembaruan sycl memperluas dukungan untuk penanganan tensor ahli yang diurutkan ulang dalam MoE MUL_MAT_ID ke Q4_K, Q5_K, dan Q6_K. Kasus reorder 3D yang tidak didukung sekarang akan fallback alih-alih abort.
Rilis llama.cpp b9661 menambahkan dukungan GGML_OP_COL2IM_1D untuk Vulkan, menggunakan loop kumpulkan terbatas alih-alih scan-K penuh dengan modulo. Ini mengembalikan nullptr untuk tipe yang tidak didukung dan menyertakan build untuk macOS, Linux, Android, Windows, dan openEuler di CPU, Vulkan, CUDA, dan SYCL.