Semua artikel — korshunov.ai

Semua artikel Halaman 1 / 14

Cabang rilis dibuat untuk v1.38.0

Sebuah cabang rilis telah dibuat untuk versi 1.38.0. Ini menandai awal proses rilis untuk pembaruan tersebut.

llama.cpp merilis b96669 dengan sampling backend untuk Eagle3

Versi b96669 llama.cpp menambahkan dukungan sampling backend untuk Eagle3. Rilis ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, ROCm, OpenVINO, dan SYCL.

github llama.cpp · 16 hari lalu

llama.cpp Release b9670: Perbaikan dan Build Baru

Rilis llama.cpp b9670 mencakup perbaikan untuk kasus tepi NVFP4 di llama-graph, seperti memindahkan operasi MUL pasca-GEMM dan membatasi build_ffn ke kombinasi yang didukung. Rilis ini menyediakan biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi backend, termasuk CUDA, Vulkan, SYCL, dan OpenVINO.

github llama.cpp · 16 hari lalu

Rilis llama.cpp b9667 Menambahkan Dukungan Vulkan dan CUDA

Rilis llama.cpp b9667 memperkenalkan dukungan Vulkan dengan S_v=16 melalui gated_delta_net. Ini mencakup biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur, dengan opsi untuk Vulkan, CUDA 12.4 dan 13.3, ROCm, OpenVINO, dan SYCL.

github llama.cpp · 16 hari lalu

llama.cpp release b9668 menambahkan memori host-visible UMA dan binari lintas-platform

Versi b9668 llama.cpp mengimplementasikan buffer memori host-visible UMA untuk kinerja lebih baik pada perangkat UMA, berdasarkan saran dari 0cc4m. Rilis ini mencakup binari untuk macOS, Linux, Android, Windows, dan openEuler, mendukung CPU, Vulkan, ROCm, OpenVINO, SYCL, dan HIP, dengan paket UI khusus.

github llama.cpp · 16 hari lalu

llama.cpp release b9665 menambahkan flag --offline dan build biner baru

Versi llama.cpp b9665 memperkenalkan flag --offline baru untuk benchmarking. Rilis ini mencakup build biner untuk macOS, Linux, Android, Windows, dan openEuler di berbagai arsitektur dan opsi akselerasi perangkat keras, termasuk Vulkan, CUDA, ROCm, OpenVINO, dan SYCL.

github llama.cpp · 16 hari lalu

Rilis LLaMA.cpp b9663 Menambahkan Dukungan SYCL dan Build Binari Baru

Rilis LLaMA.cpp b9663 menambahkan dukungan untuk OP EXPM1 dan semua kasus uji unit untuk FLOOR, TRUNC, dan ROUND. Ini mencakup binari yang diperbarui untuk macOS, Linux, Android, Windows, dan openEuler, dengan dukungan untuk SYCL (FP32 dan FP16), Vulkan, CUDA 12.4 dan 13.3, serta ROCm 7.2, bersama dengan UI yang diperbarui.

github llama.cpp · 16 hari lalu

sycl: dukungan untuk MoE MUL_MAT_ID Q4_K/Q5_K/Q6_K yang diurutkan ulang

Pembaruan sycl memperluas dukungan untuk penanganan tensor ahli yang diurutkan ulang dalam MoE MUL_MAT_ID ke Q4_K, Q5_K, dan Q6_K. Kasus reorder 3D yang tidak didukung sekarang akan fallback alih-alih abort.

github llama.cpp · 16 hari lalu

Vulkan menambahkan op col2im_1d dan mendukung berbagai platform

Rilis llama.cpp b9661 menambahkan dukungan GGML_OP_COL2IM_1D untuk Vulkan, menggunakan loop kumpulkan terbatas alih-alih scan-K penuh dengan modulo. Ini mengembalikan nullptr untuk tipe yang tidak didukung dan menyertakan build untuk macOS, Linux, Android, Windows, dan openEuler di CPU, Vulkan, CUDA, dan SYCL.