llama.cpp — korshunov.ai — новости ML

Источник · llama.cpp

llama.cpp releases version b9680 with updated Vulkan support and new binaries for macOS, Linux, Android, Windows, and openEuler. The release includes CPU and GPU variants for multiple architectures, with support for Vulkan, CUDA, OpenVINO, SYCL, and ROCm.

github llama.cpp · 9 д назад

llama.cpp выпускает b96669 с поддержкой выбора в бэкенде для Eagle3

Версия llama.cpp b9669 добавляет поддержку выбора в бэкенде для Eagle3. Релиз включает бинарники для macOS, Linux, Android, Windows и openEuler на различных архитектурах и вариантах ускорения, включая Vulkan, CUDA, ROCm, OpenVINO и SYCL.

github llama.cpp · 9 д назад

llama.cpp Release b9670: Исправления и новые сборки

Релиз llama.cpp b9670 включает исправления для крайних случаев NVFP4 в llama-graph, таких как перемещение операций MUL после GEMM и ограничение build_ffn до поддерживаемых комбинаций. В релизе представлены бинарные файлы для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах бэкенда, включая CUDA, Vulkan, SYCL и OpenVINO.

github llama.cpp · 9 д назад

llama.cpp Release b9667 Добавляет поддержку Vulkan и CUDA

llama.cpp release b9667 вводит поддержку Vulkan с S_v=16 через gated_delta_net. В него включены бинарники для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах, с вариантами Vulkan, CUDA 12.4 и 13.3, ROCm, OpenVINO и SYCL.

github llama.cpp · 9 д назад

llama.cpp release b9665 добавляет флаг --offline и новые бинарные сборки

Версия llama.cpp b9665 вводит новый флаг --offline для бенчмаркинга. В релизе представлены бинарные сборки для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах ускорения, включая Vulkan, CUDA, ROCm, OpenVINO и SYCL.

github llama.cpp · 9 д назад

Релиз LLaMA.cpp b9663 добавляет поддержку SYCL и новые бинарные сборки

Релиз LLaMA.cpp b9663 добавляет поддержку OP EXPM1 и все тестовые случаи для FLOOR, TRUNC и ROUND. В него включены обновлённые бинарные файлы для macOS, Linux, Android, Windows и openEuler, с поддержкой SYCL (FP32 и FP16), Vulkan, CUDA 12.4 и 13.3, ROCm 7.2, а также обновлённый интерфейс.

github llama.cpp · 9 д назад

sycl: поддержка переставленных Q4_K/Q5_K/Q6_K MoE MUL_MAT_ID

Обновление sycl расширяет поддержку переставленного обработки экспертиз в MoE MUL_MAT_ID для Q4_K, Q5_K и Q6_K. Не поддерживаемые случаи перестановки 3D теперь переключаются, вместо того чтобы прерывать работу.

github llama.cpp · 9 д назад

Vulkan добавляет операцию col2im_1d и поддерживает несколько платформ

Релиз llama.cpp b9661 добавляет поддержку операции GGML_OP_COL2IM_1D для Vulkan, используя ограниченный цикл сборки вместо полного сканирования с модулем. Возвращает nullptr для неподдерживаемых типов и включает сборки для macOS, Linux, Android, Windows и openEuler на CPU, Vulkan, CUDA и SYCL.

github llama.cpp · 8 д назад

llama.cpp выпускает b9673 с аллокациями USM системы и бинарниками для разных платформ

Версия llama.cpp b9673 вводит опциональные аллокации USM системы для буферов GPU ≥1GB, позволяя перераспределять VRAM при наличии поддержки устройства. Функция требует переменной среды GGML_SYCL_USM_SYSTEM и по умолчанию отключена, в случае отсутствия поддержки переключается на обычные аллокации.

github llama.cpp · 9 д назад

llama.cpp выпускает b9660 с исправлениями и новыми бинарными файлами

llama.cpp выпускает версию b9660, исправляющую двойное экранирование при парсинге инструмента LFM2. Обновление включает бинарные файлы для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах ускорения аппаратного обеспечения, а также отдельный пакет для интерфейса.

github llama.cpp · 9 д назад

llama.cpp выпустил версию b9672 с обновлением BoringSSL

llama.cpp выпустил версию b9672, обновив BoringSSL до 0.20260616.0. В релизе представлены бинарники для macOS, Linux, Android, Windows и openEuler на нескольких архитектурах и вариантах ускорения, включая Vulkan, CUDA, ROCm, OpenVINO и SYCL.

github llama.cpp · 9 д назад

llama.cpp release b9668 добавляет UMA host-visible memory и бинарники для нескольких платформ

Версия llama.cpp b9668 реализует буферы UMA host-visible memory для улучшения производительности на устройствах с UMA, на основе предложения 0cc4m. В этом выпуске представлены бинарники для macOS, Linux, Android, Windows и openEuler, поддерживающие CPU, Vulkan, ROCm, OpenVINO, SYCL и HIP, а также отдельный пакет интерфейса.

llama.cpp release b9680: new binaries and Vulkan support

llama.cpp выпускает b96669 с поддержкой выбора в бэкенде для Eagle3

llama.cpp Release b9670: Исправления и новые сборки

llama.cpp Release b9667 Добавляет поддержку Vulkan и CUDA

llama.cpp release b9665 добавляет флаг --offline и новые бинарные сборки

Релиз LLaMA.cpp b9663 добавляет поддержку SYCL и новые бинарные сборки

sycl: поддержка переставленных Q4_K/Q5_K/Q6_K MoE MUL_MAT_ID

Vulkan добавляет операцию col2im_1d и поддерживает несколько платформ

llama.cpp выпускает b9673 с аллокациями USM системы и бинарниками для разных платформ

llama.cpp выпускает b9660 с исправлениями и новыми бинарными файлами

llama.cpp выпустил версию b9672 с обновлением BoringSSL

llama.cpp release b9668 добавляет UMA host-visible memory и бинарники для нескольких платформ