llama.cpp, BoringSSL 업데이트가 포함된 버전 b9672 출시
llama.cpp가 버전 b9672를 출시하여 BoringSSL을 0.20260616.0으로 업데이트했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며 Vulkan, CUDA, ROCm, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.
llama.cpp가 버전 b9672를 출시하여 BoringSSL을 0.20260616.0으로 업데이트했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며 Vulkan, CUDA, ROCm, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.
버전 1.38.0에 대한 릴리스 브랜치가 생성되었습니다. 이는 업데이트의 릴리스 프로세스 시작을 알립니다.
llama.cpp 버전 b9669은 Eagle3에 대한 백엔드 샘플링 지원을 추가했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며, Vulkan, CUDA, ROCm, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.
llama.cpp release b9670 에는 llama-graph 의 NVFP4 엣지 케이스에 대한 수정 사항이 포함되어 있습니다. 여기에는 GEMM 후 MUL 작업 이동과 build_ffn 을 지원되는 조합으로 제한하는 것이 포함됩니다. 이 릴리스는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리를 제공하며, CUDA, Vulkan, SYCL 및 OpenVINO 를 포함한 여러 아키텍처와 백엔드 옵션을 지원합니다.
llama.cpp release b9667 introduces Vulkan support with S_v=16 via gated_delta_net. It includes binaries for macOS, Linux, Android, Windows, and openEuler across multiple architectures, with options for Vulkan, CUDA 12.4 and 13.3, ROCm, OpenVINO, and SYCL.
llama.cpp 버전 b9668 은 0cc4m 의 제안에 따라 UMA 장치에서 더 나은 성능을 위해 UMA 호스트 가시 메모리 버퍼를 구현했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리가 포함되어 있으며 CPU, Vulkan, ROCm, OpenVINO, SYCL 및 HIP 를 지원하고 전용 UI 패키지가 제공됩니다.
llama.cpp 버전 b9665은 벤치마킹을 위한 새로운 --offline 플래그를 도입했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows, openEuler 에 대한 바이너리 빌드가 포함되어 있으며, Vulkan, CUDA, ROCm, OpenVINO, SYCL 을 포함한 여러 아키텍처 및 하드웨어 가속 옵션을 지원합니다.
LLaMA.cpp b9663 릴리스는 OP EXPM1 지원과 FLOOR, TRUNC, ROUND에 대한 모든 단위 테스트 케이스를 추가했습니다. macOS, Linux, Android, Windows, openEuler용 업데이트된 바이너리를 포함하며, SYCL(FP32 및 FP16), Vulkan, CUDA 12.4 및 13.3, ROCm 7.2 지원을 제공하고 UI도 업데이트되었습니다.
sycl 업데이트는 Q4_K, Q5_K 및 Q6_K에 대한 MoE MUL_MAT_ID의 재정렬된 전문가 텐서 처리 지원을 확장합니다. 지원되지 않는 3D 재정렬 사례는 이제 중단하는 대신 폴백으로 전환됩니다.
llama.cpp의 b9661 릴리스는 Vulkan에 GGML_OP_COL2IM_1D 지원을 추가했으며, 모듈로와 함께 전체 K 스캔 대신 제한된 gather 루프를 사용합니다. 지원되지 않는 유형에는 nullptr을 반환하며, CPU, Vulkan, CUDA 및 SYCL에서 macOS, Linux, Android, Windows 및 openEuler용 빌드를 포함합니다.