llama.cpp b9848 릴리스는 CUDA get_rows_back 오류를 수정하고 바이너리를 제공합니다

llama.cpp 프로젝트는 65535개 이상의 행을 가진 테이블에서 `get_rows_back` 함수의 문제를 해결하기 위해 CUDA 백엔드에 대한 중요한 수정 사항을 포함하는 버전 b9848을 출시했습니다. 이 업데이트는 이전에 대규모 테이블 작업에 영향을 미쳤던 grid-y 클램핑 및 스트라이드 오류를 해결합니다.

그리드-y 클램프 및 스트라이드 로직을 수정하여 65535개 이상의 행이 있는 테이블에 대한 CUDA `get_rows_back`을 수정했습니다 (PR #25103).
이번 릴리스에서는 macOS Apple Silicon KleidiAI 지원이 비활성화되었습니다.
openEuler 표준 빌드는 비활성화되었지만, x86(310p, 910b ACL Graph) 및 aarch64(310p, 910b ACL Graph)에 대한 특정 빌드는 계속 제공됩니다.
바이너리는 macOS(Apple Silicon arm64 및 Intel x64), Linux(Ubuntu CPU, Vulkan, ROCm 7.2, OpenVINO, SYCL FP32/FP16), Android(arm64 CPU), Windows(CPU, OpenCL Adreno, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) 및 독립형 UI에 대해 제공됩니다.

이번 릴리스는 대규모 데이터 구조를 처리하는 CUDA 사용자에게 안정성을 보장하며 주요 운영 체제와 하드웨어 가속기 전반에 걸쳐 포괄적인 사전 빌드 바이너리를 제공합니다.