전체 기사
github llama.cpp · 11일 전

GLM-5.2 DSA 인덱서 수정: 텐서가 필요하지 않음으로 표시됨

GLM-5.2 모델의 DSA 인덱서가 모든 레이어에 잘못 로드되어 누락된 텐서로 인해 실패했습니다. 이번 업데이트는 인덱서 텐서를 TENSOR_NOT_REQUIRED로 표시하여, 인덱서가 없는 레이어가 nullptr로 로드되도록 하고 전체 MLA 어텐션을 가능하게 합니다. 균일한 인덱싱을 사용하는 DeepSeek-V3.2는 영향을 받지 않습니다.

github llama.cpp · 12일 전

llama.cpp b9731 릴리스: 성능 최적화 및 크로스 플랫폼 바이너리

llama.cpp 버전 b9731은 토큰 정렬 오버헤드를 줄이기 위해 std::partial_sort를 사용한 최적화를 도입하여 top-n 토큰 선택의 성능을 8.555ms에서 0.704ms로 개선했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 미리 빌드된 바이너리가 포함되어 있으며, 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.

github llama.cpp · 12일 전

llama.cpp, 버그 수정 및 크로스 플랫폼 바이너리가 포함된 b9724 출시

llama.cpp 버전 b9724에는 빌드 수정, area() 함수의 오버플로우 방지, get_u32() 내의 정합성 검사 등 여러 가지 버그 수정과 개선 사항이 포함되어 있습니다. 이 릴리스는 macOS (arm64 및 x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) 및 openEuler (ACL Graph 지원이 있는 x86 및 aarch64) 에 대한 사전 빌드된 바이너리와 UI 패키지를 제공합니다.