llama.cpp가 macOS, Linux, Android, Windows 및 openEuler용 업데이트된 바이너리를 포함하는 버전 b9757을 출시했습니다. 이번 릴리스는 top-n-sigma 샘플러에서 무조건적인 softmax+sort를 제거하여 샘플링 효율성을 개선했습니다. 새로운 빌드는 Apple Silicon과 ARM64를 포함한 여러 아키텍처에서 Vulkan, OpenVINO, SYCL, ROCm 및 CUDA를 지원합니다.
llama.cpp b9757 릴리스: 새로운 바이너리와 기능
번역 English → 한국어