전체 기사
github llama.cpp · 15일 전

llama.cpp 릴리스 b9670: 수정 및 신규 빌드

llama.cpp release b9670 에는 llama-graph 의 NVFP4 엣지 케이스에 대한 수정 사항이 포함되어 있습니다. 여기에는 GEMM 후 MUL 작업 이동과 build_ffn 을 지원되는 조합으로 제한하는 것이 포함됩니다. 이 릴리스는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리를 제공하며, CUDA, Vulkan, SYCL 및 OpenVINO 를 포함한 여러 아키텍처와 백엔드 옵션을 지원합니다.

github llama.cpp · 16일 전

llama.cpp release b9668 에 UMA 호스트 가시 메모리 및 크로스 플랫폼 바이너리 추가

llama.cpp 버전 b9668 은 0cc4m 의 제안에 따라 UMA 장치에서 더 나은 성능을 위해 UMA 호스트 가시 메모리 버퍼를 구현했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리가 포함되어 있으며 CPU, Vulkan, ROCm, OpenVINO, SYCL 및 HIP 를 지원하고 전용 UI 패키지가 제공됩니다.