llama.cpp release b9670 에는 llama-graph 의 NVFP4 엣지 케이스에 대한 수정 사항이 포함되어 있습니다. 여기에는 GEMM 후 MUL 작업 이동과 build_ffn 을 지원되는 조합으로 제한하는 것이 포함됩니다. 이 릴리스는 macOS, Linux, Android, Windows 및 openEuler 에 대한 바이너리를 제공하며, CUDA, Vulkan, SYCL 및 OpenVINO 를 포함한 여러 아키텍처와 백엔드 옵션을 지원합니다.
llama.cpp 릴리스 b9670: 수정 및 신규 빌드
번역 English → 한국어