LLaMA.cpp는 32x32 타일 가중치 재패킹, 개선된 dyn.quant 처리, 통합 커널 매개변수 관리를 포함하여 Hexagon 기반 MM 연산에 대한 주요 최적화를 포함한 버전 b9784를 출시했습니다. 이번 릴리스에는 Vulkan, ROCm, OpenVINO 지원을 갖춘 macOS(arm64 및 x64), iOS, 여러 Linux 아키텍처용 새로운 바이너리가 포함되어 있습니다.
LLaMA.cpp b9784 릴리스: Hexagon MM 최적화 및 크로스 플랫폼 바이너리
번역 English → 한국어