전체 기사
github llama.cpp · 12일 전

llama.cpp, 버그 수정 및 크로스 플랫폼 바이너리가 포함된 b9724 출시

llama.cpp 버전 b9724에는 빌드 수정, area() 함수의 오버플로우 방지, get_u32() 내의 정합성 검사 등 여러 가지 버그 수정과 개선 사항이 포함되어 있습니다. 이 릴리스는 macOS (arm64 및 x64), Linux (x64, arm64, s390x, Vulkan, ROCm, OpenVINO, SYCL), Android (arm64), Windows (x64, arm64, CUDA 12/13, Vulkan, OpenVINO, SYCL, HIP) 및 openEuler (ACL Graph 지원이 있는 x86 및 aarch64) 에 대한 사전 빌드된 바이너리와 UI 패키지를 제공합니다.

github llama.cpp · 12일 전

llama.cpp b9723 릴리스, Qwen3.5 및 Qwen3.6 Eagle3 지원 추가

llama.cpp 버전 b9723 은 Eagle3 를 통해 Qwen3.5 및 Qwen3.6 모델에 대한 지원을 도입했습니다. 이번 릴리스에는 하이브리드 모델을 위한 지연 경계 체크포인트 복원, API 및 명명 규칙 업데이트가 포함됩니다. macOS, Linux, Android, Windows, openEuler 플랫폼을 위한 바이너리 빌드가 사용 가능하며 CPU, Vulkan, OpenVINO, SYCL, ROCm 옵션이 있습니다.

github llama.cpp · 12일 전

llama.cpp 릴리스 b9714가 X-Accel-Buffering 헤더 및 새 바이너리 추가

llama.cpp 버전 b9714는 스트리밍 엔드포인트에 "X-Accel-Buffering": "no" 헤더를 추가하여 Nginx가 응답을 버퍼링하는 것을 방지하고, Pi 코딩 하니스와 같은 애플리케이션의 스트리밍 문제를 해결했습니다. 이 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며, 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.

github llama.cpp · 13일 전

llama.cpp release b9701: 새로운 전처리기와 크로스 플랫폼 바이너리

llama.cpp 버전 b9701은 새로운 mtmd_image_preproc_out 기능과 업데이트된 개발자 문서를 갖춘 리팩토링된 전처리를 도입했습니다. 이번 릴리스에는 macOS, Linux, Android, Windows 및 openEuler용 바이너리가 포함되어 있으며 Vulkan, CUDA, OpenVINO 및 SYCL을 포함한 여러 아키텍처와 하드웨어 가속 옵션을 지원합니다.