전체 기사
github llama.cpp · 9일 전

llama.cpp b9757 릴리스: 새로운 바이너리와 기능

llama.cpp가 macOS, Linux, Android, Windows 및 openEuler용 업데이트된 바이너리를 포함하는 버전 b9757을 출시했습니다. 이번 릴리스는 top-n-sigma 샘플러에서 무조건적인 softmax+sort를 제거하여 샘플링 효율성을 개선했습니다. 새로운 빌드는 Apple Silicon과 ARM64를 포함한 여러 아키텍처에서 Vulkan, OpenVINO, SYCL, ROCm 및 CUDA를 지원합니다.

github llama.cpp · 9일 전

파일 끝에서 추가 시 edit_file 충돌 해결

파일 끝에 추가할 때 파일 편집 중 발생하는 충돌이 -1을 n+1 대신 n(끝에 삽입)으로 정규화하여 수정되었습니다. 이 패치는 -1을 추가 모드에만 제한하고 마지막 줄의 묵시적 덮어쓰기를 방지하기 위해 교체/삭제 작업에서는 이를 거부하며, 힙 버퍼 오버플로우를 피하기 위해 삽입 오프셋이 정수로 계산되도록 보장합니다.

github llama.cpp · 10일 전

llama.cpp b9752 릴리스: 서버 리팩토링 및 크로스 플랫폼 바이너리

llama.cpp가 버전 b9752를 출시했으며, 이는 배치 구성에 중점을 둔 서버 리팩토링을 포함하며, 배치 풀(full) 케이스 처리 개선 및 버그 수정이 이루어졌습니다. 이 릴리스에는 macOS, Linux, Android, Windows, openEuler용 사전 빌드된 바이너리가 포함되어 있으며, CUDA, Vulkan, OpenVINO, SYCL과 같은 다양한 아키텍처와 가속 프레임워크를 지원합니다.