github llama.cpp · 14일 전 · inference

llama.cpp가 USM 시스템 할당 및 크로스 플랫폼 바이너리와 함께 b9673 출시

번역 English → 한국어

llama.cpp 버전 b9673은 GPU 버퍼 ≥1GB에 대한 선택적 USM 시스템 할당을 도입하여 장치 지원이 사용 가능한 경우 VRAM 오버커밋을 활성화합니다. 이 기능에는 GGML_SYCL_USM_SYSTEM 환경 변수가 필요하며 기본적으로 비활성화되어 있고 지원되지 않으면 일반 할당으로 폴백됩니다.

중요도 0/3 신뢰도 2/3 llama.cpp

원문 보기