llama.cpp 버전 b9673은 GPU 버퍼 ≥1GB에 대한 선택적 USM 시스템 할당을 도입하여 장치 지원이 사용 가능한 경우 VRAM 오버커밋을 활성화합니다. 이 기능에는 GGML_SYCL_USM_SYSTEM 환경 변수가 필요하며 기본적으로 비활성화되어 있고 지원되지 않으면 일반 할당으로 폴백됩니다.