llama.cpp バージョン b9673 では、≥1GB の GPU バッファーに対するオプションの USM システム割り当てが導入され、デバイスサポートが利用可能な場合に VRAM オーバーコミットを有効にします。この機能には GGML_SYCL_USM_SYSTEM 環境変数が必要で、デフォルトでは無効になっており、サポートされていない場合は通常の割り当てにフォールバックします。