إصدار llama.cpp b9827 يضيف تحسين نسخ CUDA المتزامن ثنائي الأبعاد
يُطلق إصدار llama.cpp b9827 تحسينًا للأداء في CUDA من خلال إضافة مسار سريع لـ cudaMemcpy2DAsync إلى دالة ggml_cuda_cpy. يُسرّع هذا التغيير عمليات النسخ المتدرجة (strided) التي تكون فيها الأنواع والأشكال متطابقة، حيث لا تكون الموترات متصلة بالكامل ولكن كل صف متصل، مما يحل محل نوى نسخ العناصر القياسية الأبطأ.