تقوم ParallelKernelBench بتقييم نماذج LLM في كتابة نوى CUDA سريعة لـ GPU متعددة لأعباء عمل حقيقية. ينتج النموذج الأعلى نوى بأداء يقل عن ثلث سرعة التنفيذ الأمثل، رغم أن بعض المخرجات تتفوق على أي كود عام موجود.
نماذج LLM المتقدمة تواجه صعوبة في كتابة نوى GPU متعددة سريعة
مُترجم من English → العربية