تقوم ParallelKernelBench بتقييم نماذج LLM في كتابة نوى CUDA سريعة لـ GPU متعددة لأعباء عمل حقيقية. ينتج النموذج الأعلى نوى بأداء يقل عن ثلث سرعة التنفيذ الأمثل، رغم أن بعض المخرجات تتفوق على أي كود عام موجود.