media Together AI Blog · 8 hari lalu · inference

LLM Frontier Kesulitan Menulis Kernel Multi-GPU Cepat

Diterjemahkan dari English → Bahasa Indonesia

ParallelKernelBench mengevaluasi LLM dalam menulis kernel CUDA multi-GPU cepat untuk 87 beban kerja nyata. Model teratas menghasilkan kernel yang performanya di bawah sepertiga kecepatan implementasi optimal, meskipun beberapa output melampaui kode publik apa pun yang ada.

Kepentingan 2/3 Kerangka evaluasi baru dengan pembeda Kepercayaan 1/3 Together AI Blog Code generation Evaluation & benchmarks

Baca aslinya