BlockPilot: Pembelajaran Kebijakan Adaptif Instans untuk Dekode Spekulatif Berbasis Difusi

BlockPilot memperkenalkan kebijakan adaptif sampel untuk dekode spekulatif berbasis difusi yang secara dinamis memprediksi ukuran blok inferensi optimal berdasarkan representasi pra-pengisian. Pendekatan ini mengatasi suboptimalitas ukuran blok tetap dengan memanfaatkan struktur lokal nilai optimal di sekitar ukuran blok pelatihan.

Memformulasikan pemilihan ukuran blok sebagai masalah pembelajaran kebijakan ringan dengan mekanisme keputusan adaptif instans.
Melakukan prediksi hanya sekali setelah tahap pra-pengisian, memungkinkan integrasi yang mulus dan overhead minimal.
Mencapai panjang penerimaan 5.92 dan percepatan 4,20× pada Qwen3-4B di bawah suhu T=1.

Metode ini dijelaskan sebagai plug-and-play, secara konsisten meningkatkan efisiensi tanpa memerlukan sumber daya komputasi signifikan atau perubahan arsitektur.