BlockPilot memperkenalkan kebijakan adaptif sampel untuk dekode spekulatif berbasis difusi yang secara dinamis memprediksi ukuran blok inferensi optimal berdasarkan representasi pra-pengisian. Pendekatan ini mengatasi suboptimalitas ukuran blok tetap dengan memanfaatkan struktur lokal nilai optimal di sekitar ukuran blok pelatihan.
- Memformulasikan pemilihan ukuran blok sebagai masalah pembelajaran kebijakan ringan dengan mekanisme keputusan adaptif instans.
- Melakukan prediksi hanya sekali setelah tahap pra-pengisian, memungkinkan integrasi yang mulus dan overhead minimal.
- Mencapai panjang penerimaan 5.92 dan percepatan 4,20× pada Qwen3-4B di bawah suhu T=1.
Metode ini dijelaskan sebagai plug-and-play, secara konsisten meningkatkan efisiensi tanpa memerlukan sumber daya komputasi signifikan atau perubahan arsitektur.