BlockPilotは、事前填充表現に基づいて最適な推論ブロックサイズを動的に予測する、拡散ベースの推測的デコーディング用のサンプル適応ポリシーを導入します。このアプローチは、トレーニングブロックサイズの周囲の最適値の局所構造を活用することで、固定ブロックサイズの非最適性を克服します。

  • インスタンス適応型意思決定メカニズムを備えた軽量なポリシー学習問題としてブロックサイズ選択を定式化します。
  • 事前填充ステージ後に一度だけ予測を実行し、シームレスな統合と最小限のオーバーヘッドを実現します。
  • 温度T=1の下でQwen3-4Bにおいて受容長5.92および4.20倍の高速化を達成します。

この方法はプラグアンドプレイとして説明され、大きな計算リソースやアーキテクチャの変更を必要とせずに、一貫して効率性を向上させます。