BlockPilot: 拡散ベースの推測的デコーディングのためのインスタンス適応ポリシー学習

BlockPilotは、事前填充表現に基づいて最適な推論ブロックサイズを動的に予測する、拡散ベースの推測的デコーディング用のサンプル適応ポリシーを導入します。このアプローチは、トレーニングブロックサイズの周囲の最適値の局所構造を活用することで、固定ブロックサイズの非最適性を克服します。

この方法はプラグアンドプレイとして説明され、大きな計算リソースやアーキテクチャの変更を必要とせずに、一貫して効率性を向上させます。