BlockPilot：用于基于扩散的推测解码的实例自适应策略学习

BlockPilot 引入了一种样本自适应策略，用于基于扩散的推测解码，该策略根据预填充表示动态预测最佳推理块大小。这种方法通过利用训练块大小周围最优值的局部结构，解决了固定块大小的次优性问题。

该方法被描述为即插即用，无需大量计算资源或架构更改即可持续提高效率。