Spec-AUF 通过限制损失支持来改善掩码块草稿器的接受长度

Spec-AUF 引入了一种针对推测解码中掩码块草稿器的训练方法，通过将交叉熵损失限制在已接受的 prefix 上，使训练目标与推理行为对齐。该方法通过在草稿器首次预测失败之前保留损失支持来近似前缀敏感的监督，无需辅助目标或改变推理流水线。

此更改通过确保模型仅在生成过程中实际提交的 token 上进行监督，从而提高了草稿接受率。