上海交通大学邓实验室提出具有多块教师强制的多块扩散语言模型

上海交通大学邓实验室的研究人员引入了多块扩散语言模型（MBD-LMs），通过并发解码一组连续的多块来实现块间并行，从而扩展单块扩散模型。该方法在训练后阶段使用多块教师强制（MultiTF）来弥合训练状态与推理之间的差距，并结合基于块缓冲区机制的优化解码算法。

这项工作通过将训练分布与推理状态对齐，显著提升了解码吞吐量，使得多块扩散的实际执行成为可能。