VoidPadding introduce [VOID] como un token de relleno para separar la terminación semántica y el modelado de la longitud de la respuesta. Mejora el rendimiento en razonamiento matemático y generación de código en 17.84 puntos sobre el modelo original y reduce el NFE de decodificación en un 55.7% en promedio.
VoidPadding: Desacoplar la terminación [EOS] y el relleno en MDLMs
Traducido del English → Español