arxiv arXiv cs.CL · hace 1 h · fuente: hace 10 d · research

VoidPadding: Desacoplar la terminación [EOS] y el relleno en MDLMs

Traducido del English → Español

VoidPadding introduce [VOID] como un token de relleno para separar la terminación semántica y el modelado de la longitud de la respuesta. Mejora el rendimiento en razonamiento matemático y generación de código en 17.84 puntos sobre el modelo original y reduce el NFE de decodificación en un 55.7% en promedio.

Importancia 2/3 arXiv cs.CL Code generation Evaluation & benchmarks Reasoning models

Leer original