Исследователи предлагают Smooth Maximum Mean Discrepancy (SMMD) для устранения ненадежности больших языковых моделей в задачах, требующих высокой числовой точности, вызванной стандартными целями обучения на основе перекрестной энтропии. SMMD включает ядра расстояния значений над числовыми токенами и графовую гладкость для выравнивания предсказанных распределений с целевыми, одновременно способствуя локальной согласованности.
- SMMD опирается на классический MMD, используя ядро, определенное над подсловарем чисел, который учитывает метрическую структуру.
- Метод выравнивает предсказанное числовое распределение с целевым посредством сопоставления ядер и сглаживает остаток между предсказанием и целью по индуцированному ядру графа.
- Оценка охватывает четыре задачи с числовыми целями: математическое рассуждение, арифметические вычисления, распознавание времени на часах и ответ на вопросы по диаграммам.
- SMMD последовательно повышает точность по сравнению с перекрестной энтропией и недавними потерями для задач с числовыми целями на нескольких открытых LLM и VLM бэкбонах.
Подход устраняет несоответствие между стандартными целями обучения и необходимостью метрической структуры в числовых выводах, предлагая метод улучшения числовой точности языковых моделей.