Исследователи предлагают Smooth Maximum Mean Discrepancy (SMMD) для устранения ненадежности больших языковых моделей в задачах, требующих высокой числовой точности, вызванной стандартными целями обучения на основе перекрестной энтропии. SMMD включает ядра расстояния значений над числовыми токенами и графовую гладкость для выравнивания предсказанных распределений с целевыми, одновременно способствуя локальной согласованности.

  • SMMD опирается на классический MMD, используя ядро, определенное над подсловарем чисел, который учитывает метрическую структуру.
  • Метод выравнивает предсказанное числовое распределение с целевым посредством сопоставления ядер и сглаживает остаток между предсказанием и целью по индуцированному ядру графа.
  • Оценка охватывает четыре задачи с числовыми целями: математическое рассуждение, арифметические вычисления, распознавание времени на часах и ответ на вопросы по диаграммам.
  • SMMD последовательно повышает точность по сравнению с перекрестной энтропией и недавними потерями для задач с числовыми целями на нескольких открытых LLM и VLM бэкбонах.

Подход устраняет несоответствие между стандартными целями обучения и необходимостью метрической структуры в числовых выводах, предлагая метод улучшения числовой точности языковых моделей.