Улучшение численного прогнозирования в LLM с помощью гладкого выравнивания MMD
Исследователи предлагают Smooth Maximum Mean Discrepancy (SMMD) для устранения ненадежности больших языковых моделей в задачах, требующих высокой числовой точности, вызванной стандартными целями обучения на основе перекрестной энтропии. SMMD включает ядра расстояния значений над числовыми токенами и графовую гладкость для выравнивания предсказанных распределений с целевыми, одновременно способствуя локальной согласованности.