Бенчмарк · math

MATH-500

saturated 3 результатов 2 моделей
0 5 10 15 20 2026-06-18 2026-06-20 2026-06-23 rubric-conditioned self-distillation · 0.9 · 2026-06-18 rubric-conditioned self-distillation · 0.9 · 2026-06-18 selfcompact · 18.1 · 2026-06-23
rubric-conditioned self-distillation selfcompact
Хронология
  1. 2026-06-23 selfcompact 18.1pts SelfCompact: Самодвижущийся сжатие контекста для языковых моделей
  2. 2026-06-18 rubric-conditioned self-distillation 0.9pts Кадрово-условная самодистилляция
  3. 2026-06-18 rubric-conditioned self-distillation 0.9pts Кадрово-условная самодистилляция