Бенчмарк · coding

HumanEval+

saturated 2 результатов 1 моделей
0 3.5 7 10.5 14 2026-06-16 DeepSeek-Coder-1.3B · 12 · 2026-06-16 DeepSeek-Coder-1.3B · 12 · 2026-06-16
DeepSeek-Coder-1.3B
Хронология
  1. 2026-06-16 DeepSeek-Coder-1.3B 12.0tasks После-операторы не улучшают точность в малых моделях кода
  2. 2026-06-16 DeepSeek-Coder-1.3B 12.0tasks После-последовательные операторы ложной фальсификации не улучшают точность в малых моделях кода