Малая языковая модель с 300 миллионами параметров, прошедшая тонкую настройку на данные общего сегмента, достигает 0,83 микроФ1 в извлечении связей на общем сегменте, превосходя нулевую версию GPT-5.4 и Claude Sonnet 4.6. На литературных тестах модель достигает 0,92 на наборе биографических данных, превосходя GPT-5.4 и превосходя средние результаты передовых моделей. Эти результаты демонстрируют, что задача-адаптированные малые модели могут обеспечивать точные, приватные и эффективные по аппаратному обеспечению результаты без использования масштабных генеративных моделей.
arxiv
arXiv cs.CL
·
2 д назад
·
ист: 3 д назад
·
research
Малые языковые модели превосходят передовые LLM в извлечении связей
Переведено с English → Русский
Важность 2/3
Обходит бенчмарк топ-лаборатории
arXiv cs.CL
Alibaba (Qwen)
Evaluation & benchmarks
Reasoning models