Компания InternScience выпустила модель Agents-A1 на платформе Hugging Face, которая использует архитектуру Mixture of Experts (MoE) с 35 миллиардами параметров. В релиз входит технический отчет, доступный на arXiv, и он выделяется исключительными результатами на бенчмарках.

  • Название модели: InternScience/Agents-A1
  • Архитектура: 35B MoE (Mixture of Experts)
  • Доступность: репозиторий Hugging Face и технический отчет на arXiv
  • Производительность: описывается как имеющая «невероятные бенчмарки»

Модель представлена как значительный прогресс в области эффективных больших языковых моделей, обеспечивающий высокую производительность благодаря своей разреженной структуре MoE.