Компания InternScience выпустила модель Agents-A1 на платформе Hugging Face, которая использует архитектуру Mixture of Experts (MoE) с 35 миллиардами параметров. В релиз входит технический отчет, доступный на arXiv, и он выделяется исключительными результатами на бенчмарках.
- Название модели: InternScience/Agents-A1
- Архитектура: 35B MoE (Mixture of Experts)
- Доступность: репозиторий Hugging Face и технический отчет на arXiv
- Производительность: описывается как имеющая «невероятные бенчмарки»
Модель представлена как значительный прогресс в области эффективных больших языковых моделей, обеспечивающий высокую производительность благодаря своей разреженной структуре MoE.