LongCat-2.0 se presenta como un modelo de lenguaje MoE (Mixture of Experts) a gran escala con 1,6 billones de parámetros en total y aproximadamente 48 mil millones activados por token.

  • El modelo utiliza una arquitectura Mixture of Experts.
  • Contiene un total de 1,6 billones de parámetros.
  • Aproximadamente 48 mil millones de parámetros se activan por token.
  • El modelo estuvo disponible previamente de forma discreta en OpenRouter bajo el nombre 'owl-alpha'.