LongCat-2.0 se presenta como un modelo de lenguaje MoE (Mixture of Experts) a gran escala con 1,6 billones de parámetros en total y aproximadamente 48 mil millones activados por token.
- El modelo utiliza una arquitectura Mixture of Experts.
- Contiene un total de 1,6 billones de parámetros.
- Aproximadamente 48 mil millones de parámetros se activan por token.
- El modelo estuvo disponible previamente de forma discreta en OpenRouter bajo el nombre 'owl-alpha'.