JetBrains ha liberado como código abierto los modelos Mellum2, una serie de LLMs de 12B-2.5A entrenados desde cero para apuntar a una inferencia rápida en hardware H100/H200, así como a despliegues locales.
Los modelos están disponibles como archivos GGUF en Ollama y Hugging Face, con un informe técnico completo publicado en arXiv.
Las pruebas de rendimiento indican que Mellum2 se desempeña de manera comparable a otros modelos de lenguaje pequeños, mientras proporciona un throughput significativamente mayor bajo carga concurrente.