JetBrains открыла исходный код моделей Mellum2, серии LLM объемом 12B-2.5A, обученных с нуля для обеспечения быстрого вывода на аппаратном обеспечении H100/H200, а также для локальных развертываний.
Модели доступны в формате GGUF на Ollama и Hugging Face, полный технический отчет опубликован на arXiv.
Результаты бенчмарков показывают, что Mellum2 демонстрирует производительность, сопоставимую с другими малыми языковыми моделями, обеспечивая при этом значительно более высокую пропускную способность под одновременной нагрузкой.