Бенчмарки OpenMythos теперь доступны, оценивающие производительность на SWE-bench Pro, CyberGym и cybench. Результаты показывают, что модель хорошо справляется с задачами в области кибербезопасности, хотя планируется дальнейшее обучение для улучшения возможностей. Варианты GGUF и ссылки на демонстрации доступны на Hugging Face.
Опубликованы бенчмарки OpenMythos с результатами SWE-bench и в области кибербезопасности
Переведено с English → Русский