Проект Orthrus готовится выпустить поддержку моделей Qwen 3.5, Qwen 3.6 и Gemma 4 с использованием подхода диффузионной головы. Команда завершила тестирование и в настоящее время настраивает конвейер выпуска.
- Будет добавлена поддержка моделей Qwen3.5, Qwen3.6 и Gemma4.
- Полный код сквозного обучения и оценки будет опубликован вместе с контрольными точками модели.
- Обновления скоро будут загружены в репозиторий.
Выпуск направлен предоставить доступные инструменты для обучения и оценки этих конкретных архитектур моделей.