Проект Orthrus готовится выпустить поддержку моделей Qwen 3.5, Qwen 3.6 и Gemma 4 с использованием подхода диффузионной головы. Команда завершила тестирование и в настоящее время настраивает конвейер выпуска.

  • Будет добавлена поддержка моделей Qwen3.5, Qwen3.6 и Gemma4.
  • Полный код сквозного обучения и оценки будет опубликован вместе с контрольными точками модели.
  • Обновления скоро будут загружены в репозиторий.

Выпуск направлен предоставить доступные инструменты для обучения и оценки этих конкретных архитектур моделей.