Пользователь на Reddit объясняет, что инструмент RYS ломает модели Gemma 4, если значение `layer_scalar` не корректируется во время масштабирования. Поскольку этот скаляр применяется мультипликативно на каждом слое, его отсутствие приводит к некорректной модели.

  • Правильная формула корректировки: `s^(1/N)`, где `s` — исходный скаляр, а `N` — количество дублирований слоя.
  • Запрос на включение (pull request) с реализацией этого исправления был отправлен в репозиторий RYS для справки.