레딧의 한 사용자는 `layer_scalar` 값을 조정하지 않으면 RYS 도구가 Gemma 4 모델을 손상시킨다고 설명합니다. 이 스칼라는 각 레이어에서 곱셈으로 적용되므로, 이를 조정하지 않으면 모델이 잘못됩니다.

  • 올바른 조정 공식은 `s^(1/N)`이며, 여기서 `s`는 원래 스칼라이고 `N`은 레이어가 복제된 횟수입니다.
  • 이 수정을 구현한 풀 리퀘스트가 참조용으로 RYS 저장소에 제출되었습니다.