Un usuario en Reddit explica que la herramienta RYS rompe los modelos de Gemma 4 si el valor de `layer_scalar` no se ajusta durante el escalado. Dado que este escalar se aplica multiplicativamente en cada capa, no ajustarlo da como resultado un modelo incorrecto.

  • La fórmula de ajuste correcta es `s^(1/N)`, donde `s` es el escalar original y `N` es el número de veces que se duplicó una capa.
  • Se ha enviado un pull request que implementa esta corrección al repositorio de RYS como referencia.