يوضح أحد المستخدمين على رديت أن أداة RYS تُفسد نماذج Gemma 4 إذا لم يتم ضبط قيمة `layer_scalar` أثناء الترقية. ونظرًا لأن هذا المعامل يُطبق بشكل ضربي في كل طبقة، فإن عدم ضبطه يؤدي إلى نموذج غير صحيح.

  • صيغة الضبط الصحيحة هي `s^(1/N)`، حيث `s` هو المعامل الأصلي و`N` هو عدد المرات التي تم فيها تكرار الطبقة.
  • تم تقديم طلب سحب (pull request) لتنفيذ هذا الإصلاح في مستودع RYS للاسترشاد به.