Gemma 4 31bを再構築中…より良く…26bとして…

ある開発者が、パラメータ数を約26Bに削減しつつパフォーマンスの向上を目指し、Gemma 4 31Bモデルを再構築する計画を明らかにしました。このプロジェクトには、アーキテクチャの変更、特定のトレーニング手法、データセットのキュレーションが含まれ、より小さく効率的なモデルの作成を目指します。

著者は、より小さいフットプリントで長いコンテキストの機能と全体的なパフォーマンスの向上を目指しており、モデルの「思考」トレーニングフェーズの検閲解除も検討しています。