Gemma 4 WebGPUカーネルが255 tok/sを達成

XenovaはGemma 4用のWebGPUカーネルをリリースし、255トークン/秒のパフォーマンスを実現しました。この最適化により、密集モデルがウェブブラウザで100 T/sを超える速度で実行可能になります。

この速度により、ローカルのプライベートモデルがほとんどのタスクを処理でき、日常業務におけるClaudeやCodexなどの最先端APIへの依存を減らせます。