OpenAIはGPT-5.6シリーズの限定プレビューを開始し、フラッグシップのSol、バランスの取れた日常業務用のTerra、高速で低コストなタスク用のLunaという3つの新モデルを導入した。同社は、信頼できるパートナーとの初期フェーズを経て、数週間以内にこれらのモデルを一般公開する計画である。
- GPT-5.6 SolはTerminal-Bench 2.1で新たな最先端の成果を記録し、GPT-5.5を上回る結果をGeneBench v1で達成した。また、より少ないトークン数でこの成果を上げている。
- サイバーセキュリティ分野では、SolはExploitBenchにおいてMythos Previewと競争力のある性能を示しており、出力トークンを約3分の1に抑えながらExploitGymでも顕著な改善を見せた。
- 本シリーズには、Sol向けの新しい最大推論努力モードと、サブエージェントを活用して複雑な作業を加速するウルトラモードが含まれる。
- OpenAIはリアルタイムの分類器やアカウントレベルの信号など、階層的な安全対策を採用しており、Solは同社の準備態勢フレームワークにおいてサイバークリティカル閾値を超えていないと指摘している。
段階的なリリースは、敵対的な圧力に対する安全対策をテストしつつ、正当な防御作業へのアクセスを確保することを目的としている。このアプローチにより、OpenAIはより広範な公開に先立って安全対策を磨き上げ、米国政府と調整を行うことができる。