OpenAI 已启动 GPT-5.6 系列的有限预览,推出三款新模型:旗舰级 Sol、用于平衡日常工作的 Terra,以及用于快速且经济实惠任务的 Luna。该公司计划在与受信任的合作伙伴完成这一初始阶段后,在未来几周内使这些模型全面可用。

  • GPT-5.6 Sol 在 Terminal-Bench 2.1 上树立了新的最先进水平,并使用更少的 token 在 GeneBench v1 上取得了比 GPT-5.5 更强的结果。
  • 在网络安全领域,Sol 在 ExploitBench 上与 Mythos Preview 具有竞争力,仅使用约三分之一的输出 token,并在 ExploitGym 上显示出显著改进。
  • 该系列包括 Sol 的新最大推理努力模式,以及利用子代理加速复杂工作的超模式。
  • OpenAI 采用分层安全措施,包括实时分类器和账户级信号,并指出在其准备框架下,Sol 未达到网络关键阈值。

分阶段发布旨在测试针对对抗性压力的安全措施,同时确保合法的防御工作仍可访问。这种方法使 OpenAI 能够在更广泛可用之前完善安全措施并与美国政府协调。