A OpenAI iniciou uma prévia limitada da série GPT-5.6, apresentando três novos modelos: Sol como o principal, Terra para trabalho diário equilibrado e Luna para tarefas rápidas e acessíveis. A empresa planeja tornar esses modelos amplamente disponíveis nas próximas semanas após esta fase inicial com parceiros confiáveis.

  • O GPT-5.6 Sol estabelece um novo estado da arte no Terminal-Bench 2.1 e alcança resultados superiores ao GPT-5.5 no GeneBench v1 usando menos tokens.
  • Em cibersegurança, o Sol é competitivo com o Mythos Preview no ExploitBench usando aproximadamente um terço dos tokens de saída e mostra melhorias significativas no ExploitGym.
  • A série inclui um novo esforço máximo de raciocínio para o Sol e um modo ultra que utiliza subagentes para acelerar trabalhos complexos.
  • A OpenAI emprega salvaguardas em camadas, incluindo classificadores em tempo real e sinais ao nível da conta, observando que o Sol não ultrapassa o limite Cyber Critical sob seu Framework de Preparação.

O lançamento faseado visa testar medidas de segurança contra pressão adversarial enquanto garante que o trabalho defensivo legítimo permaneça acessível. Essa abordagem permite à OpenAI refinar as salvaguardas e coordenar-se com o governo dos EUA antes da disponibilidade mais ampla.