OpenAI запустила ограниченный предпросмотр серии GPT-5.6, представив три новые модели: Sol как флагманскую, Terra для сбалансированной повседневной работы и Luna для быстрых и доступных задач. Компания планирует сделать эти модели общедоступными в ближайшие недели после этого начального этапа с доверенными партнерами.

  • GPT-5.6 Sol устанавливает новый рекорд на Terminal-Bench 2.1 и демонстрирует более сильные результаты, чем GPT-5.5, на GeneBench v1, используя меньше токенов.
  • В области кибербезопасности Sol конкурентоспособен с Mythos Preview на ExploitBench, используя примерно треть выходных токенов, и показывает значительные улучшения на ExploitGym.
  • Серия включает новый максимальный уровень рассуждений для Sol и ультра-режим, использующий субагентов для ускорения сложной работы.
  • OpenAI применяет многоуровневые меры безопасности, включая классификаторы реального времени и сигналы на уровне аккаунта, отмечая, что Sol не пересекает порог Cyber Critical согласно их Preparedness Framework.

Поэтапный выпуск направлен на тестирование мер безопасности под давлением противника, обеспечивая при этом доступность для легитимной защитной работы. Такой подход позволяет OpenAI доработать меры безопасности и согласовать действия с правительством США перед более широким выпуском.