OpenAI는 GPT-5.6 시리즈의 제한된 미리보기를 시작했으며, 플래그십인 Sol, 균형 잡힌 일상 작업을 위한 Terra, 빠르고 저렴한 작업을 위한 Luna 등 세 가지 새로운 모델을 소개했습니다. 이 초기 단계를 거친 후 수주 내에 신뢰할 수 있는 파트너들과 함께 이러한 모델들을 일반 공개할 계획입니다.
- GPT-5.6 Sol은 Terminal-Bench 2.1에서 새로운 최첨단 성능을 달성했으며, 더 적은 토큰으로 GeneBench v1에서 GPT-5.5보다 강력한 결과를 보여줍니다.
- 사이버 보안 분야에서 Sol은 ExploitBench에서 Mythos Preview와 경쟁력 있는 성능을 보이며 출력 토큰의 약 3분의 일만 사용하여 ExploitGym에서도 뚜렷한 개선을 보입니다.
- 이 시리즈에는 Sol을 위한 새로운 최대 추론 노력(max reasoning effort)과 하위 에이전트를 활용하여 복잡한 작업을 가속화하는 울트라 모드가 포함됩니다.
- OpenAI는 실시간 분류기와 계정 수준의 신호를 포함한 계층적 안전 장치를 적용했으며, Sol은 그들의 준비 프레임워크(Preparedness Framework) 하에서 사이버 임계값(Cyber Critical threshold)을 넘지 않는다고 밝혔습니다.
단계적 배포는 적대적 압력에 대한 안전 조치를 테스트하고 합법적인 방어 작업이 계속 접근 가능하도록 하는 것을 목표로 합니다. 이 접근 방식을 통해 OpenAI는 더 넓은 공개 전에 안전 장치를 정교화하고 미국 정부와 협력할 수 있습니다.