OpenAI telah memulai pratinjau terbatas untuk seri GPT-5.6, memperkenalkan tiga model baru: Sol sebagai unggulan utama, Terra untuk pekerjaan sehari-hari yang seimbang, dan Luna untuk tugas cepat dan terjangkau. Perusahaan berencana membuat model-model ini tersedia secara umum dalam beberapa minggu mendatang setelah fase awal ini dengan mitra terpercaya.
- GPT-5.6 Sol menetapkan standar terbaru di Terminal-Bench 2.1 dan mencapai hasil lebih kuat daripada GPT-5.5 pada GeneBench v1 dengan menggunakan token yang lebih sedikit.
- Dalam bidang keamanan siber, Sol bersaing dengan Mythos Preview pada ExploitBench dengan menggunakan sekitar sepertiga dari token keluaran dan menunjukkan peningkatan signifikan pada ExploitGym.
- Seri ini mencakup upaya penalaran maksimum baru untuk Sol serta mode ultra yang memanfaatkan subagen untuk mempercepat pekerjaan kompleks.
- OpenAI menerapkan lapisan pengamanan berlapis, termasuk klasifikasi waktu nyata dan sinyal tingkat akun, mencatat bahwa Sol tidak melampaui ambang batas Cyber Critical di bawah Kerangka Kerja Kesiapannya.
Rilis bertahap ini bertujuan untuk menguji langkah-langkah keamanan terhadap tekanan adversarial sambil memastikan pekerjaan pertahanan yang sah tetap dapat diakses. Pendekatan ini memungkinkan OpenAI menyempurnakan pengamanan dan berkoordinasi dengan pemerintah AS sebelum ketersediaan lebih luas.