بدأت OpenAI عرضًا محدودًا لسلسلة GPT-5.6، مقدمةً ثلاثة نماذج جديدة: Sol كنموذج رائد، وTerra للعمل اليومي المتوازن، وLuna للمهام السريعة والمنخفضة التكلفة. تخطط الشركة لجعل هذه النماذج متاحة للعامة في الأسابيع القادمة بعد هذه المرحلة الأولية مع شركاء موثوقين.
- يضع GPT-5.6 Sol معيارًا جديدًا للأداء على Terminal-Bench 2.1 ويحقق نتائج أقوى من GPT-5.5 على GeneBench v1 باستخدام عدد أقل من الرموز (tokens).
- في مجال الأمن السيبراني، يتنافس Sol مع Mythos Preview على ExploitBench باستخدام حوالي ثلث رموز الإخراج ويُظهر تحسنًا قويًا على ExploitGym.
- تشمل السلسلة جهد استدلال أقصى جديدًا لـSol ووضعًا فائقًا (ultra mode) يستغل الوكلاء الفرعيين لتسريع الأعمال المعقدة.
- تستخدم OpenAI ضوابط طباقية، بما في ذلك مصنفات في الوقت الفعلي وإشارات على مستوى الحساب، مشيرةً إلى أن Sol لا يتجاوز عتبة الحرج السيبراني تحت إطار الاستعداد لديها.
يهدف الإطلاق التدريجي إلى اختبار إجراءات السلامة ضد الضغط العدائي مع ضمان بقاء الأعمال الدفاعية المشروعة متاحة. يتيح هذا النهج لـOpenAI تحسين الضوابط والتنسيق مع الحكومة الأمريكية قبل التوفر الأوسع.