Benchmark · safety

JailbreakBench

2 نتائج 2 نماذج
0 24.5 49 73.5 98 2026-07-04 STEER (applied to six open-source 8B-parameter models) · 93 · 2026-07-04 GPT-4o-mini · 35.5 · 2026-07-04
STEER (applied to six open-source 8B-parameter models) GPT-4o-mini
الجدول الزمني
  1. 2026-07-04 STEER (applied to six open-source 8B-parameter models) 93.0% هجوم STEER يكشف عن ثغرات أمان النماذج اللغوية الكبيرة في اللغات منخفضة الموارد
  2. 2026-07-04 GPT-4o-mini 35.5% هجوم STEER يكشف عن ثغرات أمان النماذج اللغوية الكبيرة في اللغات منخفضة الموارد