Benchmark · safety

JailbreakBench

2 hasil 2 model

STEER (applied to six open-source 8B-parameter models) GPT-4o-mini

Linimasa

2026-07-04 STEER (applied to six open-source 8B-parameter models) 93.0% Serangan STEER mengungkap celah keamanan LLM dalam bahasa dengan sumber daya rendah
2026-07-04 GPT-4o-mini 35.5% Serangan STEER mengungkap celah keamanan LLM dalam bahasa dengan sumber daya rendah