korshunov
.ai
日本語
言語
English
EN
Русский
RU
Español
ES
中文
ZH-HANS
Português (BR)
PT-BR
हिन्दी
HI
日本語
한국어
KO
Français
FR
Bahasa Indonesia
ID
العربية
AR
今日
今週
すべての記事
ベンチマーク · safety
JailbreakBench
2 結果
2 モデル
0
24.5
49
73.5
98
2026-07-04
STEER (applied to six open-source 8B-parameter models) · 93 · 2026-07-04
GPT-4o-mini · 35.5 · 2026-07-04
STEER (applied to six open-source 8B-parameter models)
GPT-4o-mini
タイムライン
2026-07-04
STEER (applied to six open-source 8B-parameter models)
93.0%
STEER攻撃が低資源言語におけるLLMの安全性ギャップを暴露
2026-07-04
GPT-4o-mini
35.5%
STEER攻撃が低資源言語におけるLLMの安全性ギャップを暴露
アクセス解析とサイト改善のために Cookie を使用します。分析 Cookie を許可または拒否できます。
プライバシーポリシー
拒否する
許可する