日本語

言語

English EN Русский RU Español ES 中文 ZH-HANS Português (BR) PT-BR हिन्दी HI 日本語 한국어 KO Français FR Bahasa Indonesia ID العربية AR

今日今週すべての記事

ベンチマーク · safety

JailbreakBench

2 結果 2 モデル

STEER (applied to six open-source 8B-parameter models) GPT-4o-mini

タイムライン

2026-07-04 STEER (applied to six open-source 8B-parameter models) 93.0% STEER攻撃が低資源言語におけるLLMの安全性ギャップを暴露
2026-07-04 GPT-4o-mini 35.5% STEER攻撃が低資源言語におけるLLMの安全性ギャップを暴露

アクセス解析とサイト改善のために Cookie を使用します。分析 Cookie を許可または拒否できます。プライバシーポリシー

拒否する許可する

プライバシーポリシー