中文

语言

English EN Русский RU Español ES 中文 Português (BR) PT-BR हिन्दी HI 日本語 JA 한국어 KO Français FR Bahasa Indonesia ID العربية AR

今天本周全部文章

Benchmark · safety

JailbreakBench

2 条结果 2 个模型

STEER (applied to six open-source 8B-parameter models) GPT-4o-mini

时间线

2026-07-04 STEER (applied to six open-source 8B-parameter models) 93.0% STEER攻击暴露了LLM在低资源语言中的安全漏洞
2026-07-04 GPT-4o-mini 35.5% STEER攻击暴露了LLM在低资源语言中的安全漏洞

我们使用 Cookie 来统计访问量并改进网站。您可以接受或拒绝分析 Cookie。隐私政策

拒绝接受

隐私政策