在美国政府解除出口管制后,Anthropic正在恢复其Claude Fable 5和Mythos 5模型在全球范围内的访问权限。Fable 5将于7月1日起在Claude平台上面向全球用户开放,使用限制将持续至7月7日,之后将切换为基于信用的访问模式。
- 6月12日,由于亚马逊的一份报告指出了一种绕过Fable 5安全措施的方法,因此对所有用户立即暂停了服务。
- 测试确认,所报告的漏洞识别和利用演示能力并非Fable 5独有,在GPT-5.5和Kimi K2.7等其他模型中也存在类似情况。
- Anthropic训练了一个改进的安全分类器,能够在超过99%的情况下阻止该特定绕过技术,并将被阻止的请求重定向至Opus 4.8。
- 6月26日获得政府批准后,Mythos 5已恢复对部分美国组织的访问权限,而更广泛的扩展仍在通过Glasswing计划进行。
该公司正与亚马逊、微软、谷歌及其他合作伙伴合作,开发一个共享的行业框架,用于评估AI模型的越狱攻击及其严重程度。该倡议旨在建立统一的标准,用于分类安全发现并向政府和行业利益相关者传达风险等级。