泄露的 Claude Fable 5 系统提示分析揭示了 Mythos 层级架构

对 Anthropic Claude Fable 5 模型泄露的 120KB 系统提示的分析详细说明了其对齐和工具编排背后的架构策略。该文件强调了模型如何与无限制的 Mythos 5 共享权重，同时在推理过程中依赖安全分类器。

该分析通过检查 Anthropic 在其系统架构中如何处理安全和工具使用，为前沿模型的对齐提供了见解。