用户报告 Agents-A1-Q8_0-GGUF 在 M1 Max 上的性能

一位用户分享了在配备 64GB RAM 的 M1 Max Mac 上运行 InternScience/Agents-A1-Q8_0-GGUF 模型的经验反馈。该模型在使用完整的 262K 上下文窗口时，预填充速度约为每秒 500 个 token，生成速度约为每秒 40 个 token。

该帖子邀请其他人分享他们使用该模型的经验，强调其在本地基于代理的工作流中的可行性。