一位 Reddit 用户报告称,在使用 OpenCode 和 unsloth ud-q4_k_xl 量化时,MiMo-V2.5 模型表现出持续的推理循环。该用户指出,虽然推理链是合理的,但模型在没有人工干预的情况下难以做出决策。
- 用户将 MiMo-V2.5 与 Qwen 3.5 397B 进行了有利比较,指出其网络搜索能力更好且幻觉更少。
- 据报道,Qwen 3.5 397B 产生了一次幻觉,生成了一个同时使用 Vulkan 和 DX12 的计划,并捏造了一个 Vulkan 版本。
- MiMo-V2.5 成功摒弃了有缺陷的计划,仅使用 webfetch 研究了替代方案。
- 该用户剩余约 30GB VRAM,并考虑提高量化质量以查看是否能解决循环问题。