media r/LocalLLaMA · 1 小时前 · open_models

用户报告使用 unsloth ud-q4_k_xl 量化时 MiMo-V2.5 出现循环问题

译自 English → 中文

一位 Reddit 用户报告称，在使用 OpenCode 和 unsloth ud-q4_k_xl 量化时，MiMo-V2.5 模型表现出持续的推理循环。该用户指出，虽然推理链是合理的，但模型在没有人工干预的情况下难以做出决策。

用户将 MiMo-V2.5 与 Qwen 3.5 397B 进行了有利比较，指出其网络搜索能力更好且幻觉更少。
据报道，Qwen 3.5 397B 产生了一次幻觉，生成了一个同时使用 Vulkan 和 DX12 的计划，并捏造了一个 Vulkan 版本。
MiMo-V2.5 成功摒弃了有缺陷的计划，仅使用 webfetch 研究了替代方案。
该用户剩余约 30GB VRAM，并考虑提高量化质量以查看是否能解决循环问题。

重要性 1/3 r/LocalLLaMA Benchmark results Inference efficiency