Usuários relatam problemas de looping no MiMo-V2.5 com quantização unsloth ud-q4_k_xl

Um usuário do Reddit relata que o modelo MiMo-V2.5 exibe loops persistentes de raciocínio ao ser usado com OpenCode e a quantização unsloth ud-q4_k_xl. O usuário observa que, embora as cadeias de raciocínio sejam legítimas, o modelo tem dificuldade em tomar decisões sem intervenção manual.

O usuário compara favoravelmente o MiMo-V2.5 em relação ao Qwen 3.5 397B, citando melhores capacidades de busca na web e menos alucinações.
Relata-se que o Qwen 3.5 397B alucinou um plano usando Vulkan e DX12 simultaneamente com uma versão inventada do Vulkan.
O MiMo-V2.5 descartou com sucesso o plano defeituoso e pesquisou alternativas usando apenas webfetch.
O usuário tem aproximadamente 30 GB de VRAM restante e considera aumentar a qualidade da quantização para ver se isso resolve o problema de looping.