레딧 사용자는 OpenCode와 unsloth ud-q4_k_xl 양자화를 사용할 때 MiMo-V2.5 모델이 지속적인 추론 루프를 보인다고 보고했습니다. 사용자는 추론 스팬은 정당하지만 수동 개입 없이 결정을 내리는 데 어려움을 겪는다고 지적했습니다.
- 사용자는 더 나은 웹 검색 기능과 적은 환각을 이유로 Qwen 3.5 397B에 비해 MiMo-V2.5를 긍정적으로 비교합니다.
- Qwen 3.5 397B는 가상의 Vulkan 버전을 사용하여 Vulkan과 DX12를 동시에 사용하는 계획을 환각했다고 보고됩니다.
- MiMo-V2.5는 결함이 있는 계획을 성공적으로 폐기하고 webfetch만 사용하여 대안을 조사했습니다.
- 사용자는 약 30GB의 VRAM을 보유하고 있으며, 양자화 품질을 높여 루프 문제를 해결할 수 있는지 확인하는 것을 고려하고 있습니다.