Пользователь Reddit сталкивается с постоянными циклами генерации текста при использовании моделей Qwen3.6 35B и Ornith V1 через Copilot Chat. Проблема возникает несмотря на использование специфических параметров, таких как temperature 0.6, top_p 0.95 и penalty за повторение (repetition penalty) 1.1.
- Пользователь применяет квантование Q6 для моделей с K/V при Q8.
- Окна контекста установлены на 128k, хотя во время ошибок используется лишь около 30k.
- Зацикливание проявляется в виде повторяющегося внутреннего монолога, например, постоянного поиска пропущенного useEffect в определенном файле.
Пользователь ищет диагностическую информацию для решения проблемы и остановки постоянных повторений.