Um usuário do Reddit está experimentando loops persistentes na geração de texto ao usar os modelos Qwen3.6 35B e Ornith V1 via Copilot Chat. O problema ocorre apesar de usar parâmetros específicos como temperature 0.6, top_p 0.95 e uma penalidade de repetição (repetition penalty) de 1.1.
- O usuário emprega quantização Q6 para os modelos com K/V em Q8.
- As janelas de contexto estão definidas para 128k, embora apenas cerca de 30k sejam utilizadas durante os erros.
- Os loops se manifestam como um monólogo interno repetitivo, como verificar constantemente a falta de um useEffect específico em um determinado arquivo.
O usuário busca informações de diagnóstico para resolver o problema e parar as repetições constantes.