Um usuário relata que aplicar a técnica SwiReasoning ao modelo Qwen 3.6 27b resulta em respostas mais precisas e consumo significativamente menor de tokens.
- O método tem aproximadamente nove meses, mas ainda não viu adoção generalizada.
- Embora os tokens por segundo possam ser mais lentos, a redução da contagem total de tokens faz com que a experiência geral pareça mais rápida.
- Implementações da comunidade estão disponíveis via repositórios como sdc17/SwiReasoning e Antonbe1b/swireasoning-llamacpp.