Un utilisateur rapporte que l'application de la technique SwiReasoning au modèle Qwen 3.6 27b entraîne des réponses plus précises et une consommation de tokens significativement réduite.
- La méthode existe depuis environ neuf mois mais n'a pas encore connu d'adoption massive.
- Bien que les tokens par seconde puissent être plus lents, la réduction du nombre total de tokens rend l'expérience globale plus rapide.
- Des implémentations communautaires sont disponibles via des dépôts tels que sdc17/SwiReasoning et Antonbe1b/swireasoning-llamacpp.