Un utilisateur rapporte que l'application de la technique SwiReasoning au modèle Qwen 3.6 27b entraîne des réponses plus précises et une consommation de tokens significativement réduite.

  • La méthode existe depuis environ neuf mois mais n'a pas encore connu d'adoption massive.
  • Bien que les tokens par seconde puissent être plus lents, la réduction du nombre total de tokens rend l'expérience globale plus rapide.
  • Des implémentations communautaires sont disponibles via des dépôts tels que sdc17/SwiReasoning et Antonbe1b/swireasoning-llamacpp.