用户报告称,将SwiReasoning技术应用于Qwen 3.6 27b模型可产生更精确的答案,并显著降低令牌消耗。

  • 该方法已有约九个月的历史,但尚未得到广泛采用。
  • 虽然每秒处理的令牌数可能较慢,但总令牌数的减少使整体体验感觉更快。
  • 社区实现可通过sdc17/SwiReasoning和Antonbe1b/swireasoning-llamacpp等仓库获取。