← 返回 media r/LocalLLaMA · 1 小时前 · open_models SwiReasoning减少令牌使用量,加快Qwen 3.6 27b响应速度 译自 English → 中文 用户报告称,将SwiReasoning技术应用于Qwen 3.6 27b模型可产生更精确的答案,并显著降低令牌消耗。 该方法已有约九个月的历史,但尚未得到广泛采用。虽然每秒处理的令牌数可能较慢,但总令牌数的减少使整体体验感觉更快。社区实现可通过sdc17/SwiReasoning和Antonbe1b/swireasoning-llamacpp等仓库获取。 重要性 1/3 r/LocalLLaMA Inference efficiency Reasoning models 阅读原文