あるユーザーは、Qwen 3.6 27bモデルにSwiReasoning技術を適用することで、より正確な回答が得られ、トークン消費量が大幅に減少すると報告しています。
- この手法は約9ヶ月前から存在しますが、まだ広く普及していません。
- トークンあたりの速度は遅くなる可能性がありますが、総トークン数の削減により全体的な体験が高速に感じられます。
- sdc17/SwiReasoningやAntonbe1b/swireasoning-llamacppなどのリポジトリを通じてコミュニティ実装が利用可能です。