한 사용자는 Qwen 3.6 27b 모델에 SwiReasoning 기법을 적용함으로써 더 정확한 답변을 얻고 토큰 소비량이 크게 줄었다고 보고했습니다.
- 이 방법은 약 9개월 전부터 존재했지만 아직 널리 채택되지 않았습니다.
- 초당 토큰 수는 느릴 수 있지만, 총 토큰 수가 줄어들어 전체 경험이 더 빠르게 느껴집니다.
- sdc17/SwiReasoning 및 Antonbe1b/swireasoning-llamacpp 등의 저장소를 통해 커뮤니티 구현을 사용할 수 있습니다.