Пользователь сообщает, что применение техники SwiReasoning к модели Qwen 3.6 27b приводит к более точным ответам и значительному снижению потребления токенов.
- Методу примерно девять месяцев, но он еще не получил широкого распространения.
- Хотя токенов в секунду может обрабатываться меньше, сокращение общего количества токенов делает общий опыт более быстрым.
- Реализации от сообщества доступны через репозитории, такие как sdc17/SwiReasoning и Antonbe1b/swireasoning-llamacpp.