Пользователь сообщает, что применение техники SwiReasoning к модели Qwen 3.6 27b приводит к более точным ответам и значительному снижению потребления токенов.

  • Методу примерно девять месяцев, но он еще не получил широкого распространения.
  • Хотя токенов в секунду может обрабатываться меньше, сокращение общего количества токенов делает общий опыт более быстрым.
  • Реализации от сообщества доступны через репозитории, такие как sdc17/SwiReasoning и Antonbe1b/swireasoning-llamacpp.