Исследователи предлагают Progressive Code-Switching (PCS), фреймворк, который переносит возможности английских Large Reasoning Models на другие языки без использования дорогостоящей дистилляции от более сильных моделей или внешних судей. PCS строит переключённые рассуждения путём перевода подмножества английских шагов на целевой язык и использует контролируемое тонкое дообучение для инициализации этой способности.

Метод применяет обучение с подкреплением с пошаговой учебной программой согласованности языков, постепенно увеличивая долю целевого языка до тех пор, пока модель не будет рассуждать исключительно на нём.

Эксперименты на множестве бенчмарков и пяти типологически разнообразных языках показывают, что PCS существенно сокращает разрыв в производительности между рассуждениями на целевом языке и английским, сохраняя конкурентоспособную точность.