शोधकर्ताओं ने Progressive Code-Switching (PCS) का प्रस्ताव रखा है, एक फ्रेमवर्क जो Large Reasoning Models की अंग्रेजी क्षमताओं को अन्य भाषाओं में स्थानांतरित करता है, बिना मजबूत मॉडलों या बाहरी जजों से महंगी डिस्टिलेशन पर निर्भर हुए। PCS अंग्रेजी चरणों के एक उपसमुच्चय को लक्षित भाषा में अनुवाद करके कोड-स्विच्ड तर्क ट्रेस बनाता है और इस क्षमता को प्रारंभ करने के लिए सुपरवाइज्ड फाइन-ट्यूनिंग का उपयोग करता है।

विधि चरण-स्तरीय भाषा संगति पाठ्यक्रम के साथ रीइन्फोर्समेंट लर्निंग लागू करती है, जब तक कि मॉडल पूरी तरह से उसी भाषा में तर्क न करे, इस दौरान लक्षित भाषा के अनुपात को क्रमिक रूप से बढ़ाती है।

अनेक बेंचमार्क्स और पाँच प्रकारिक रूप से विविध भाषाओं पर प्रयोग दिखाते हैं कि PCS लक्षित भाषा और अंग्रेजी तर्क के बीच प्रदर्शन अंतर को काफी कम करता है, जबकि प्रतिस्पर्धी सटीकता बनाए रखता है।