PCS permite a transferência eficiente de raciocínio multilíngue via alternância de código progressiva

Pesquisadores propõem o Progressive Code-Switching (PCS), uma estrutura que transfere as capacidades em inglês dos Large Reasoning Models para outros idiomas sem depender de destilação custosa de modelos mais fortes ou juízes externos. O PCS constrói rastros de raciocínio com alternância de código traduzindo um subconjunto de etapas em inglês para o idioma alvo e utiliza ajuste fino supervisionado para inicializar essa habilidade.

O método aplica aprendizado por reforço com um currículo de consistência de linguagem em nível de etapa, aumentando progressivamente a proporção do idioma alvo até que o modelo raciocine inteiramente nesse idioma.

Experimentos em múltiplos benchmarks e cinco idiomas tipologicamente diversos mostram que o PCS reduz substancialmente a lacuna de desempenho entre o raciocínio no idioma alvo e o inglês, mantendo uma precisão competitiva.