arxiv arXiv cs.CL · 7d ago · research

Steerable Model Merging for Multilingual Reasoning

from English

Steerable Model Merging (ST-Merge) introduces a gated cross-attention mechanism to adaptively weight source models during multilingual reasoning. It outperforms existing baselines on four multilingual reasoning benchmarks across 21 languages by dynamically prioritizing models based on input characteristics.

Importance 2/3 arXiv cs.CL Evaluation & benchmarks Multimodal Reasoning models

Benchmarks

Benchmark	Model	Score
SWE-bench Multilingual	Steerable Model Merging (ST-Merge)	—

Read original