本文详细介绍了 HULAT2-UC3M 参与 MER-TRANS 2026 西班牙语赛道(一项关于多语言易读翻译的共享任务)的情况。团队提交了三个完全自动化的运行实验,将多智能体工作流与线性基线进行比较,以评估简化策略。

  • RUN1 和 RUN2 使用了基于 LangGraph 的多智能体工作流,结合了 Gemini 2.5 Flash 和 RigoChat-7B-v2,并采用 Event-Condition-Action 路由机制。
  • RUN2 在基础工作流中增加了一个基于词汇表和词汇资源的额外词法支持层。
  • RUN3 作为基线,使用了基于 RigoChat 的 generate-evaluate-regenerate 方法,结合提示工程(prompt engineering)和基于 LoRA 的适配。
  • 官方 SARI 评分将 RUN1 排在首位,得分为 44.0543,其次是 RUN2(43.1049)和 RUN3(38.5136)。

结果表明,在此任务设置下,信号引导的多智能体路由优于线性再生基线。然而,增加词法支持并未自动提高基于参考的评分,这表明需要进一步分析可读性和事实一致性。