本論文は、多言語簡単読解翻訳の共有タスクであるMER-TRANS 2026のスペイン語トラックにおけるHULAT2-UC3Mの参加詳細を記述する。チームは、マルチエージェントワークフローと線形ベースラインを比較し、簡略化戦略を評価するために、3つの完全自動実行を提出した。
- RUN1およびRUN2は、Gemini 2.5 FlashとRigoChat-7B-v2を組み合わせたEvent-Condition-Actionルーティングを用いたLangGraphベースのマルチエージェントワークフローを利用した。
- RUN2は、基本ワークフローに辞書および語彙リソースに基づく追加の語彙支援層を追加した。
- RUN3は、プロンプトエンジニアリングとLoRAベースの適応を用いたRigoChatベースのgenerate-evaluate-regenerateアプローチによるベースラインとして機能した。
- 公式のSARIスコアでは、RUN1が44.0543ポイントで1位、次にRUN2が43.1049ポイント、RUN3が38.5136ポイントとなった。
結果は、信号誘導型マルチエージェントルーティングがこのタスク設定において線形再生成ベースラインを上回ったことを示している。しかし、語彙支援の追加は参照ベースのスコアを自動的に改善しなかったため、読みやすさと事実的一貫性に関するさらなる分析が必要であることが示唆されている。