В данной статье подробно описывается участие HULAT2-UC3M в испанской дорожке MER-TRANS 2026, общей задаче по переводу текстов, легко воспринимаемых на нескольких языках. Команда представила три полностью автоматических запуска, сравнивающих многоагентный рабочий процесс с линейным базовым уровнем для оценки стратегий упрощения.

  • RUN1 и RUN2 использовали многоагентный рабочий процесс на основе LangGraph, объединяющий Gemini 2.5 Flash и RigoChat-7B-v2 с маршрутизацией Event-Condition-Action.
  • RUN2 добавил дополнительный слой лексической поддержки на основе глоссария и лексических ресурсов к базовому рабочему процессу.
  • RUN3 служил базовым уровнем, используя подход generate-evaluate-regenerate на базе RigoChat с инженерией промптов и адаптацией на основе LoRA.
  • Официальные оценки SARI поставили RUN1 на первое место с 44.0543 балла, за ним последовал RUN2 с 43.1049 и RUN3 с 38.5136.

Результаты показывают, что маршрутизация нескольких агентов, управляемая сигналами, превзошла линейный базовый уровень регенерации в данной настройке задачи. Однако добавление лексической поддержки не привело к автоматическому улучшению оценок, основанных на эталонных текстах, что указывает на необходимость дальнейшего анализа читабельности и фактической согласованности.