본 논문은 다국어 쉬운 읽기 번역 공동 과업인 MER-TRANS 2026의 스페인어 트랙에서 HULAT2-UC3M의 참여 세부 사항을 상세히 설명합니다. 팀은 단순화 전략을 평가하기 위해 멀티 에이전트 워크플로우와 선형 베이스라인을 비교하는 세 가지 완전 자동 실행을 제출했습니다.

  • RUN1 및 RUN2는 Gemini 2.5 Flash와 RigoChat-7B-v2를 결합한 Event-Condition-Action 라우팅을 사용하는 LangGraph 기반 멀티 에이전트 워크플로우를 활용했습니다.
  • RUN2는 기본 워크플로우에 어휘 사전을 기반으로 한 추가적인 어휘 지원 레이어를 추가했습니다.
  • RUN3는 프롬프트 엔지니어링과 LoRA 기반 적응을 사용한 RigoChat 기반 generate-evaluate-regenerate 접근법을 사용한 베이스라인 역할을 했습니다.
  • 공식 SARI 점수는 RUN1이 44.0543점으로 1위, RUN2가 43.1049점, RUN3가 38.5136점으로 순위 매겨졌습니다.

결과들은 신호 유도형 멀티 에이전트 라우팅이 이 작업 설정에서 선형 재생성 베이스라인보다 우수함을 나타냅니다. 그러나 어휘 지원을 추가해도 참조 기반 점수가 자동으로 향상되지 않았으며, 이는 가독성과 사실적 일관성에 대한 추가 분석이 필요함을 시사합니다.