Makalah ini mendetailkan partisipasi HULAT2-UC3M dalam trek bahasa Spanyol MER-TRANS 2026, sebuah tugas bersama tentang terjemahan bacaan mudah multibahasa. Tim mengirimkan tiga jalankan sepenuhnya otomatis yang membandingkan alur kerja multi-agen dengan baseline linier untuk mengevaluasi strategi penyederhanaan.
- RUN1 dan RUN2 memanfaatkan alur kerja multi-agen berbasis LangGraph yang menggabungkan Gemini 2.5 Flash dan RigoChat-7B-v2 dengan perutean Event-Condition-Action.
- RUN2 menambahkan lapisan dukungan leksikal tambahan berdasarkan glosarium dan sumber daya leksikal ke alur kerja dasar.
- RUN3 berfungsi sebagai baseline menggunakan pendekatan generate-evaluate-regenerate berbasis RigoChat dengan rekayasa prompt dan adaptasi berbasis LoRA.
- Skor SARI resmi peringkat RUN1 pertama dengan 44,0543 poin, diikuti oleh RUN2 di 43,1049 dan RUN3 di 38,5136.
Hasilnya menunjukkan bahwa perutean multi-agen yang dipandu sinyal lebih unggul daripada baseline regenerasi linier dalam pengaturan tugas ini. Namun, menambahkan dukungan leksikal tidak secara otomatis meningkatkan skor berbasis referensi, yang menunjukkan perlunya analisis lebih lanjut mengenai keterbacaan dan konsistensi faktual.