Исследователи предлагают архитектуру Judge-Aware Gated Multi-Task Learning, которая разделяет объективные факты дела и контекст вынесения решения для улучшения прогнозирования правовых исходов. Модель использует мелкодисперсную таксономию исходов и механизм затворного слияния для динамической модуляции зависимости от личности судьи; оценка проводилась на 13 937 решениях Трудовых трибуналов Великобритании.
- Протестирована по сравнению с контролируемой тонкой настройкой базовой модели Gemma-4 26B-A4B, где личность судьи внедряется как токены промпта или целевые выходные данные.
- Достигает результатов уровня state-of-the-art при количестве обучаемых параметров на порядок меньшем, чем у генеративных базовых моделей SFT.
- Прирост сосредоточен в наиболее неоднозначных и редких классах исходов, что демонстрирует превосходную параметрическую эффективность.
- Архитектура обеспечивает интерпретируемость за счет локализации случаев, когда контекст вынесения решения определяет предсказания через обученные эмбеддинги судей.
Исследование приходит к выводу, что для классификации правовых исходов с учетом идентичности дифференцируемая структурированная композиция дает более точные и эффективные модели по сравнению с композицией на основе промптов в больших базовых моделях.