К объяснимой дискреционной дисперсии: количественная оценка судебного усмотрения с помощью затворного многозадачного обучения

Исследователи предлагают архитектуру Judge-Aware Gated Multi-Task Learning, которая разделяет объективные факты дела и контекст вынесения решения для улучшения прогнозирования правовых исходов. Модель использует мелкодисперсную таксономию исходов и механизм затворного слияния для динамической модуляции зависимости от личности судьи; оценка проводилась на 13 937 решениях Трудовых трибуналов Великобритании.

Протестирована по сравнению с контролируемой тонкой настройкой базовой модели Gemma-4 26B-A4B, где личность судьи внедряется как токены промпта или целевые выходные данные.
Достигает результатов уровня state-of-the-art при количестве обучаемых параметров на порядок меньшем, чем у генеративных базовых моделей SFT.
Прирост сосредоточен в наиболее неоднозначных и редких классах исходов, что демонстрирует превосходную параметрическую эффективность.
Архитектура обеспечивает интерпретируемость за счет локализации случаев, когда контекст вынесения решения определяет предсказания через обученные эмбеддинги судей.

Исследование приходит к выводу, что для классификации правовых исходов с учетом идентичности дифференцируемая структурированная композиция дает более точные и эффективные модели по сравнению с композицией на основе промптов в больших базовых моделях.