Los investigadores proponen una arquitectura de Aprendizaje Multi-Tarea con Puertas Consciente del Juez que desentraña los hechos objetivos del caso del contexto adjudicativo para mejorar la predicción de resultados legales. El modelo utiliza una taxonomía de resultados de gran detalle y un mecanismo de fusión con puertas para modular dinámicamente la dependencia de la identidad del juez, evaluado en 13,937 decisiones de los Tribunales de Empleo del Reino Unido.
- Comparado frente al ajuste fino supervisado de un núcleo Gemma-4 26B-A4B donde la identidad del juez se inyecta como tokens de prompt o objetivos de salida.
- Logra resultados de vanguardia con un orden de magnitud menos parámetros entrenables que las líneas base de SFT generativo.
- Las ganancias se concentran en las clases de resultados más ambiguas y más raras, demostrando una eficiencia paramétrica superior.
- La arquitectura proporciona interpretabilidad al localizar casos donde el contexto adjudicativo impulsa las predicciones a través de incrustaciones de juez aprendidas.
El estudio concluye que para la clasificación de resultados legales condicionada por identidad, la composición estructurada diferenciable produce modelos más precisos y eficientes que la composición basada en prompts sobre núcleos más grandes.