arxiv
arXiv cs.AI
·
hace 9 h
Medición y mitigación del sobreajuste en modelos de lenguaje grandes para tribunales multilingües de derecho penal
Este artículo aborda el desafío del sobreajuste en modelos de lenguaje grandes utilizados en contextos de derecho penal del Tribunal Federal Suizo, donde las barreras de seguridad del modelo frecuentemente activan rechazos al procesar detalles sensibles de casos. Los autores presentan TF-RefusalBench, una evaluación multilingüe derivada de fallos públicos, para medir este fenómeno en francés, alemán, italiano e inglés.