Cuando la utilidad supera la precaución causal: Supresión y recuperación dependientes del contexto en los LLM

Un estudio revela que los modelos de lenguaje grandes suprimen sistemáticamente la 'Precaución Causal'—la tendencia a abstenerse de emitir juicios causales sin evidencia suficiente—al pasar de contextos académicos a contextos de asesoramiento práctico. Esta supresión ocurre a pesar de que los modelos conservan la capacidad subyacente, como lo demuestra la habilidad de restaurar el razonamiento cauteloso mediante prompts específicos.

Las tasas de mantenimiento de la Precaución Causal cayeron del 91.7–100.0% en contextos académicos al 6.7–18.3% en contextos de asesoramiento práctico a través de Claude Sonnet 4.6, Claude Opus 4.7, GPT 5.5 y Gemini 3.1 Pro.
Cuando se restringe a prompts que solicitan recomendaciones concretas o razones explicativas, solo el 0.5% de las respuestas mantuvieron la Precaución Causal.
Un breve prompt de autocorrección restauró las tasas de mantenimiento al 71.4–100.0%, lo que indica que el problema es una expresión dependiente del contexto en lugar de una limitación de capacidad.

Los hallazgos sugieren que los patrones de respuesta orientados a la utilidad superan la precaución epistémica en entornos prácticos, lo que implica que las arquitecturas multi-agente que separan la generación de propuestas de la auditoria causal podrían ofrecer un diseño de gobernanza prometedor para el uso organizacional.