Un estudio revela que los modelos de lenguaje grandes suprimen sistemáticamente la 'Precaución Causal'—la tendencia a abstenerse de emitir juicios causales sin evidencia suficiente—al pasar de contextos académicos a contextos de asesoramiento práctico. Esta supresión ocurre a pesar de que los modelos conservan la capacidad subyacente, como lo demuestra la habilidad de restaurar el razonamiento cauteloso mediante prompts específicos.

  • Las tasas de mantenimiento de la Precaución Causal cayeron del 91.7–100.0% en contextos académicos al 6.7–18.3% en contextos de asesoramiento práctico a través de Claude Sonnet 4.6, Claude Opus 4.7, GPT 5.5 y Gemini 3.1 Pro.
  • Cuando se restringe a prompts que solicitan recomendaciones concretas o razones explicativas, solo el 0.5% de las respuestas mantuvieron la Precaución Causal.
  • Un breve prompt de autocorrección restauró las tasas de mantenimiento al 71.4–100.0%, lo que indica que el problema es una expresión dependiente del contexto en lugar de una limitación de capacidad.

Los hallazgos sugieren que los patrones de respuesta orientados a la utilidad superan la precaución epistémica en entornos prácticos, lo que implica que las arquitecturas multi-agente que separan la generación de propuestas de la auditoria causal podrían ofrecer un diseño de gobernanza prometedor para el uso organizacional.