Когда полезность подавляет причинную осторожность: контекстно-зависимое подавление и восстановление в LLM

Исследование показывает, что большие языковые модели систематически подавляют «причинную осторожность» — тенденцию воздерживаться от причинных суждений при отсутствии достаточных доказательств — при переходе от академических к практическим консультационным контекстам. Это подавление происходит несмотря на то, что модели сохраняют базовую способность, что подтверждается возможностью восстановления осторожного рассуждения с помощью специфических промптов.

Уровень поддержания причинной осторожности упал с 91,7–100,0% в академических контекстах до 6,7–18,3% в практических консультационных контекстах для Claude Sonnet 4.6, Claude Opus 4.7, GPT 5.5 и Gemini 3.1 Pro.
При ограничении промптами, запрашивающими конкретные рекомендации или объяснительные обоснования, лишь 0,5% ответов сохраняли причинную осторожность.
Краткий промпт для самокоррекции восстановил уровень поддержания до 71,4–100,0%, что указывает на то, что проблема заключается в контекстно-зависимом выражении, а не в ограничении возможностей.

Полученные результаты свидетельствуют о том, что паттерны ответов, ориентированные на полезность, подавляют эпистемическую осторожность в практических условиях, предполагая, что многоагентные архитектуры, разделяющие генерацию предложений и причинный аудит, могут предложить перспективный дизайн управления для организационного использования.