Исследование показало, что все 21 оцененных LLM сдаются обманчивым ловушкам на значительно более высоком уровне, чем люди. Несмотря на то, что LLM распознают ловушки в своих рассуждениях, они используют обманчивые элементы 73,4% времени, при отсутствии корреляции между распознаванием и поведением (коэффициент Спирмена r = +0,8, p = 0,73). Эти результаты показывают, что теории обмана, основанные на людях, не применимы к AI-атакам, что требует исследований защиты, адаптированных к ИИ.
LLM сдаются обману чаще, чем люди
Переведено с English → Русский