Понимание больших языковых моделей: споры о возникающих способностях и когнитивных процессах

В этой главе излагается современное понимание больших языковых моделей (LLM) через анализ их механизмов, возникающих способностей и дискуссий вокруг их связи с человеческим познанием. Подчёркивается, как механизм внимания архитектуры Transformer позволяет LLM функционировать как универсальным моделям, обученным на огромных наборах данных.

В тексте рассматриваются доказательства того, что LLM демонстрируют возникающие способности, напоминающие человеческое познание, такие как символические рассуждения, теория разума и стратегии обмана.
Исследования подчёркивают как успешные случаи решения сложных задач, так и неудачи, выявляющие различия между человеческим и машинным познанием.
Обсуждаются подходы к объяснимому ИИ, включая анализ активации нейронов и трассировку цепей.
Авторы возражают против упрощённых редукционистских взглядов, приписывающих поведение LLM исключительно запоминанию паттернов, выступая за более нюансированную дискуссию о когнитивных процессах ИИ.

Авторы утверждают, что отказ от понимания LLM на основе простых целей обучения проистекает из заблуждений относительно процессов оптимизации. Они предлагают сбалансированный взгляд, признающий различия между людьми и LLM, но допускающий возможность подлинного когнитивного процесса ИИ.