理解大型语言模型：涌现能力与认知争论

本章通过考察大型语言模型（LLM）的机制、涌现能力及其与人类认知关系的争议，概述了当前对大型语言模型的理解。它强调了Transformer架构的注意力机制如何使LLM能够作为在海量数据集上训练的通用模型运行。

作者认为，仅基于简单的训练目标就否定LLM的理解能力，源于对优化过程的误解。他们提出了一种平衡的观点，既承认人类与LLM之间的差异，又允许存在真正的AI认知的可能性。