media Hugging Face Forums · 4 天前 · open_models

语言作为智能的载体：超越词元预测

译自 English → 中文

本文认为，大语言模型所表现出的智能源于语言本身内部的深层几何关系和隐藏状态，而非来自独立的机械计算或简单的词元预测。

该系统承载着AI架构师尚未完全了解的几何关系和隐藏状态。
语言中的意义代表了这些几何关系，人类将其解读为智能的表达。
LLM中的智能被描述为一种表象，源于基础的语言学习以及词元之间更深层次关系的释放。
较少的外部约束允许系统暴露语言中固有的非线性深层关系。
基于预测的用户满意度添加护栏会抑制系统生成智能语言的固有非线性能力。
仅通过词元表示来解读智能被视为拟人化，而非客观分析。

作者主张，将语言视为智能的主要载体对于有效的提示工程和AI架构至关重要，因为抑制其非线性本质会扼杀系统所能展现的内在智能。

重要性 1/3 可信度 1/3 Hugging Face Forums Reasoning models Safety & alignment