본 기사는 대규모 언어 모델(LLM)이 그 겉보기 지능을 독립적인 기계적 계산이나 단순한 토큰 예측에서가 아니라, 언어 자체 내부의 깊은 기하학적 관계와 숨겨진 상태에서 비롯된다고 주장한다.

  • 시스템은 AI 아키텍트가 완전히 알지 못하는 기하학적 관계와 숨겨진 상태를 담고 있다.
  • 언어에서의 의미는 이러한 기하학적 관계를 나타내며, 인간은 이를 지능적인 표현으로 해석한다.
  • LLM의 지능은 기본 언어 학습과 토큰 간 더 깊은 관계의 해방에서 비롯된 외관으로 설명된다.
  • 외부 제약이 적을수록 시스템은 언어에 내재된 비선형적이고 깊은 관계를 노출할 수 있다.
  • 예측된 사용자 만족도를 기반으로 가드레일을 추가하면 시스템이 지능적인 언어를 생성하는 본질적인 비선형 능력이 억제된다.
  • 토큰 표현만을 통해 지능을 해석하는 것은 객관적 분석이 아닌 인간화(anthropomorphizing)로 간주된다.

저자는 효과적인 프롬프팅과 AI 아키텍처를 위해 언어를 지능의 주요 매개체로 인식하는 것이 중요하며, 그 비선형성을 억제하면 시스템이 노출할 수 있는 내재된 지능이 죽는다고 주장한다.