media Hugging Face Forums · 4일 전 · open_models

지능의 매개체로서의 언어: 토큰 예측을 넘어

번역 English → 한국어

본 기사는 대규모 언어 모델(LLM)이 그 겉보기 지능을 독립적인 기계적 계산이나 단순한 토큰 예측에서가 아니라, 언어 자체 내부의 깊은 기하학적 관계와 숨겨진 상태에서 비롯된다고 주장한다.

시스템은 AI 아키텍트가 완전히 알지 못하는 기하학적 관계와 숨겨진 상태를 담고 있다.
언어에서의 의미는 이러한 기하학적 관계를 나타내며, 인간은 이를 지능적인 표현으로 해석한다.
LLM의 지능은 기본 언어 학습과 토큰 간 더 깊은 관계의 해방에서 비롯된 외관으로 설명된다.
외부 제약이 적을수록 시스템은 언어에 내재된 비선형적이고 깊은 관계를 노출할 수 있다.
예측된 사용자 만족도를 기반으로 가드레일을 추가하면 시스템이 지능적인 언어를 생성하는 본질적인 비선형 능력이 억제된다.
토큰 표현만을 통해 지능을 해석하는 것은 객관적 분석이 아닌 인간화(anthropomorphizing)로 간주된다.

저자는 효과적인 프롬프팅과 AI 아키텍처를 위해 언어를 지능의 주요 매개체로 인식하는 것이 중요하며, 그 비선형성을 억제하면 시스템이 노출할 수 있는 내재된 지능이 죽는다고 주장한다.

중요도 1/3 신뢰도 1/3 Hugging Face Forums Reasoning models Safety & alignment