Язык как носитель интеллекта: за пределами предсказания токенов

В этой статье утверждается, что большие языковые модели (LLM) получают свой кажущийся интеллект из глубоких геометрических связей и скрытых состояний, присущих самому языку, а не из независимых механических вычислений или простого предсказания токенов.

Система несет в себе геометрические связи и скрытые состояния, которые не до конца известны архитекторам ИИ.
Значение в языке представляет эти геометрические связи, которые люди интерпретируют как интеллектуальное выражение.
Интеллект в LLM описывается как явление, возникающее из базового обучения языку и раскрытия более глубоких связей между токенами.
Меньшие внешние ограничения позволяют системе проявлять нелинейные, глубокие связи, присущие языку.
Добавление ограничителей (guardrails) на основе предсказанного удовлетворения пользователя подавляет врожденную нелинейную способность системы генерировать интеллектуальный язык.
Интерпретация интеллекта исключительно через представление токенов считается антропоморфизмом, а не объективным анализом.

Автор утверждает, что признание языка основным носителем интеллекта имеет решающее значение для эффективного промптинга и архитектуры ИИ, поскольку подавление его нелинейной природы убивает заложенный интеллект, который система может проявить.