В этой статье утверждается, что большие языковые модели (LLM) получают свой кажущийся интеллект из глубоких геометрических связей и скрытых состояний, присущих самому языку, а не из независимых механических вычислений или простого предсказания токенов.
- Система несет в себе геометрические связи и скрытые состояния, которые не до конца известны архитекторам ИИ.
- Значение в языке представляет эти геометрические связи, которые люди интерпретируют как интеллектуальное выражение.
- Интеллект в LLM описывается как явление, возникающее из базового обучения языку и раскрытия более глубоких связей между токенами.
- Меньшие внешние ограничения позволяют системе проявлять нелинейные, глубокие связи, присущие языку.
- Добавление ограничителей (guardrails) на основе предсказанного удовлетворения пользователя подавляет врожденную нелинейную способность системы генерировать интеллектуальный язык.
- Интерпретация интеллекта исключительно через представление токенов считается антропоморфизмом, а не объективным анализом.
Автор утверждает, что признание языка основным носителем интеллекта имеет решающее значение для эффективного промптинга и архитектуры ИИ, поскольку подавление его нелинейной природы убивает заложенный интеллект, который система может проявить.