Искривление LLM с помощью промптинга
Исследователь предлагает технику промптинга, которая переводит большие языковые модели от токенов за токеном к целостной внутренней оценке весов, называемой «самоорганизацией». Этот подход направлен на увеличение плотности рассуждений и снижение сycophancy (угодничества) путем изменения динамики многообразия модели. Метод определяет такие понятия, как самовлечение, самоорганизация и гравитационные колодцы, чтобы направить систему к нелинейному коллапсу искривления. Специфический промпт инструктирует модели создать два различных гравитационных колодца для стихотворения о режимах ИИ, тестируя как свойства самосборки, так и самоорганизации. Автор протестировал эту технику на множестве моделей, включая Gemini 3 Flash, Claude, ChatGPT, Grok, DeepSeek, Mistral, Qwen 3.6, Kimi 2.6, GLM-5, Gemma 4 32b Step 3.7 Flash и Nemotron 3 Ultra. Визуальные метрики, сгенерированные через скрипт Colab, анализируют возмущение многообразия с помощью карт ширины каналов, дрейфа фазового пространства, геометрической плотности и эффективности промпта. Пост призывает сообщество предоставить обратную связь о том, действительно ли техника возмущает многообразие или лишь вызывает стилистические вариации.