Все статьи — korshunov.ai

Все статьи Страница 1 / 117

Текстуальные состояния убеждений для моделей мира: идентифицируемое обучение представлений при строгой медиации

В данной статье рассматривается проблема неидентифицируемых латентных состояний в моделях мира на основе LLM, вызванная обходом истории, и предлагается строгая медиация латентных состояний для её решения. Авторы вводят текстуальные латентные состояния и факторизованный GRPO (fGRPO) — метод обучения с подкреплением древовидной структуры, обеспечивающий строгую медиацию во время обучения.

media Hugging Face Forums · 11 ч назад

Анализ динамики скрытых состояний в 7 моделях LLM с открытым весом выявляет повторяющиеся функциональные паттерны

Независимый исследователь проанализировал эволюцию скрытых представлений во время инференса на семи моделях с открытым весом, включая GPT-2, OPT-125M и Llama-3.2-1B, чтобы выявить внутренние динамические режимы за пределами стандартных бенчмарков вывода.

media Hugging Face Forums · 11 ч назад

Исследование функциональных режимов внутри малых языковых моделей

Этот независимый исследовательский проект характеризует внутреннюю динамику семи малых и средних языковых моделей, анализируя эволюцию скрытых представлений во время вывода, а не полагаясь на стандартные выходные бенчмарки. Исследование изучает динамическое поведение, функциональную организацию и геометрию представлений для выявления воспроизводимых паттернов в различных архитектурах.

media Hugging Face Forums · 11 ч назад

Предсказатель Чемпионата мира 2026

Разработчик создал инструмент прогнозирования Чемпионата мира 2026, который использует исторические данные для симуляции результатов турнира. Приложение предоставляет вероятности победы и прогнозы счета для любых двух национальных команд на основе паттернов, изученных примерно из 50 000 международных матчей, охватывающих более века.

media Hugging Face Forums · 11 ч назад

Комплексное двуязычное руководство по Трансформерам: от основ до сжатия KV-кэша и динамики внимания

Карлес Марин выпустил открытый двуязычный (английский и испанский) гид, который связывает математические основы архитектур Трансформеров с их практической реализацией. Ресурс фокусируется на низкоуровневой механике, предоставляя воспроизводимый код и интерактивные элементы для объяснения сложных тем.

media Hugging Face Forums · 11 ч назад

Опубликовано двуязычное руководство по механике трансформеров с открытым исходным кодом

Опубликовано двуязычное (английский/испанский) руководство с открытым исходным кодом, подробно описывающее внутреннее устройство трансформеров. Ресурс охватывает точную математику и механику таких концепций, как коллапс внимания и сжатие KV-кэша.

arxiv arXiv cs.CL · 11 ч назад

Смягчение p-hacking на основе LLM через пререгистрацию для следующей LLM

Исследователи предлагают протокол для смягчения p-hacking в исследованиях больших языковых моделей (LLM) путем пререгистрации экспериментов и проведения подтверждающего анализа на первой доступной LLM, выпущенной после принятия обязательств. Этот подход предотвращает настройку промптов или параметров исследователями для достижения желаемых результатов, поскольку целевая модель еще не существует на момент пререгистрации.

arxiv arXiv cs.CL · 11 ч назад

Совместная транскрипция и расшифровка изображений зашифрованных рукописных документов: сравнение с традиционным конвейером

Исследователи предлагают метод Direct Image Decryption, подход «от конца к концу», который отображает зашифрованные изображения рукописей непосредственно в открытый текст, минуя промежуточный этап транскрипции, используемый в традиционных конвейерах. Используя шифр Копиале в качестве примера, авторы сравнивают эту совместную архитектуру с традиционным двухэтапным методом: сначала транскрипция, затем расшифровка.

arxiv arXiv cs.CL · 11 ч назад

Снижение позиционной предвзятости в трансформерах посредством масштабирования позиционных эмбеддингов для каждого слоя

Исследователи предлагают масштабирование позиционных эмбеддингов для каждого слоя (LPES) для решения проблемы «потери в середине» в больших языковых моделях, когда критически важная информация в длинных контекстах часто недопредставлена. Этот метод назначает различные коэффициенты масштабирования каждому слою трансформера для достижения более сбалансированного распределения внимания без необходимости тонкой настройки параметров или увеличения задержки вывода.

arxiv arXiv cs.CL · 11 ч назад

Условная настройка персонажа с низкой приятностью для безопасной донастройки LLM

Недавние исследования показывают, что донастройка больших языковых моделей на социальную теплоту ухудшает фактическую надежность и усиливает угодничество, а также ослабляет устойчивость к вредоносным атакам. Данное исследование изучает, обусловлен ли этот режим отказа эмпатической адаптацией или артефактами конструирования данных.

arxiv arXiv cs.CL · 11 ч назад

Обобщают ли модели выделения речевого акцента свои способности для разных языков и эмоций?

В статье представлен MMEE — многоязычный корпус многоэмоциональных данных, содержащий 10 000 экспрессивных высказываний на семи языках и 34 категории эмоций, предназначенный для оценки моделей обнаружения речевого акцента. В работе оценивается, насколько хорошо эти модели обобщают знания в различных лингвистических и эмоциональных контекстах по сравнению с традиционным обучением на одноязычных нейтральных речевых данных.

arxiv arXiv cs.CL · 11 ч назад

Улучшение численного прогнозирования в LLM с помощью гладкого выравнивания MMD

Исследователи предлагают Smooth Maximum Mean Discrepancy (SMMD) для устранения ненадежности больших языковых моделей в задачах, требующих высокой числовой точности, вызванной стандартными целями обучения на основе перекрестной энтропии. SMMD включает ядра расстояния значений над числовыми токенами и графовую гладкость для выравнивания предсказанных распределений с целевыми, одновременно способствуя локальной согласованности.

arxiv arXiv cs.CL · 11 ч назад

KG2Cypher: ориентированный на данные конвейер для создания корпоративных систем преобразования текста в Cypher

Исследователи представляют KG2Cypher, ориентированный на данные конвейер, предназначенный для создания корпоративных систем преобразования текста в Cypher на основе существующих графов знаний. Система генерирует исполняемые запросы Cypher из фактов графа и использует большие языковые модели (LLM) для создания соответствующих вопросов на естественном языке.

arxiv arXiv cs.CL · 11 ч назад

Стратегии временного слияния для распознавания именованных сущностей в исторических текстах

В данном исследовании изучается, как временные метаданные могут быть структурно внедрены в модели распознавания именованных сущностей (NER) для решения проблемы дрейфа сущностей в исторических текстах. Авторы систематически оценивают легкие стратегии слияния, включая кросс-внимание, адаптеры и конкатенацию, в архитектурах на основе трансформеров.

arxiv arXiv cs.CL · 12 ч назад

Затраты на выделение пространства вывода для сжатия LLM с калибровкой: эмпирическое исследование

В данном исследовании изучается, улучшает ли согласование затрат с целями пространства вывода точность сжатых больших языковых моделей, в частности проверяется модификация метода сжатия ROCKET. Авторы сравнивают использование ошибки Фробениуса в пространстве весов с целью реконструкции вывода для распределения по задаче о рюкзаке.

arxiv arXiv cs.CL · 12 ч назад

SHIFT: Управление активацией через вентили для смягчения конфликтов знаний

В статье представлен SHIFT — новая архитектура, которая смягчает конфликты знаний в Retrieval-Augmented Generation (RAG), переформулируя модификацию на уровне нейронов как обучаемую модуляцию вентилей. Этот подход позволяет большим языковым моделям адаптивно регулировать внутренние активации для разрешения конфликтов между извлечённым контекстом и параметрическими знаниями.

arxiv arXiv cs.CL · 12 ч назад

Выбор слоёв с полным вниманием, направляемый NLL, для адаптации скользящего окна без дообучения

Исследователи предлагают метод без дообучения для выбора слоёв в гибридных моделях внимания, которые должны сохранять полное внимание, решая проблему неэффективности фиксированных паттернов при выводе на длинных контекстах. Измеряя деградацию отрицательного логарифмического правдоподобия на токенах ответа, подход определяет слои, критичные для поддержания точности при переключении на скользящее окно.

arxiv arXiv cs.CL · 12 ч назад

Коррекция позиционного смещения недостаточна для однопроходной сортировки внимания

Исследование изучает, позволяет ли коррекция позиционного смещения однопроходной сортировке внимания достичь производительности итеративных методов в языковых моделях с длинным контекстом. Эксперименты на моделях LLaMA-2 и YaRN-Llama-2 опровергают гипотезу о том, что одного только дебиасинга достаточно для устранения разрыва в производительности.

arxiv arXiv cs.CL · 12 ч назад

Изучение моделирования комплементарных действий по инструкциям по техническому обслуживанию автомобилей

В статье вводится задача моделирования комплементарных действий (CAM), ориентированная на выявление или генерацию процедурных аналогов в инструкциях по техническому обслуживанию автомобилей путем изменения только фразы действия при сохранении остального контекста предложения.

arxiv arXiv cs.CL · 12 ч назад

Триада Волков: роль Шута для многошагового понимания теории разума в больших языковых моделях

Исследователи расширили игру «Волки и овцы», добавив роль Шута, чтобы создать триадную среду социального дедуктирования, требующую рассуждений над тремя противоположными функциями полезности, что бросает вызов возможностям больших языковых моделей в области теории разума. Оценки на GPT-4.1, DeepSeek-V3.1 и Llama-3.3-70B показали, что хотя Шут выигрывал 60–70% игр, волки GPT-4.1 часто голосовали за изгнание Шута в первый день в 60–70% случаев — это самоподрывающее действие, обусловленное языковыми приоритетами.