Все статьи — korshunov.ai

Все статьи Страница 1 / 102

OPID: Дистилляция навыков on-policy для агентного обучения с подкреплением

Авторы предлагают OPID — фреймворк, который извлекает надзор по навыкам непосредственно из завершенных траекторий on-policy для решения проблемы разреженных наград в обучении с подкреплением, ориентированном на результат. Представляя ретроспективу траектории в виде иерархических навыков, OPID обеспечивает плотный надзор на уровне токенов с согласованным распределением без опоры на внешнюю память.

arxiv arXiv cs.CL · 4 ч назад

Вычислительное исследование лексической передачи в бенгальских преданных традициях

Компьютерное корпусное исследование анализирует связи лексики на восьми уровнях бенгальской и санскритской литературы преданных с VIII по XIX века, количественно подтверждая историческое утверждение о том, что лексика буддийского Ваджраяны была усвоена традицией Шакта-тантры. Используя векторизацию символьных n-грамм TF-IDF на 75 текстах, исследование предоставляет первое количественное подтверждение этой цепи лексической передачи.

arxiv arXiv cs.CL · 4 ч назад

KARLA: Дополнение базы знаний для извлечения информации языковыми моделями

Авторы предлагают KARLA — метод, позволяющий большим языковым моделям автоматически извлекать фактические знания из внешней базы знаний во время генерации токенов. Этот подход позволяет обновлять факты без переобучения модели и обеспечивает прослеживаемость результатов до исходных данных.

arxiv arXiv cs.CL · 4 ч назад

FBK: Long-form SpeechLLMs для IWSLT 2026 Instruction Following

В данной статье описывается подача FBK на общую задачу IWSLT 2026 Instruction Following, представляющая SpeechLLMs, разработанные как для коротких, так и для длинных форм следования инструкциям в условиях ограниченных ресурсов.

arxiv arXiv cs.CL · 4 ч назад

AgentX: К агент-управляемой самоитерации промышленных рекомендательных систем

AgentX — это развернутая в продакшене многоагентная система, предназначенная для автоматизации итераций промышленных рекомендательных систем, решающая проблему узкого места, при котором инновации масштабируются линейно в зависимости от количества сотрудников.

arxiv arXiv cs.CL · 4 ч назад

Каскадное многоуровневое прунинг-упрощение для вывода LLM на устройствах в промышленном IoT

В данной статье представлен каскадный фреймворк многоуровневого прунинга, предназначенный для развертывания больших языковых моделей на периферийных устройствах Промышленного Интернета Вещей (IIoT) путем удаления слоев, голов внимания и каналов прямого распространения в порядке от грубого к тонкому. Метод использует легковесное восстановление низкой ранговости между этапами для повторной оценки важности компонентов, решая проблему коллапса существующих методов структурированного прунинга при высоких коэффициентах сжатия.

arxiv arXiv cs.CL · 4 ч назад

InfoKV: Сжатие KV-кэша с учётом информации для длинных рассуждений

Исследователи представляют InfoKV, фреймворк, учитывающий энтропию, который сжимает ключ-значения кэши, объединяя предиктивную неопределённость на уровне токенов с баллами внимания для улучшения рассуждений в длинном контексте.

arxiv arXiv cs.CL · 4 ч назад

Гетерогенная нейронная предсказуемость языковых моделей при естественном понимании

В данном исследовании показано, что замороженные языковые модели могут служить эффективными нейронными предикторами мозговой активности при естественном восприятии речи и текста, при этом разделяя предсказательную полезность и утверждения о.shared нейронной организации. Анализ данных МЭГ и ЭкоГ выявил повсеместные положительные приросты предсказуемости по сравнению с базовыми моделями низкого уровня, хотя преимущества на уровне участников были локализованы, а не равномерны.

arxiv arXiv cs.CL · 4 ч назад

SamaVaani: Аудит и устранение смещения в многоязычной клинической ASR для индийских языков

В данном исследовании проводится аудит надежности восьми современных моделей автоматического распознавания речи на реальных данных психиатрических интервью на каннада, хинди и индийском английском. Результаты выявляют значительную вариативность между моделями и языками: некоторые системы демонстрируют конкурентоспособные результаты для индийского английского, но терпят неудачу при распознавании региональной речи.

arxiv arXiv cs.CL · 4 ч назад

GAVEL: Проверка и локализация ошибок в заземлённых подписях

Модации зрения и языка часто генерируют галлюцинированные выводы, где текст и изображения не совпадают, что требует методов, которые не только обнаруживают эти ошибки, но и объясняют их и локализуют визуальные доказательства. Авторы представляют GAVEL — задачу, предназначенную для совместного решения вопросов верификации, объяснения и локализации для пар изображений-текста, сопровождаемую соответствующим набором данных и бенчмарком.

arxiv arXiv cs.CL · 4 ч назад

Взлом для среднестатистического пользователя: выбор оптимальных взломов с помощью алгоритмов бандитов

В данном исследовании изучается возможность успешного взлома больших языковых моделей неопытными злоумышленниками путем использования алгоритмов бандитов для выбора оптимальных атак и улучшения запросов. Авторы предлагают новую стратегию атаки на основе многоармочного бандита, позволяющую эффективно обучаться лучшему взлому из большого набора вариантов через зашумленное исследование.

arxiv arXiv cs.CL · 5 ч назад

Индукция иерархии, центрированной на терминах, из гетерогенных корпусов

Исследователи предлагают терм-центричную структуру для индукции иерархических таксономий из разнообразных текстовых источников, устраняя ограничения существующих методов, опирающихся на представления уровня документа. Этот подход отображает документы в общее пространство представлений посредством автоматического извлечения терминов, что обеспечивает надежное выравнивание между источниками и построение интерпретируемых иерархий.

arxiv arXiv cs.CL · 5 ч назад

RedVox: Пробелы в безопасности и справедливости моделей речи на разных языках

Новое исследование выявляет значительные пробелы в безопасности и справедливости многоязычных моделей речи, обнаруживая, что лишь 8% современных релизов документируют какой-либо многоязычный анализ. Чтобы решить эту проблему, авторы представляют RedVox — бенчмарк, основанный на реальных голосах, охватывающий небезопасные запросы на пяти языках.

arxiv arXiv cs.CL · 5 ч назад

Мировые модели Эйнштейна: Визуализация контрфактов для рассуждений LLM

В статье представлены мировые модели Эйнштейна (EWMs) — фреймворк, предназначенный для улучшения рассуждений больших языковых моделей за счёт интеграции визуальных временных разверток в цепочку рассуждений. Этот подход позволяет моделям использовать мысленные эксперименты в качестве проверяемых гипотез для дополнения обработки на основе текста.

arxiv arXiv cs.CL · 5 ч назад

Аудит поведенческой нестабильности, чувствительной к фреймингу, в LLM для ментального здоровья

В данном исследовании изучается, как семантически схожие проблемы, представленные через различные контекстные фреймы, вызывают разные ответы у больших языковых моделей, настроенных по инструкциям, что может ставить под сомнение надежность системы. Используя контролируемые сопоставленные промпты и послойный анализ зондирования, авторы демонстрируют, что фрейминг систематически изменяет тенденции интерпретационного ответа в архитектурах нескольких моделей.

arxiv arXiv cs.CL · 5 ч назад

ReaORE: Извлечение открытых отношений, управляемое рассуждениями и реализуемое поэтапно с помощью больших моделей рассуждений

Исследователи предлагают ReaORE — фреймворк для извлечения открытых отношений, использующий большие модели рассуждений для достижения надежной обобщающей способности на невидимых типах отношений. Метод устраняет ограничения существующих подходов кластеризации и прямого генерирования посредством процесса рассуждений от грубого к тонкому.

arxiv arXiv cs.CL · 5 ч назад

Где модели находят счастье? Векторы эмоций в открыто-весовых больших языковых моделях

Это исследование исследует наличие и структуру векторов эмоций в открыто-весовых больших языковых моделях, конкретно Apertus-8B-Instruct-2509 и Gemma-4-E4B-it. Исследование подтверждает, что эти модели кодируют геометрию валентности с высокой корреляцией к человеческим психологическим структурам, приближаясь к уровням, ранее наблюдаемым в Claude Sonnet 4.5.

arxiv arXiv cs.CL · 5 ч назад

MinGram: Минималистичный униграммный токенизатор с высокой степенью сжатия и конкурентным морфологическим выравниванием

Авторы представляют MinGram, минималистичный униграммный токенизатор, который упрощает обучение за счет использования стартового словаря на основе BPE, жесткого EM на пути с минимальным количеством токенов и одного шага отсечения по плоскому скорингу. Этот подход устраняет необходимость в суффиксных массивах, прямых-обратных проходах и итеративных циклах отсечения, делая процедуру значительно менее сложной по сравнению со стандартными методами.

arxiv arXiv cs.CL · 5 ч назад

Улучшение калибровки вербализованной неопределенности в медицинском VQA

Данная работа решает проблему склонности мультимодальных больших языковых моделей выдавать излишне уверенные ответы в задачах медицинского визуального ответа на вопросы, предлагая основанную на обучении рамку, которая дообучает эти модели для лучшей калибровки. Метод использует составную функцию потерь, сочетающую калибровку по типу Брайера, регуляризацию якорей, контрастное выравнивание изображения и текста, а также члены KL-дивергенции для согласования уверенности модели с фактической правильностью.

arxiv arXiv cs.CL · 5 ч назад

Улучшение универсальных агентов ролевой игры на основе психологии обоснованного рассуждения и оптимизации политики с учетом роли

Исследователи предлагают Psy-CoT, основанный на психологии фреймворк цепочки рассуждений, который разбивает предварительное рассуждение перед ответом на Восприятие взаимодействия, Психологическую эмпатию и Логическую конструкцию для улучшения точности персонажа. Чтобы устранить несовпадение градиентов в обучении с подкреплением, они вводят Оптимизацию политики с учетом роли (RAPO), которая использует взаимную информацию токенов профиля для асимметричного взвешивания градиентов.