Все статьи — korshunov.ai

Все статьи Страница 1 / 114

Триада Волков: роль Шута для многошагового понимания теории разума в больших языковых моделях

Исследователи расширили игру «Волки и овцы», добавив роль Шута, чтобы создать триадную среду социального дедуктирования, требующую рассуждений над тремя противоположными функциями полезности, что бросает вызов возможностям больших языковых моделей в области теории разума. Оценки на GPT-4.1, DeepSeek-V3.1 и Llama-3.3-70B показали, что хотя Шут выигрывал 60–70% игр, волки GPT-4.1 часто голосовали за изгнание Шута в первый день в 60–70% случаев — это самоподрывающее действие, обусловленное языковыми приоритетами.

arxiv arXiv cs.CL · 6 ч назад

Решение геометрических задач с верификацией: Автоформализация и предложение теорем на основе решателя

Исследователи предлагают SD-GPS, фреймворк для решения геометрических задач, управляемый решателем, который устраняет узкие места в автоформализации и предсказании теорем, рассматривая символьный решатель как оракул выполнения. Этот подход объединяет адаптированное формального языка с учителем (supervised) и обучение с подкреплением, направляемое выполнимостью, чтобы обеспечить исполняемость во время формализации.

arxiv arXiv cs.CL · 6 ч назад

VASAE: Именование направлений словаря SAE с помощью привязки к словарю

Авторы представляют Vocabulary-Aligned Sparse Autoencoder (VASAE), метод, который обучает признаки разреженного автоэнкодера с использованием привязки к словарю для присвоения каждому признаку внутреннего имени токена на основе ближайшего вложения в словаре Трансформера.

arxiv arXiv cs.CL · 6 ч назад

Убеждающее позиционирование ИИ в коллективных дилеммах

Исследование с участием 1283 человек проверило, могут ли ИИ-ассистенты повысить уровень сотрудничества в повторяющихся играх коллективного риска посредством персонализированного убеждающего позиционирования на основе профилей ориентации социальной ценности. Исследование показало, что хотя просоциальные подталкивания значительно увеличили объемы взносов и показатели успеха группы, эти эффекты были кратковременными.

Триада Волков: роль Шута для многошагового понимания теории разума в больших языковых моделях

Решение геометрических задач с верификацией: Автоформализация и предложение теорем на основе решателя

VASAE: Именование направлений словаря SAE с помощью привязки к словарю

Убеждающее позиционирование ИИ в коллективных дилеммах

Эмпирический анализ фактических ошибок в текстах, написанных человеком, и его применение

Многоэтапная объяснимая система для выявления когнитивных нарушений по речи

ToxiREX: Набор данных по токсичному REasoning в ConteXt

Диалог к обнаружению: мультимодальный гибридный NLP-конвейер для выявления мошенничества со страховыми выплатами

Матрица покрытия сигналов: Стратификация ошибок типа и семантических ошибок при автоматической формализации утверждений

Гибридный подход на основе дерева мыслей для суммаризации судебных решений

DG^VoiC: Кластеризация говорящих для расследования мошенничества в условиях реальных колл-центров

LLM хуже оценивают, чем генерируют в контекстном QA

MultiHashFormer: Генеративные языковые модели на основе хеширования

Слияние данных с одним и несколькими истинами с использованием больших языковых моделей

Предел масштабирования случайной языковой модели

Мониторы на основе механизма для превентивного обнаружения нестабильности обучения LLM

От токенов к состояниям: LLM как частный случай мировых моделей

Epi2Diff: Использование трасс рассуждений LLM для предсказания сложности заданий для человека

HPRO: Иерархическая прогрессивная оптимизация вознаграждения для эмоционального TTS

Vision-Default, Prior-Override: Каузальные механизмы конфликта восприятия и знаний в моделях визуального языка