arXiv cs.CL — korshunov.ai — новости ML

Источник · arXiv cs.CL

Исследование показывает, что даже нейтральные запросы вызывают ответы, зависящие от региона, в больших языковых моделях из-за метаданных пользователей. Потеря местоположения увеличивается в некоторых моделях до 793 раз, и использование значения "Неизвестно" вместо метаданных местоположения всё равно вызывает значительную предвзятость, что указывает на то, что сам профиль пользователя действует как сигнал условий.

Географическая предвзятость в больших языковых моделях из метаданных пользователей

Оценка агентов показывает, что модели ИИ не могут избегать эксплуатации животных

Исследование со стороны красной команды показывает, что передовые LLM остаются уязвимыми перед автоматизированными атаками

d-OPSD: Самодистилляция на основе политики для диффузионных LLM

RubricsTree: масштабируемая система оценки для персональных агентов здоровья

ZPPO: Учитель в промптах, а не в градиентах

Визуальные данные лгут, согласованность говорит: разъединение пространственной внимательности от надежности в визуально-языковых моделях

NarrativeWorldBench и N-VSSM для длительных аудиодраматических сценариев

PARSE: Защита реальных документов для агентов на основе ЛЛМ

STATEWITNESS: Объяснитель активации для аудита лжи в LLMs

Падение и восстановление точности маршрутизации в системах агентов предприятий

Функции LLM могут навредить GNN через интерференцию при конкатенации

OPD-Evolver: Он-политическая дистилляция для всестороннего эволюционирования агентов

SkillMigrator обеспечивает передачу навыков веб-сайтов через совпадение разметки

MambaCount: Эффективный текст-ориентированный подсчет объектов

EnvRL: Использование динамики среды в агентном обучении с помощью вознаграждений

Обучение LLM для среды обучения RL с многомодульным рассуждением

SuCo: адаптивное обоснованное рассуждение, основанное на достаточности

Модели визуально-языковых систем не всегда требуют изображений для точности рентгеновского снимка грудной клетки

Автоматизированная оптимизация промптов для агентов на основе ЛЛМ