arXiv cs.AI — korshunov.ai — новости ML

Источник · arXiv cs.AI

Уязвимость ввода с помощью тройных фигурных скобок в Handlebars, позволяющая внедрять роли структуры

Тройное вставление фигурных скобок в Handlebars не защищает от внедрения ролей структуры, поскольку экранирование HTML нейтрализует только разделители в виде угловых скобок. Оно оставляет необработанными разделители в виде точки и хеш-символов Markdown, что позволяет атакующим перехватывать ходы модели. По умолчанию экранирование не защищает большинство семей разделителей и не может заменить структурное разделение инструкций и данных.

Уязвимость ввода с помощью тройных фигурных скобок в Handlebars, позволяющая внедрять роли структуры

Введение в COGNITIVE ATROSPHY BENCH для взаимодействий LLM в области психического здоровья

Переиспользование метакnowledge в обучении с усилением

TAC: Первый бенчмарк агентов по вопросам благополучия животных в ИИ

WEQA: Вопросы о здоровье в носимых устройствах с адаптивным запросом агентской логики

LEADS: агентское открытие гибридных моделей для кардиальной электрофизиологии

Исследование группы красных команд показывает, что передовые модели LLM остаются уязвимыми перед адаптивными атаками

RubricsTree: масштабируемая система оценки для персональных агентов здравоохранения

Визуальная проверка обеспечивает управление на этапе инференса и автономное улучшение политики

BinTrack: Открытый источник спектральный QA с двоичным поиском траектории

Голод учится: зависимость от каналов вознаграждения в ИИ

ActiveSAM: Быстрый и точный анализ семантической сегментации с открытым словарем

Синтетический личный опыт ИИ в поддержке уходчика

PseudoBench: Оценка устойчивости агентных систем автономного поиска к псевдонаучным утверждениям

Безопасность и приватность в диалогах пользователей с LLM

ScaFE: Использование больших языковых моделей для извлечения клинически значимых признаков шрамов

Кадровая ИИ-архитектура снижает ошибки диагностики в здравоохранении

Модели Вольтерры вводят дробную шум для генерации на основе счёта

HyGRAG: Единая платформа для контекст- и отношение-ориентированных графовых RAG

EAGG: Генерация захвата с учетом корпуса через геометрически осознанные графы условий