Тройное вставление фигурных скобок в Handlebars не защищает от внедрения ролей структур, поскольку экранирование HTML нейтрализует только разделители в виде угловых скобок. Оно не затрагивает разделители в виде точки и хеш-символа Markdown, что позволяет атакующим перехватывать ходы модели. По умолчанию экранирование не защищает большинство семей разделителей ролей и не может заменить структурное разделение инструкций и данных.
arxiv
arXiv cs.CL
·
8 д назад
·
research
Уязвимость ввода тройных фигурных скобок в Handlebars, позволяющая внедрять роли структур
Переведено с English → Русский
Важность 3/3
arXiv cs.CL
Microsoft Research
Anthropic
OpenAI
AI agents
Evaluation & benchmarks
Safety & alignment
Бенчмарки
| Бенчмарк | Модель | Результат |
|---|---|---|
| SWE-bench Verified | GPT-3.5 Turbo | 97% |
| SWE-bench Verified | Claude Haiku 4.5 | — |