Авторы предлагают многоагентную архитектуру, которая очищает извлеченный контент в системах Retrieval-Augmented Generation (RAG) посредством семантической переформулировки для предотвращения утечки конфиденциальных данных из вредоносных запросов. Используя три специализированных агента для извлечения конфиденциальной информации, семантического анализа и реконструкции, подход удаляет чувствительные идентификаторы, сохраняя основной смысл текста.

  • Оценено на наборах данных ChatDoctor и Wiki-PII в рамках шести больших языковых моделей, что позволило снизить количество случаев раскрытия целевой информации в LLaMA-3-8B с 144 до 1.
  • Сохраняет высокую контекстуальную точность со значением BLEU-1 равным 0.122, превосходя метод SAGE (0.117).
  • Работает как асинхронный модуль предварительной обработки, где переформулировка выполняется как одноразовый офлайн-этап, не добавляя задержек при онлайн-инференсе.

Архитектура эффективно снижает риски для конфиденциальности в чувствительных сценариях без ущерба для контекстуальной точности или увеличения задержки инференса.