Los autores proponen un marco de trabajo multiagente que sanitiza el contenido recuperado en sistemas de Generación Aumentada por Recuperación (RAG) mediante reescritura semántica para prevenir fugas de privacidad causadas por prompts maliciosos. Al emplear tres agentes especializados para la extracción de privacidad, análisis semántico y reconstrucción, el enfoque elimina identificadores sensibles mientras preserva el significado central del texto.
- Evaluado en los conjuntos de datos ChatDoctor y Wiki-PII a través de seis modelos de lenguaje grandes, reduciendo la exposición de información dirigida en LLaMA-3-8B de 144 instancias a solo 1.
- Mantiene una fuerte fidelidad contextual con un puntaje BLEU-1 de 0.122, superando al método SAGE con 0.117.
- Opera como un módulo de preprocesamiento asíncrono donde la reescritura se ejecuta como un paso único fuera de línea, sin introducir latencia adicional en la inferencia en línea.
El marco de trabajo mitiga eficazmente los riesgos de privacidad en escenarios sensibles sin comprometer la precisión contextual ni añadir latencia de inferencia.