MuPPET introduce un benchmark para la privacidad contextual en conversaciones entre múltiples partes. Los experimentos revelan que los modelos filtran significativamente más información privada en entornos grupales que en interacciones uno a uno, siendo los modelos de pesos abiertos más pequeños especialmente vulnerables. Las defensas de privacidad existentes proporcionan solo protección parcial y no abordan el problema central del seguimiento de las partes.
MuPPET: Benchmark para la privacidad de LLMs en múltiples partes
Traducido del English → Español