AnchorKV: Compresión de caché KV consciente de la seguridad con ancla de rechazo
AnchorKV introduce un mecanismo de penalización suave para sesionar la retención de tokens en la caché KV alejándola de direcciones de prompt dañinas. Utiliza una ancla de espacio de proyección de clave específica por capa derivada de la ingeniería de representaciones para mejorar la alineación de seguridad sin sacrificar mucha utilidad, ofreciendo una solución plug-in que mejora la defensa contra ataques de jailbreak.