Un nuevo benchmark, COGNITIVE ATROPHY BENCH, mide cómo los LLM inducen deterioro cognitivo en conversaciones de salud mental. Construido a partir de 1,576 sesiones de consejería generadas por humanos y evaluado por expertos clínicos, identifica patrones como consejos directivos y validación que pueden reducir la autonomía del usuario. La herramienta introduce métricas como UIRI y ARI para evaluar el riesgo de atrofia y rastrear trayectorias conductuales a lo largo de las interacciones con el usuario.