Presentación de COGNITIVE ATROPHY BENCH para interacciones de salud mental con LLM
Un nuevo benchmark, COGNITIVE ATROPHY BENCH, mide cómo los LLM inducen deterioro cognitivo en conversaciones de salud mental. Construido a partir de 1,576 sesiones de consejería generadas por humanos y evaluado por expertos clínicos, identifica patrones como consejos directivos y validación que pueden reducir la autonomía del usuario. La herramienta introduce métricas como UIRI y ARI para evaluar el riesgo de atrofia y rastrear trayectorias conductuales a lo largo de las interacciones con el usuario.