Auditoría de la inestabilidad conductual sensible al encuadre en LLMs para salud mental
Este estudio investiga cómo las preocupaciones semánticamente similares presentadas a través de diferentes encuadres contextuales elicitan respuestas variables en modelos de lenguaje grandes ajustados por instrucciones, desafiando potencialmente la fiabilidad del sistema. Utilizando prompts controlados emparejados y análisis de sondeo capa por capa, los autores demuestran que el encuadre altera sistemáticamente las tendencias de respuesta interpretativa a través de múltiples arquitecturas de modelos.