Indicaciones de seguridad y privacidad en conversaciones usuario-LLM

Un estudio de 14.727 indicaciones de seguridad y privacidad de 3,2M de conversaciones reales entre usuarios y LLMs identifica nueve categorías de preguntas de S&P. El análisis temático y las pruebas de respuesta muestran que los LLMs comerciales superan a los modelos abiertos, con GPT 5.5 proporcionando buenas respuestas en el 98% de las indicaciones frente al 47% de Llama 4, aunque algunos modelos comerciales producen respuestas inconsistentes entre ejecuciones.