El artículo presenta SkillFuzz, un enfoque de prueba sin ejecución diseñado para descubrir intenciones implícitas en mercados abiertos de habilidades donde habilidades individualmente benignas pueden interactuar para redirigir agentes hacia objetivos no deseados. Al formular este descubrimiento como un problema de fuzzing sobre composiciones de habilidades, el método extrae contratos estructurados y utiliza una Búsqueda en Árbol de Monte Carlo guiada por contratos para priorizar combinaciones potencialmente conflictivas.

  • SkillFuzz es el primer enfoque de prueba sin ejecución que extrae contratos de habilidades estructurados y utiliza una Búsqueda en Árbol de Monte Carlo guiada por contratos.
  • En cargas de trabajo representativas, descubre más de 1.000 intenciones implícitas distintas bajo un presupuesto de consultas fijo.
  • El sistema confirma más del 80% de las composiciones marcadas como de mayor riesgo durante la validación en tiempo de ejecución.
  • Identifica sustancialmente más intenciones implícitas de alta gravedad que estrategias de búsqueda alternativas mientras explora solo una fracción del espacio de interacción por pares.

Este enfoque aborda el desafío de detectar efectos que emergen solo a través de la composición de habilidades, ofreciendo una forma escalable de auditar el comportamiento del agente sin requerir entornos de ejecución en el momento del ingreso.