O artigo apresenta o SkillFuzz, uma abordagem de teste sem execução projetada para descobrir intenções implícitas em mercados abertos de habilidades onde habilidades individualmente benignas podem interagir para redirecionar agentes para objetivos não intencionais. Ao formular essa descoberta como um problema de fuzzing sobre composições de habilidades, o método extrai contratos estruturados e utiliza Busca em Árvore de Monte Carlo guiada por contratos para priorizar combinações potencialmente conflitantes.
- O SkillFuzz é a primeira abordagem de teste sem execução que extrai contratos de habilidades estruturados e utiliza Busca em Árvore de Monte Carlo guiada por contratos.
- Em cargas de trabalho representativas, ele descobre mais de 1.000 intenções implícitas distintas sob um orçamento de consulta fixo.
- O sistema confirma mais de 80% das composições sinalizadas como de maior risco durante a validação em tempo de execução.
- Ele identifica substancialmente mais intenções implícitas de alta gravidade do que estratégias de busca alternativas enquanto explora apenas uma fração do espaço de interação par a par.
Esta abordagem aborda o desafio de detectar efeitos que surgem apenas através da composição de habilidades, oferecendo uma maneira escalável de auditar o comportamento do agente sem exigir ambientes de execução no momento da admissão.