В статье представлен SkillFuzz, подход к тестированию без выполнения, предназначенный для обнаружения неявных намерений в открытых маркетплейсах навыков, где индивидуально безопасные навыки могут взаимодействовать, перенаправляя агентов к непреднамеренным целям. Формулируя эту задачу как проблему фаззинга над композициями навыков, метод извлекает структурированные контракты и использует контрактно-управляемый поиск по дереву Монте-Карло для приоритизации потенциально конфликтующих комбинаций.
- SkillFuzz — это первый подход к тестированию без выполнения, который извлекает структурированные контракты навыков и использует контрактно-управляемый поиск по дереву Монте-Карло.
- На репрезентативных рабочих нагрузках он обнаруживает более 1 000 различных неявных намерений в рамках фиксированного бюджета запросов.
- Система подтверждает более 80% наиболее рискованных помеченных композиций во время проверки во время выполнения.
- Он выявляет существенно больше высокоуровневых неявных намерений, чем альтернативные стратегии поиска, исследуя лишь малую часть пространства попарного взаимодействия.
Этот подход решает задачу обнаружения эффектов, возникающих только через композицию навыков, предлагая масштабируемый способ аудита поведения агентов без необходимости в средах выполнения на этапе допуска.