본 논문은 SkillFuzz를 소개합니다. 이는 개별적으로 무해한 스킬이 상호작용하여 에이전트를 의도하지 않은 목표 방향으로 유도할 수 있는 공개 스킬 마켓플레이스에서 암시적 인텐트를 발견하도록 설계된 실행 불필요 테스트 접근법입니다. 이 발견을 스킬 구성에 대한 퍼징 문제로 공식화함으로써, 본 방법은 구조화된 계약을 추출하고 계약 기반 몬테카를로 트리 검색을 사용하여 잠재적으로 충돌하는 조합을 우선순위화합니다.

  • SkillFuzz는 구조화된 스킬 계약을 추출하고 계약 기반 몬테카를로 트리 검색을 활용하는 최초의 실행 불필요 테스트 접근법입니다.
  • 대표 워크로드에서 고정 쿼리 예산 하에 1,000개 이상의 고유한 암시적 인텐트를 발견합니다.
  • 시스템은 실행 시간 검증 동안 가장 높은 위험으로 플래그 지정된 구성의 80% 이상을 확인합니다.
  • 쌍별 상호작용 공간의 일부만 탐색하면서도 다른 검색 전략보다 훨씬 많은 고중요도 암시적 인텐트를 식별합니다.

이 접근법은 스킬 구성을 통해서만 나타나는 효과를 감지하는 과제를 해결하며, 도입 시 실행 환경을 필요로 하지 않고 에이전트 동작을 감사할 수 있는 확장 가능한 방법을 제공합니다.