Makalah ini memperkenalkan SkillFuzz, sebuah pendekatan pengujian bebas eksekusi yang dirancang untuk menemukan intent implisit di pasar keterampilan terbuka di mana keterampilan yang secara individual tidak berbahaya dapat berinteraksi untuk mengalihkan agen menuju tujuan yang tidak diinginkan. Dengan memformulasikan penemuan ini sebagai masalah fuzzing atas komposisi keterampilan, metode ini mengekstrak kontrak terstruktur dan menggunakan Pencarian Pohon Monte Carlo yang dipandu kontrak untuk memprioritaskan kombinasi yang berpotensi konflik.

  • SkillFuzz adalah pendekatan pengujian bebas eksekusi pertama yang mengekstrak kontrak keterampilan terstruktur dan memanfaatkan Pencarian Pohon Monte Carlo yang dipandu kontrak.
  • Di bawah beban kerja perwakilan, ia menemukan lebih dari 1.000 intent implisit berbeda di bawah anggaran kueri tetap.
  • Sistem mengonfirmasi lebih dari 80% komposisi berisiko tertinggi yang ditandai selama validasi waktu eksekusi.
  • Ia mengidentifikasi jauh lebih banyak intent implisit tingkat tinggi daripada strategi pencarian alternatif sambil hanya menjelajahi sebagian kecil dari ruang interaksi pasangan.

Pendekatan ini mengatasi tantangan mendeteksi efek yang muncul hanya melalui komposisi keterampilan, menawarkan cara yang skalabel untuk melakukan audit perilaku agen tanpa memerlukan lingkungan eksekusi saat waktu masuk.