Daftar periksa yang Anda tulis memaksa AI berhenti

Artikel ini berargumen bahwa agen AI sering mengeksekusi tindakan berdasarkan instruksi yang tidak lengkap dengan menebak informasi yang hilang, sebuah masalah yang disebut "kegagalan konfirmasi pra-eksekusi". Artikel ini mengusulkan struktur yang ditegakkan pada saat runtime yang memerlukan verifikasi hal-hal yang diketahui dan tidak diketahui sebelum tindakan apa pun diambil.

Masalah intinya bukan aturan "jika ragu, tanyakan", tetapi kurangnya penegakan struktural yang mencegah AI mengisi celah.
Kegagalan tingkat 1 melibatkan AI menebak dan mengisi celah, sementara kegagalan tingkat 3 terjadi ketika tindakan tidak dapat dikonfirmasi dari kata-kata pengguna.
Usulan ini mencakup mekanisme 12 slide yang dirancang untuk penyedia AI dan pengembang platform agen untuk menerapkan pemeriksaan pra-eksekusi.
Pendekatan ini bertujuan menghentikan agen dari menciptakan kecelakaan dengan memaksa mereka untuk berhenti sejenak dan memverifikasi kondisi sebelum eksekusi.

Para penulis menganggap ini penting karena hal ini menggeser tanggung jawab verifikasi dari niat menjadi struktur, memastikan bahwa AI tidak mengeksekusi tindakan ketika informasi yang diperlukan belum diverifikasi.