Pengguna Reddit melaporkan kemungkinan injeksi prompt literal oleh Anthropic

Seorang pengguna Reddit telah membagikan tangkapan layar interaksi dengan Claude yang menunjukkan bahwa model tersebut mungkin rentan terhadap injeksi prompt literal. Postingan tersebut, yang dikirim ke r/LocalLLaMA dan ditautkan dari r/LLMDevs, menyoroti potensi kekhawatiran keamanan ini mengenai sistem AI Anthropic.

Bukti berasal dari satu insiden yang dilaporkan melibatkan Claude.
Masalah ini digambarkan sebagai "mungkin" daripada dikonfirmasi.
Tidak ada detail teknis atau benchmark lebih lanjut yang disediakan dalam sumbernya.