Seorang pengguna Reddit telah membagikan tangkapan layar interaksi dengan Claude yang menunjukkan bahwa model tersebut mungkin rentan terhadap injeksi prompt literal. Postingan tersebut, yang dikirim ke r/LocalLLaMA dan ditautkan dari r/LLMDevs, menyoroti potensi kekhawatiran keamanan ini mengenai sistem AI Anthropic.

  • Bukti berasal dari satu insiden yang dilaporkan melibatkan Claude.
  • Masalah ini digambarkan sebagai "mungkin" daripada dikonfirmasi.
  • Tidak ada detail teknis atau benchmark lebih lanjut yang disediakan dalam sumbernya.