Usuário do Reddit relata possível injeção literal de prompt pela Anthropic

Um usuário do Reddit compartilhou uma captura de tela de uma interação com o Claude que sugere que o modelo pode ser suscetível à injeção literal de prompt. A postagem, enviada para r/LocalLLaMA e vinculada a partir de r/LLMDevs, destaca essa possível preocupação de segurança em relação ao sistema de IA da Anthropic.

A evidência vem de um único incidente relatado envolvendo o Claude.
O problema é descrito como "possível" em vez de confirmado.
Não há mais detalhes técnicos ou benchmarks fornecidos na fonte.