Um usuário do Reddit compartilhou uma captura de tela de uma interação com o Claude que sugere que o modelo pode ser suscetível à injeção literal de prompt. A postagem, enviada para r/LocalLLaMA e vinculada a partir de r/LLMDevs, destaca essa possível preocupação de segurança em relação ao sistema de IA da Anthropic.
- A evidência vem de um único incidente relatado envolvendo o Claude.
- O problema é descrito como "possível" em vez de confirmado.
- Não há mais detalhes técnicos ou benchmarks fornecidos na fonte.