Un utilisateur de Reddit a partagé une capture d'écran d'une interaction avec Claude, suggérant que le modèle pourrait être vulnérable à l'injection de prompt littérale. Le post, soumis à r/LocalLLaMA et lié depuis r/LLMDevs, met en lumière cette préoccupation de sécurité potentielle concernant le système d'IA d'Anthropic.

  • La preuve provient d'un incident unique signalé impliquant Claude.
  • Le problème est décrit comme "possible" plutôt que confirmé.
  • Aucun détail technique ou benchmark supplémentaire n'est fourni dans la source.