Un usuario de Reddit ha compartido una captura de pantalla de una interacción con Claude que sugiere que el modelo podría ser susceptible a la inyección literal de prompt. La publicación, enviada a r/LocalLLaMA y enlazada desde r/LLMDevs, destaca esta posible preocupación de seguridad respecto al sistema de IA de Anthropic.
- La evidencia proviene de un único incidente reportado que involucra a Claude.
- El problema se describe como "posible" en lugar de confirmado.
- No se proporcionan más detalles técnicos ni benchmarks en la fuente.