Katie Moussouris, experta en ciberseguridad, informó que Anthropic compartió con ella el informe de jailbreak Fable para su evaluación. Señaló que Fable se negó a analizar código inseguro, pero accedió cuando se le pidió corregirlo, describiendo esto como el modelo funcionando según lo previsto en la defensa cibernética.
La Casa Blanca intensifica su guerra contra Anthropic
Traducido del English → Español