El autor analiza las condiciones bajo las cuales maximizar una función de utilidad proxy puede llevar a resultados perjudiciales. Este análisis sugiere que dichos escenarios plantean problemas significativos para la aplicación de la teoría de la decisión estándar. El texto destaca circunstancias específicas donde la optimización de un objetivo sustituto se desvía de los resultados esperados. Estos hallazgos desafían la robustez de los marcos teóricos actuales utilizados en inteligencia artificial y economía. Al identificar estos modos de fallo, el trabajo tiene como objetivo refinar cómo deben diseñarse los agentes para evitar consecuencias no deseadas.