Los transformers de cadena de pensamiento (CoT) pueden simular eficientemente algoritmos de Word RAM con una sobrecarga solo polilogarítmica. Esta eficiencia mejora a log-cuadrado para conjuntos de instrucciones planos y logarítmico para aquellos sin multiplicación, en contraste con las simulaciones anteriores de máquinas de Turing que requieren una sobrecarga cuadrática.