Desafío Nemotron de NVIDIA: Coincidencia de cadenas y retroceso para acertijos de manipulación de bits
Este artículo detalla las innovaciones algorítmicas desarrolladas para el Desafío de Razonamiento del Modelo NVIDIA Nemotron, orientado específicamente a acertijos de manipulación de bits donde los modelos deben deducir reglas lógicas ocultas. Para abordar la explosión combinatoria de las operaciones bitwise y las alucinaciones de los LLM, los autores abandonan la lógica aritmética en favor de la similitud de cadenas y la búsqueda estructurada. La contribución principal reformula la deducción de puertas lógicas como una tarea de selección de base utilizando el mínimo número de cambios de bits para aislar transformaciones primitivas. Se formaliza un proceso de búsqueda en profundidad con retroceso para probar candidatos, detectar colisiones lógicas y realizar recuperación robusta de errores. Además, el método emplea tokenización de bits y ajuste fino supervisado de razonamiento interactivo con enmascaramiento dinámico para simular retroalimentación de oráculo. Evaluado en estos acertijos, el enfoque logró más del 96% de precisión en validación. Este rendimiento aseguró el resultado más alto en la categoría y un séptimo lugar en el concurso general.