ReproRepo: Escalando auditorías de reproducibilidad con GitHub Issues
ReproRepo introduce un marco escalable que utiliza GitHub issues para evaluar la reproducibilidad de artículos de ML. Muestra que agentes LLM como Codex con GPT-5.5 identifican al menos un bloqueo en el 90% de los pares artículo-repositorio sin ejecutar código, aunque la localización exacta sigue siendo desafiante.