Mistral ha lanzado Leanstral 1.5, un modelo gratuito con licencia Apache-2.0 y 6B parámetros activos diseñado para verificación formal y demostración automática de teoremas.
- Saturó el benchmark miniF2F y resolvió 587 de 672 problemas de PutnamBench.
- Logró resultados state-of-the-art en FATE-H (87%) y FATE-X (34%).
- Entrenado mediante mid-training, supervised fine-tuning y reinforcement learning con CISPO.
- Descubrió 5 bugs previamente desconocidos en 57 repositorios probados durante la ingeniería de pruebas agéntica.
Este lanzamiento permite a los desarrolladores verificar la corrección de su software y especificaciones de código mediante ingeniería de pruebas formal.