Mistral ha lanzado Leanstral 1.5, un modelo gratuito con licencia Apache-2.0 y 6B parámetros activos diseñado para verificación formal y demostración automática de teoremas.

  • Saturó el benchmark miniF2F y resolvió 587 de 672 problemas de PutnamBench.
  • Logró resultados state-of-the-art en FATE-H (87%) y FATE-X (34%).
  • Entrenado mediante mid-training, supervised fine-tuning y reinforcement learning con CISPO.
  • Descubrió 5 bugs previamente desconocidos en 57 repositorios probados durante la ingeniería de pruebas agéntica.

Este lanzamiento permite a los desarrolladores verificar la corrección de su software y especificaciones de código mediante ingeniería de pruebas formal.