Mistral a publié Leanstral 1.5, un modèle gratuit sous licence Apache-2.0 avec 6 milliards de paramètres actifs conçu pour la vérification formelle et la preuve automatique de théorèmes.

  • Sature le benchmark miniF2F et résout 587 des 672 problèmes de PutnamBench.
  • Atteint des résultats à la pointe de la technologie sur FATE-H (87 %) et FATE-X (34 %).
  • Entraîné via un mi-entraînement, un ajustement fin supervisé et un apprentissage par renforcement avec CISPO.
  • A découvert 5 bugs auparavant inconnus dans 57 dépôts testés lors de l'ingénierie de preuve agentic.

Cette version permet aux développeurs de vérifier la correction de leurs logiciels et spécifications de code grâce à l'ingénierie de preuve formelle.