Mistral a publié Leanstral 1.5, un modèle gratuit sous licence Apache-2.0 avec 6 milliards de paramètres actifs conçu pour la vérification formelle et la preuve automatique de théorèmes.
- Sature le benchmark miniF2F et résout 587 des 672 problèmes de PutnamBench.
- Atteint des résultats à la pointe de la technologie sur FATE-H (87 %) et FATE-X (34 %).
- Entraîné via un mi-entraînement, un ajustement fin supervisé et un apprentissage par renforcement avec CISPO.
- A découvert 5 bugs auparavant inconnus dans 57 dépôts testés lors de l'ingénierie de preuve agentic.
Cette version permet aux développeurs de vérifier la correction de leurs logiciels et spécifications de code grâce à l'ingénierie de preuve formelle.