A Mistral lançou o Leanstral 1.5, um modelo gratuito com licença Apache-2.0 e 6B parâmetros ativos, projetado para verificação formal e prova automática de teoremas.
- Satura o benchmark miniF2F e resolve 587 dos 672 problemas do PutnamBench.
- Alcança resultados state-of-the-art no FATE-H (87%) e FATE-X (34%).
- Treinado via mid-training, supervised fine-tuning e reinforcement learning com CISPO.
- Descobriu 5 bugs anteriormente desconhecidos em 57 repositórios testados durante a engenharia de provas agéntica.
Este lançamento permite que desenvolvedores verifiquem a correção de seu software e especificações de código por meio de engenharia de provas formal.