A Mistral lançou o Leanstral 1.5, um modelo gratuito com licença Apache-2.0 e 6B parâmetros ativos, projetado para verificação formal e prova automática de teoremas.

  • Satura o benchmark miniF2F e resolve 587 dos 672 problemas do PutnamBench.
  • Alcança resultados state-of-the-art no FATE-H (87%) e FATE-X (34%).
  • Treinado via mid-training, supervised fine-tuning e reinforcement learning com CISPO.
  • Descobriu 5 bugs anteriormente desconhecidos em 57 repositórios testados durante a engenharia de provas agéntica.

Este lançamento permite que desenvolvedores verifiquem a correção de seu software e especificações de código por meio de engenharia de provas formal.