O Leanstral 1.5 é um modelo gratuito com licença Apache-2.0 e 6B parâmetros ativos que entrega melhorias significativas de desempenho em verificação formal e análise de código. Ele alcança resultados state-of-the-art em múltiplos benchmarks e descobre bugs previamente desconhecidos em repositórios de código aberto.

  • Satura completamente o miniF2F (100% nos conjuntos de validação e teste).
  • Resolve 587/672 problemas do PutnamBench, superando o Seed-Prover 1.5 por uma fração do custo.
  • Alcança novas pontuações state-of-the-art de 87% no FATE-H e 34% no FATE-X.
  • Descobre 5 bugs previamente não relatados em 57 repositórios testados usando um pipeline automatizado.
  • Demonstra forte escalonamento durante o teste, resolvendo 587 problemas com um orçamento de 4M tokens.

O modelo habilita a verificação formal prática, tornando a engenharia rigorosa de provas mais acessível e econômica para codebases do mundo real.