O Leanstral 1.5 é um modelo gratuito com licença Apache-2.0 e 6B parâmetros ativos que entrega melhorias significativas de desempenho em verificação formal e análise de código. Ele alcança resultados state-of-the-art em múltiplos benchmarks e descobre bugs previamente desconhecidos em repositórios de código aberto.
- Satura completamente o miniF2F (100% nos conjuntos de validação e teste).
- Resolve 587/672 problemas do PutnamBench, superando o Seed-Prover 1.5 por uma fração do custo.
- Alcança novas pontuações state-of-the-art de 87% no FATE-H e 34% no FATE-X.
- Descobre 5 bugs previamente não relatados em 57 repositórios testados usando um pipeline automatizado.
- Demonstra forte escalonamento durante o teste, resolvendo 587 problemas com um orçamento de 4M tokens.
O modelo habilita a verificação formal prática, tornando a engenharia rigorosa de provas mais acessível e econômica para codebases do mundo real.