Leanstral 1.5는 6B의 활성 파라미터를 가진 Apache-2.0 라이선스 무료 모델로, 형식 검증 및 코드 분석에서 상당한 성능 향상을 제공합니다. 여러 벤치마크에서 최첨단 결과를 달성하고 오픈소스 저장소에서 이전에 알려지지 않은 버그를 발견했습니다.

  • miniF2F를 완전히 포화 (검증 및 테스트 세트에서 100%).
  • PutnamBench 문제 672개 중 587개를 해결하여 Seed-Prover 1.5보다 우수한 성능을 보이며 비용은 훨씬 적게 듭니다.
  • FATE-H에서 87%, FATE-X에서 34%의 새로운 최첨단 점수를 달성했습니다.
  • 자동화 파이프라인을 사용하여 테스트된 57개 저장소에서 이전에 보고되지 않은 5개의 버그를 발견했습니다.
  • 테스트 시간 확장성을 보여주며, 4M 토큰 예산으로 587개의 문제를 해결했습니다.

이 모델은 실제 코드베이스에 대해 엄격한 증명 공학을 더 접근 가능하고 비용 효율적으로 만들어 실용적인 형식 검증을 가능하게 합니다.