Leanstral 1.5 — это бесплатная модель с лицензией Apache-2.0, имеющая 6B активных параметров, которая обеспечивает значительное улучшение производительности в формальной верификации и анализе кода. Она достигает результатов уровня state-of-the-art на множестве бенчмарков и обнаруживает ранее неизвестные баги в репозиториях с открытым исходным кодом.

  • Полностью решает miniF2F (100% на наборах данных validation и test).
  • Решает 587/672 задач PutnamBench, превосходя Seed-Prover 1.5 при значительно меньших затратах.
  • Достигает новых результатов уровня state-of-the-art: 87% на FATE-H и 34% на FATE-X.
  • Обнаруживает 5 ранее не сообщавшихся багов в 57 протестированных репозиториях с помощью автоматизированного пайплайна.
  • Демонстрирует сильное масштабирование во время тестирования, решая 587 задач при бюджете в 4M токенов.

Модель делает практическую формальную верификацию возможной, делая строгую инженерную работу с доказательствами более доступной и экономически эффективной для реальных кодовых баз.