Leanstral 1.5 — это бесплатная модель с лицензией Apache-2.0, имеющая 6B активных параметров, которая обеспечивает значительное улучшение производительности в формальной верификации и анализе кода. Она достигает результатов уровня state-of-the-art на множестве бенчмарков и обнаруживает ранее неизвестные баги в репозиториях с открытым исходным кодом.
- Полностью решает miniF2F (100% на наборах данных validation и test).
- Решает 587/672 задач PutnamBench, превосходя Seed-Prover 1.5 при значительно меньших затратах.
- Достигает новых результатов уровня state-of-the-art: 87% на FATE-H и 34% на FATE-X.
- Обнаруживает 5 ранее не сообщавшихся багов в 57 протестированных репозиториях с помощью автоматизированного пайплайна.
- Демонстрирует сильное масштабирование во время тестирования, решая 587 задач при бюджете в 4M токенов.
Модель делает практическую формальную верификацию возможной, делая строгую инженерную работу с доказательствами более доступной и экономически эффективной для реальных кодовых баз.