Leanstral 1.5 adalah model gratis berlisensi Apache-2.0 dengan 6B parameter aktif yang memberikan peningkatan kinerja signifikan dalam verifikasi formal dan analisis kode. Model ini mencapai hasil state-of-the-art pada berbagai benchmark dan mengungkap bug yang sebelumnya tidak diketahui di repositori open-source.
- Memenuhi miniF2F sepenuhnya (100% pada set validasi dan uji).
- Menyelesaikan 587/672 masalah PutnamBench, mengungguli Seed-Prover 1.5 dengan biaya sepersekian.
- Mencapai skor state-of-the-art baru sebesar 87% pada FATE-H dan 34% pada FATE-X.
- Mengungkap 5 bug yang sebelumnya tidak dilaporkan di 57 repositori yang diuji menggunakan pipeline otomatis.
- Menunjukkan skalabilitas waktu uji yang kuat, menyelesaikan 587 masalah dengan anggaran token 4M.
Model ini memungkinkan verifikasi formal yang praktis dengan membuat rekayasa bukti yang ketat lebih mudah diakses dan hemat biaya untuk basis kode dunia nyata.