Leanstral 1.5 एक मुफ्त Apache-2.0 लाइसेंस वाला मॉडल है जिसमें 6B सक्रिय पैरामीटर हैं जो औपचारिक सत्यापन और कोड विश्लेषण में महत्वपूर्ण प्रदर्शन सुधार प्रदान करता है। यह कई बेंचमार्क पर state-of-the-art परिणाम प्राप्त करता है और ओपन-सोर्स रिपॉजिटरी में पहले अज्ञात बग्स को उजागर करता है।
- miniF2F को पूरी तरह से संतृप्त करता है (validation और test सेट पर 100%)।
- PutnamBench की 587/672 समस्याओं को हल करता है, कम लागत पर Seed-Prover 1.5 से बेहतर प्रदर्शन करता है।
- FATE-H पर 87% और FATE-X पर 34% के नए state-of-the-art स्कोर प्राप्त करता है।
- एक स्वचालित प्लाइलाइन का उपयोग करके 57 परीक्षित रिपॉजिटरी में 5 पहले अरिपोर्ट किए गए बग्स को उजागर करता है।
- टेस्ट-टाइम स्केलिंग में मजबूत प्रदर्शन दिखाता है, 4M टोकन बजट के साथ 587 समस्याओं को हल करता है।
यह मॉडल व्यावहारिक औपचारिक सत्यापन को सक्षम बनाता है, वास्तविक दुनिया के कोडबेस के लिए कठोर प्रूफ इंजीनियरिंग को अधिक सुलभ और लागत-प्रभावी बनाकर।