Mistral은 형식 검증 및 자동 정리 증명을 위해 설계된 6B의 활성 파라미터를 가진 Apache-2.0 라이선스의 무료 모델인 Leanstral 1.5를 출시했습니다.
- miniF2F 벤치마크에서 포화 상태에 도달하며 PutnamBench 문제 672개 중 587개를 해결.
- FATE-H(87%)와 FATE-X(34%)에서 최첨단 결과 달성.
- CISPO를 사용한 미드 트레이닝, 지도 미세 조정 및 강화 학습을 통해 훈련됨.
- 에이전트 증명 엔지니어링 동안 테스트된 57개의 저장소에서 이전에 알려지지 않은 5개의 버그 발견.
이 릴리스를 통해 개발자는 형식 증명 엔지니어링을 통해 소프트웨어 및 코드 사양의 정확성을 검증할 수 있습니다.