Исследователи предлагают SD-GPS, фреймворк для решения геометрических задач, управляемый решателем, который устраняет узкие места в автоформализации и предсказании теорем, рассматривая символьный решатель как оракул выполнения. Этот подход объединяет адаптированное формального языка с учителем (supervised) и обучение с подкреплением, направляемое выполнимостью, чтобы обеспечить исполняемость во время формализации.
- Фреймворк использует QwenVL3-2B для объединения адаптированного формального языка с учителем и обучения с подкреплением, направляемого выполнимостью, в единый модуль.
- Предлагаемая верифицируемая теорема (Verified Theorem Proposing) внедряет агента, aware of impasses (осознающего тупики), который предлагает локальные вспомогательные леммы из текущих состояний доказательства.
- Все предложенные теоремы фильтруются через символьную верификацию для обеспечения корректности.
- Эмпирические оценки на Geometry3K и PGPS9K показывают, что SD-GPS превосходит существующие методы MLLM, нейронные и нейро-символические подходы в стандартных режимах завершения, множественного выбора и кросс-модальной ссылки.
Замыкание контура между мультимодальным восприятием и символьным выполнением значительно улучшает геометрическое рассуждение, предлагая инсайты о том, как нейронные агенты могут быть заземлены формальными системами для достижения способностей к верифицируемому решению задач.