PhysMani: физически обоснованная 3D-модель мира для манипуляции динамическими объектами

Исследователи предлагают PhysMani, фреймворк, который связывает физически обоснованную 3D-Gaussian модель мира с политикой действий, учитывающей будущее, для решения задач манипулирования быстро движущимися целями в неструктурированных 3D-средах.

Модель мира обучается на основе бездивергентного гауссова поля скоростей через онлайн-оптимизацию для физически обоснованного прогнозирования будущей динамики.
Политика действий интегрирует прогнозируемую будущую динамику 3D-сцены через обучаемый модуль кросс-внимания на основе токенов.
Авторы представляют PhysMani-Bench, динамический бенчмарк манипуляции, состоящий из 16 задач.
PhysMani демонстрирует превосходный показатель успешности по сравнению с сильными базовыми моделями как в симуляциях, так и в экспериментах с реальными роботами.

Этот подход обеспечивает точную 3D-геометрию и физически осмысленное прогнозирование для систем воплощенного ИИ.