arxiv arXiv cs.CL · 1時間前 · ソース: 2日前 · research

PhysMani: 動的物体操作のための物理法則に基づく3Dワールドモデル

翻訳元 English → 日本語

研究者らは、PhysManiを提案する。これは、構造化されていない3D環境で高速移動する対象の操作における課題に対処するため、物理法則に基づく3Dガウスワールドモデルと未来予測対応アクションポリシーモデルを結合したフレームワークである。

ワールドモデルは、物理的に根拠のある将来のダイナミクス予測のために、オンライン最適化を通じて発散のないガウス速度場を学習する。
ポリシーモデルは、学習可能なトークンベースのクロスアテンションモジュールを通じて、予測された3Dシーン未来のダイナミクスを統合する。
著者らは、16のタスクで構成される動的操作ベンチマークであるPhysMani-Benchを導入した。
PhysManiは、シミュレーションと実世界のロボット実験の両方で、強力なベースラインを上回る優れた成功率を示している。

このアプローチは、具現化AIシステムに対して正確な3Dジオメトリと物理的に意味のある予測を提供する。

重要度 1/3 arXiv cs.CL Research paper Robotics

原文を読む