arxiv arXiv cs.AI · 1 д назад · ист: 6 д назад · research

Разделение декларативных и процедурных знаний в моделях визуально-языковых-действий

Переведено с English → Русский

w$^{2}$VLA вводит модульную модель визуально-языковых-действий, которая разделяет декларативные и процедурные знания. Структурирование потока информации позволяет обеспечить надежное копирование поведения и нулевое переносимость навыков на новые, несхожие объекты.

Важность 2/3 Новая фича по сравнению с лидерами arXiv cs.AI AI agents Multimodal Reasoning models

Оригинал