AMD представила Micro-World, интерактивную модель мира, управляемую действиями, предназначенную для генерации высококачественных сцен с открытой областью. Проект построен на базе семейства моделей Wan2.1 и поддерживает варианты image-to-world (I2W) и text-to-world (T2W).
Команда выпустила веса модели, полный код обучения и вывода, а также курируемый набор данных для управляемого моделирования мира. Вариант T2W использует ControlNet для стабильности, в то время как вариант I2W применяет adaLN для обеспечения легковесного размера параметров.
Этот выпуск направлен на стимулирование открытых исследований и практического внедрения в сообществе за счет предоставления исчерпывающих ресурсов для создания интерактивных моделей мира.