Ex-Omni позволяет генерировать 3D-анимацию лица для омни-модальных LLM
Исследователи выпустили Ex-Omni, публичную систему, которая генерирует омни-модальные ответы на основе текстового или речевого ввода. Модель производит текстовый ответ, речевые единицы или декодированный аудиофайл, а также коэффициенты 52-мерных блендшейпов лица.