Ex-Omni permite geração de animação facial 3D para LLMs omnimodais
Pesquisadores lançaram o Ex-Omni, um sistema público que gera respostas omnimodais a partir de entrada de texto ou fala. O modelo produz texto de resposta, unidades de fala ou áudio decodificado, e coeficientes de blendshape facial de 52 dimensões.