lab Tencent Hunyuan (HF) · 2 小时前 Ex-Omni 实现全模态大模型的 3D 面部动画生成 研究人员发布了 Ex-Omni,这是一个公开系统,可根据文本或语音输入生成全模态响应。该模型生成响应文本、语音单元或解码音频,以及 52 维的面部混合形状系数。