Tencent Hunyuan (HF) — korshunov.ai

Source · Tencent Hunyuan (HF)

Ex-Omni permet la génération d'animation faciale 3D pour les LLM omni-modaux

Des chercheurs ont publié Ex-Omni, un système public qui génère des réponses omni-modales à partir d'une entrée textuelle ou vocale. Le modèle produit du texte de réponse, des unités vocales ou de l'audio décodé, ainsi que des coefficients de blendshape facial en 52 dimensions.