Ex-Omni permet la génération d'animation faciale 3D pour les LLM omni-modaux
Des chercheurs ont publié Ex-Omni, un système public qui génère des réponses omni-modales à partir d'une entrée textuelle ou vocale. Le modèle produit du texte de réponse, des unités vocales ou de l'audio décodé, ainsi que des coefficients de blendshape facial en 52 dimensions.