Tencent Hunyuan (HF) — korshunov.ai

Fuente · Tencent Hunyuan (HF)

Ex-Omni permite la generación de animación facial 3D para LLMs omnimodales

Los investigadores han lanzado Ex-Omni, un sistema público que genera respuestas omnimodales a partir de entradas de texto o voz. El modelo produce texto de respuesta, unidades de habla o audio decodificado, y coeficientes de blendshape facial de 52 dimensiones.