Ex-Omni permite la generación de animación facial 3D para LLMs omnimodales
Los investigadores han lanzado Ex-Omni, un sistema público que genera respuestas omnimodales a partir de entradas de texto o voz. El modelo produce texto de respuesta, unidades de habla o audio decodificado, y coeficientes de blendshape facial de 52 dimensiones.