Ex-Omni memungkinkan generasi animasi wajah 3D untuk LLM omni-modal
Para peneliti telah merilis Ex-Omni, sebuah sistem publik yang menghasilkan respons omni-modal dari input teks atau suara. Model ini menghasilkan teks respons, unit suara, atau audio yang didekode, serta koefisien blendshape wajah berdimensi 52.