arxiv arXiv cs.AI · hace 1 h · fuente: hace 10 d · research

Fusión global aprendible para tokenización de longitud variable en Transformers de difusión

Traducido del English → Español

Un nuevo tokenizador de longitud variable utiliza fusión global aprendible para permitir la alineación de representaciones entre longitudes en modelos de difusión. Este enfoque independiente de los datos supera la semántica dependiente de la posición y mejora el equilibrio entre calidad y costo computacional en la generación de ImageNet 256×256 en comparación con métodos anteriores.

Importancia 2/3 Nueva función frente a los líderes arXiv cs.AI Allen AI Hugging Face OpenAI Evaluation & benchmarks Image generation Training methods

Leer original