El Proyecto UCTF ha sido reestructurado desde una única propuesta en un programa de investigación abierto y basado en hipótesis para investigar si las representaciones intermedias nativas para máquinas pueden reducir la redundancia semántica intercultural en el entrenamiento de IA multilingüe.

El proyecto está organizado en cinco artículos distintos: medir la redundancia semántica en corpus multilingües, caracterizar el conocimiento universal frente al específico del idioma, definir los requisitos de diseño para la representación, desarrollar un prototipo y validar el rendimiento inicial del entrenamiento. La iniciativa opera bajo principios de investigación abierta, comprometiéndose a publicar todos los resultados independientemente del resultado e invitando a la comunidad a proporcionar comentarios sobre conjuntos de datos, puntos de referencia y metodología.

Este enfoque por etapas permite que el trabajo anterior conserve valor incluso si las etapas posteriores fallan, asegurando que el proyecto evolucione basándose en evidencia empírica en lugar de suposiciones.