Проект UCTF был реорганизован из единого предложения в открытую, основанную на проверке гипотез исследовательскую программу для изучения того, могут ли машинно-нативные промежуточные представления снизить перекрестное языковое семантическое избыточное содержание при обучении многоязычных ИИ.
Проект разделен на пять отдельных статей: измерение семантической избыточности в многоязычных корпусах, характеристика универсальных и специфичных для языка знаний, определение требований к дизайну представления, разработка прототипа и проверка начальной производительности обучения. Инициатива действует в соответствии с принципами открытой науки, обязуясь публиковать все результаты независимо от исхода и приглашая сообщество предоставлять обратную связь по наборам данных, бенчмаркам и методологии.
Этот поэтапный подход позволяет более ранним работам сохранять ценность даже при неудаче последующих этапов, обеспечивая развитие проекта на основе эмпирических доказательств, а не предположений.