تم إعادة هيكلة مشروع UCTF من اقتراح واحد إلى برنامج بحث مفتوح وموجه بالفرضيات للتحقيق فيما إذا كانت التمثيلات الوسيطة الأصلية للآلة يمكن أن تقلل من التكرار الدلالي عبر اللغات في تدريب الذكاء الاصطناعي متعدد اللغات.

ينظم المشروع في خمس أوراق بحثية متميزة: قياس التكرار الدلالي في المجموعات النصية متعددة اللغات، وصف المعرفة العالمية مقابل المعرفة الخاصة بلغة معينة، تحديد متطلبات التصميم للتمثيل، تطوير نموذج أولي، والتحقق من أداء التدريب الأولي. يعمل المبادرة تحت مبادئ البحث المفتوح، ملتزمة بنشر جميع النتائج بغض النظر عن النتيجة ودعوة المجتمع لتقديم ملاحظات حول مجموعات البيانات، والمعايير المرجعية، والمنهجية.

يتيح هذا النهج التدريجي للعمل السابق الاحتفاظ بقيمته حتى إذا فشلت المراحل اللاحقة، مما يضمن تطور المشروع بناءً على الأدلة التجريبية بدلاً من الافتراضات.