プロジェクトUCTFは、単一の提案から、マルチリンガルAIトレーニングにおけるクロス言語意味的冗長性を削減できるかどうかを調査するための、オープンで仮説駆動型の研究プログラムへと再構築されました。
このプロジェクトは5つの個別の論文で構成されています:マルチリンガルコーパスの意味的冗長性の測定、普遍的知識と言語固有の知識の特徴づけ、表現のための設計要件の定義、プロトタイプの開発、および初期トレーニング性能の検証です。このイニシアチブはオープンな研究原則に基づいて運用され、結果がどうであれすべての成果を公開すること、およびデータセット、ベンチマーク、方法論に関するコミュニティからのフィードバックを歓迎することを約束しています。
この段階的なアプローチにより、後の段階が失敗した場合でも早期の作業の価値が保持され、プロジェクトが仮定ではなく実証的証拠に基づいて進化することが保証されます。