Menampilkan Hasil Every Eval di Halaman Model Hugging Face

Hugging Face telah memperbarui halaman modelnya untuk menampilkan hasil evaluasi dari inisiatif 'Every Eval', memberikan pandangan komprehensif tentang kinerja model di berbagai benchmark. Integrasi ini memungkinkan pengguna mengakses berbagai metrik terstandarisasi langsung dalam antarmuka hub model.

Pembaruan ini mengintegrasikan data dari proyek Every Eval ke dalam kartu model individu di Hugging Face.
Pengguna kini dapat melihat beragam hasil evaluasi tanpa meninggalkan platform.
Perubahan ini bertujuan untuk menstandarkan cara kemampuan model disajikan dan dibandingkan.

Peningkatan ini membantu pengguna membuat keputusan yang lebih informatif dengan menawarkan akses langsung ke data kinerja ekstensif untuk model yang dihosting di platform.