Un nouveau classement a été introduit pour mesurer l'alignement des grands modèles de langage avec les préférences humoristiques humaines, comblant ainsi le manque dans les benchmarks actuels qui optimisent principalement le raisonnement, la programmation et les mathématiques.

  • L'initiative cible les utilisateurs qui interagissent avec l'IA pour le plaisir, la compagnie, la créativité et le divertissement plutôt que pour des tâches techniques.
  • Elle propose de suivre « faire sourire les gens » comme une métrique de benchmark significative.
  • Le classement est hébergé sur Hugging Face Spaces sous le nom LLM Humor Ranking Leaderboard.

Cet effort vise à évaluer si l'alignement humoristique devrait devenir une métrique standard pour évaluer dans quelle mesure les modèles répondent aux besoins généraux des utilisateurs au-delà de la performance technique.