मानव हास्य प्राथमिकताओं के साथ बड़े भाषा मॉडलों की संरेखण को मापने के लिए एक नई लीडरबोर्ड पेश की गई है, जो वर्तमान बेंचमार्क्स में अंतराल को दूर करती है जो मुख्य रूप से तर्क, कोडिंग और गणित के लिए अनुकूलित हैं।

  • यह पहल उन उपयोगकर्ताओं को लक्षित करती है जो तकनीकी कार्यों के बजाय मनोरंजन, साथी, रचनात्मकता और हास्य के लिए AI के साथ इंटरैक्ट करते हैं।
  • यह "लोगों को मुस्कुराना" को एक सार्थक बेंचमार्क मेट्रिक के रूप में ट्रैक करने का प्रस्ताव देता है।
  • लीडरबोर्ड LLM Humor Ranking Leaderboard नाम से Hugging Face Spaces पर होस्ट किया गया है।

यह प्रयास इस बात का आकलन करने के लिए है कि क्या हास्य संरेखण को तकनीकी प्रदर्शन के परे सामान्य उपयोगकर्ता आवश्यकताओं को कितनी अच्छी तरह पूरा करते हैं, इसका मूल्यांकन करने के लिए एक मानक मेट्रिक बनना चाहिए।