GeneBench-Pro का परिचय
GeneBench-Pro एक शोध-स्तर का बेंचमार्क है जो कंप्यूटेशनल बायोलॉजी में AI एजेंट अस्पष्टता को कैसे संभालते हैं और निर्णायक निर्णय लेते हैं, इसका मापन करने के लिए डिज़ाइन किया गया है, जो मूल GeneBench का विस्तार करता है। यह वर्तमान मूल्यांकनों की सीमाओं को संबोधित करता है, उच्च-क्रम क्षमताओं जैसे डेटा शोर को संभालना, मान्यताओं को पुनः देखना और परिणाम निर्णय-के लिए तैयार हैं या नहीं, यह निर्धारित करने का परीक्षण करके।