إطلاق GeneBench-Pro
GeneBench-Pro هو معيار بحثي مصمم لقياس كيفية تعامل وكلاء الذكاء الاصطناعي مع الغموض واتخاذ أحكام ذات عواقب في علم الأحياء الحاسوبي، وهو توسيع للمعيار الأصلي GeneBench. ويتناول قيود التقييمات الحالية من خلال اختبار قدرات من رتبة أعلى مثل التعامل مع ضجيج البيانات، ومراجعة الافتراضات، وتحديد متى تكون النتائج جاهزة لاتخاذ القرار.