GeneBench-Pro — это бенчмарк, предназначенный для оценки моделей на задачах сложного геномного рассуждения, включающий десять подробных кейсов, демонстрирующих репрезентативные вопросы и вспомогательные материалы. Каждый кейс предоставляет исходный промпт, наборы данных и контекст, необходимые для оценки производительности модели при решении конкретных биологических задач.

  • Оценить клиническую полезность синтетических ингибиторов, нацеленных на TXR1, используя данные длинных чтений и фармакогеномные доказательства.
  • Различать транскрипт-специфичные зависимости lncRNA от эффектов ближайших локусов, контролируя локальные возмущения ДНК и GC-токсичность.
  • Выполнить цис-мультивариантный менделевский рандомизированный анализ для оценки прямых эффектов заболеваний с учетом неравновесия по сцеплению и плейотропии.
  • Рассчитать частоты носительства и остаточные риски, специфичные для происхождения, используя вызовы вариантов с учетом псевдогенов и данные гаплотипов основателей.
  • Определить эффекты генотипа на экспрессию моноцитов путем коррекции фоновой РНК и технического загрязнения в данных одиночных клеток.
  • Оценить клинические ассоциации вложенных структурных субгаплотипов внутри локусов, похожих на инверсии, отделяя калибровку дозы от поддержки экспрессии.
  • Количественно оценить различия силы петель Hi-C, маскируя контакты с низкой мappableностью и артефакты структурных вариантов.
  • Карта количественных локусов признаков в рекомбинантных популяциях путем реконструкции происхождения основателей на основе данных бинарных маркеров.
  • Вывести пропорции происхождения, специфичные для родителя, и время смешения из фазированных локальных участков происхождения после исправления взаимных артефактов.
  • Выявить гаплоидные локусы под положительным отбором, используя временные ряды частот древних аллелей с учетом ошибок секвенирования и дрейфа.

Эти кейсы подчеркивают необходимость для моделей учитывать сложные биологические конфаундеры, такие как неравновесие по сцеплению, фоновая РНК и артефакты структурных вариантов, чтобы делать обоснованные клинические и исследовательские выводы.