GeneBench-Pro 是一个旨在评估模型在复杂基因组推理任务上表现的基准测试,包含十个详细的案例研究,展示了具有代表性的问题和辅助材料。每个案例研究都提供了原始提示、数据集以及评估模型在特定生物学挑战上表现所需的上下文。
- 利用长读长数据和药物基因组学证据,评估合成 TXR1 定向抑制剂的临床效用。
- 通过控制局部 DNA 扰动和 GC 毒性,区分转录本特异性 lncRNA 依赖性与邻近位点效应。
- 执行顺式多变量孟德尔随机化,以估计直接疾病效应,同时处理连锁不平衡和多效性。
- 使用假基因感知调用和奠基者单倍型数据,计算特定祖先的携带者频率和残余风险。
- 通过校正单细胞数据中的环境 RNA 和技术污染,确定基因型对单核细胞表达的影响。
- 评估倒位样位点内嵌套结构亚单倍型的临床关联,将剂量校准与表达支持区分开来。
- 通过屏蔽低比对度接触和结构变异伪影,量化 Hi-C 环强度差异。
- 通过从双等位基因标记数据重建奠基者祖先,在重组群体中定位数量性状位点。
- 在修复相互伪影后,根据分型的局部祖先片段推断亲本特异性祖先比例和混合时间。
- 利用古代等位基因频率时间序列识别受到正向选择的单倍体位点,同时考虑测序误差和遗传漂变。
这些案例研究强调了模型处理细微生物学混杂因素(如连锁不平衡、环境 RNA 和结构变异伪影)的必要性,以得出可信的临床和研究结论。