lab OpenAI News · 4 小时前 · releases

GeneBench-Pro 内部解析：10 个复杂基因组推理案例研究

译自 English → 中文

GeneBench-Pro 是一个旨在评估模型在复杂基因组推理任务上表现的基准测试，包含十个详细的案例研究，展示了具有代表性的问题和辅助材料。每个案例研究都提供了原始提示、数据集以及评估模型在特定生物学挑战上表现所需的上下文。

利用长读长数据和药物基因组学证据，评估合成 TXR1 定向抑制剂的临床效用。
通过控制局部 DNA 扰动和 GC 毒性，区分转录本特异性 lncRNA 依赖性与邻近位点效应。
执行顺式多变量孟德尔随机化，以估计直接疾病效应，同时处理连锁不平衡和多效性。
使用假基因感知调用和奠基者单倍型数据，计算特定祖先的携带者频率和残余风险。
通过校正单细胞数据中的环境 RNA 和技术污染，确定基因型对单核细胞表达的影响。
评估倒位样位点内嵌套结构亚单倍型的临床关联，将剂量校准与表达支持区分开来。
通过屏蔽低比对度接触和结构变异伪影，量化 Hi-C 环强度差异。
通过从双等位基因标记数据重建奠基者祖先，在重组群体中定位数量性状位点。
在修复相互伪影后，根据分型的局部祖先片段推断亲本特异性祖先比例和混合时间。
利用古代等位基因频率时间序列识别受到正向选择的单倍体位点，同时考虑测序误差和遗传漂变。

这些案例研究强调了模型处理细微生物学混杂因素（如连锁不平衡、环境 RNA 和结构变异伪影）的必要性，以得出可信的临床和研究结论。

重要性 1/3 可信度 3/3 OpenAI News Evaluation & benchmarks Training data