GeneBench-Proの内部：複雑なゲノム推論の10事例研究

GeneBench-Proは、複雑なゲノム推論タスクにおいてモデルを評価するために設計されたベンチマークで、代表的な質問と支援資料を紹介する10の詳細な事例研究を特徴としています。各事例研究では、特定の生物学的課題に対するモデルのパフォーマンスを評価するために必要な元のプロンプト、データセット、およびコンテキストを提供します。

長鎖リードおよび薬理ゲノム証拠を用いて、合成TXR1指向阻害剤の臨床的有用性を推定する。
ローカルDNA変異とGC毒性について制御することにより、転写物特異的なlncRNA依存性を近傍座席の効果から区別する。
連鎖不平衡および多面的効果を処理しながら、直接的な疾患効果を推定するためにcis多変量メンデルランダム化を実行する。
パseudogene認識呼び出しと創始者ハプロタイプデータを用いて、祖先特異的保因者頻度と残存リスクを計算する。
単一細胞データの環境RNAおよび技術的汚染について補正することにより、単球発現に対する遺伝子型効果を決定する。
逆位様座席内のネストされた構造的サブハプロタイプの臨床関連性を評価し、用量キャリブレーションと発現支援を分離する。
マッピング能の低い接触および構造的変異アーティファクトをマスクすることにより、Hi-Cループ強度の違いを定量化する。

二対立遺伝子マーカーデータから創始者祖先を再構築することにより、組換え集団における数量形質座をマッピングする。

相互的なアーティファクトを修復した後、位相指定ローカル祖先断片から親特異的祖先割合および混合時期を推論する。
シーケンシングエラーおよびドリフトを考慮しながら、古代アレル頻度の時系列を用いて正の選択下にあるハプロイド座席を同定する。

これらの事例研究は、連鎖不平衡、環境RNA、構造的変異アーティファクトなどの微妙な生物学的交絡因子を処理し、防御可能な臨床的および研究的結論を生み出すためにモデルが必要であることを強調しています。