【NG 2023】当前基因组深度学习模型难以解释个体转录组变异
英文题目Personal transcriptome variation is poorly explained by current genomic deep learning models背景基因组深度学习模型已经能直接从 DNA 序列预测基因表达、表观遗传特征、3D 基因组结构等。已有模型在“用参考基因组预测不同基因/不同细胞类型的表达水平”上表现不错。但问题是这些模型能不能用每个人自己的基因组序列解释不同个体之间的基因表达差异这一点以前研究得不够。Motivation作者想检验现在最先进的 sequence-to-expression 模型是否真的能用于personal genome interpretation也就是从个人基因组变异预测个人转录组差异。他们评估了 4 个模型Enformer、Basenji2、ExPecto、Xpresso使用 Geuvadis 数据集中 421 个个体的 WGS RNA-seq 配对数据并聚焦 3,259 个有显著 cis-eQTL 的基因。解决了当前什么问题它解决的问题是以前大家知道这些模型能预测“基因之间”的表达差异但不清楚它们能否预测“个体之间”的表达差异。结果显示这些模型在 cross-gene prediction 上还可以但在 cross-individual prediction 上几乎接近失败并且经常预测错 cis-regulatory variants 对表达影响的方向。本文指出了当前基因组深度学习模型用于个人基因组解释时的一个核心短板能识别一些调控变异信号但判断这些变异在个体上的表达效果让表达升高还是降低很差。Figure 1模型在“预测不同基因表达差异”上表现还行但在“预测不同个体表达差异”上很差。Fig. 1a示意图。说明作者怎么用个人基因组序列预测表达并区分两个评价指标cross-gene correlation对同一个人看模型能不能预测多个基因之间的表达高低。cross-individual correlation对同一个基因看模型能不能预测 421 个个体之间的表达差异。Fig. 1b比较 Enformer、Basenji2、ExPecto、Xpresso 和 PrediXcan 的表现。结果是参考基因组预测和 cross-gene 预测还不错但 cross-individual 预测接近 0PrediXcan-style 线性模型反而能解释更多个体间差异。Fig. 1c只展示 Enformer 的分布。左边 cross-gene correlation 集中在较高值右边 cross-individual correlation 以 0 附近为中心。意思是Enformer 能区分基因之间表达强弱但不能可靠区分个体之间表达差异。Fig. 1d举两个基因例子SLFN5 是预测和真实表达正相关SNHG5 是强负相关。说明模型有时不仅预测不好还可能把方向预测反。Figure 2不同模型经常对同一个调控变异的影响方向给出相反判断。同一个基因在不同个体之间模型预测的表达变化是否和真实表达变化一致。Fig. 2a以SNHG5为例展示四个模型的预测。Enformer、Basenji2、ExPecto 对这个基因是负相关Xpresso 是正相关。点的颜色代表 top eQTL 的剂量。意思是模型对同一个 eQTL/基因的表达影响方向判断不一致。Fig. 2b比较 Enformer 和其他模型的 cross-individual correlation。可以看到有些点沿着 yx也有些沿着 y-x。意思是模型有时同意“这个基因有调控信号”但不同意“方向是升高还是降低”。Fig. 2c分析 Enformer 的表现和几个因素的关系top eQTL 的 P 值、eQTL 到 TSS 的距离、基因表达量、预测表达变异程度。主要结论是强 eQTL 的基因往往相关性绝对值更大但不一定是正相关即使 eQTL 很强模型仍可能预测错方向。

相关新闻

复数不是虚数拼凑算式,是0基点双向垂直双螺旋同步生长的二维复合节点坐标-《全域数学vs传统数学:人类文明进阶200讲》第56讲

复数不是虚数拼凑算式,是0基点双向垂直双螺旋同步生长的二维复合节点坐标-《全域数学vs传统数学:人类文明进阶200讲》第56讲

《全域数学vs传统数学:人类文明进阶200讲》第56讲 作者:乖乖数学 主题:复数不是虚数拼凑算式,是0基点双向垂直双螺旋同步生长的二维复合节点坐标 对标课本知识点:复数、虚数单位i、复数四则运算、复平面0~3…

2026/6/28 2:48:15阅读更多 →
每日 AI 研究简报 · 2026-06-27

每日 AI 研究简报 · 2026-06-27

(本文借助 AI 大模型及工具辅助整理) 一句话总结:OpenAI 发布 GPT-5.6 三款新模型,Google 搜索框迎来25年首次大改版,图像生成与强化学习领域迎来重要技术突破。 🌊 AI 动态与趋势 大模型竞争进入新阶段…

2026/6/28 2:43:14阅读更多 →
安全帽佩戴目标检测数据集:2类别 | 目标检测

安全帽佩戴目标检测数据集:2类别 | 目标检测

安全帽佩戴目标检测数据集:2类别 | 目标检测 源码数据分享 通过网盘分享的文件:工业场景安全帽佩戴检测数据集 链接: https://pan.baidu.com/s/1UijTCZJde4j66ta8sIQQgw?pwdaesy 提取码: aesy 一、安全生产:一个不容妥协的底线 在工业生产…

2026/6/28 2:43:14阅读更多 →
BBR与KCC发送速率调节机制

BBR与KCC发送速率调节机制

BBR与KCC发送速率调节机制 0. 问题界定 拥塞控制算法的核心输出只有两个变量:Pacing Rate(物理发送速率) 和 CWND(逻辑拥塞窗口)。本文通过源码和可视化图表,剖析 BBR 与 KCC 在决定"下一时刻该发多快…

2026/6/28 4:18:19阅读更多 →
2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联

2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联

2026命理软件做咨询排班怎么选?八字排盘App要看日程提醒和案例关联 摘要:2026年选择命理软件做咨询排班,不适合只看日历提醒是否存在,更要看预约时间、沟通节点、案例卡片和后续反馈能否关联。八字排盘App如果能把日程安排与排盘资…

2026/6/28 4:18:19阅读更多 →
【朱红大漆戗金梅花碗】一剪红梅献祖国

【朱红大漆戗金梅花碗】一剪红梅献祖国

朱红大漆戗金梅花碗,一株红梅献祖国 **满眼浓烈沉静的朱红,一枝疏影横斜的寒梅。这只大漆戗金小碗,一眼就牢牢抓住人的目光。 古法戗金工艺,是匠人先在漆面阴刻出梅花枝干,再将金料嵌入纹路之中,经十数道髹…

2026/6/28 4:18:19阅读更多 →
/init 命令深度解析:让 OpenCode 真正理解你的项目结构

/init 命令深度解析:让 OpenCode 真正理解你的项目结构

很多人已经开始感觉到,AI 编程助手正在改变日常开发的方式。 不是“再过几年会改变”,是已经改变了。 Cursor、GitHub Copilot、Claude Code 这些工具在过去一年里密集地涌进来。你可能已经装了其中一个,试过让 AI 帮你写点代码、修个 Bug。…

2026/6/28 4:18:19阅读更多 →
第26篇 C语言文件操作:从数据持久化到底层读写机制全解析一、文件操作底层原理总览

第26篇 C语言文件操作:从数据持久化到底层读写机制全解析一、文件操作底层原理总览

目录 1.1 数据持久化与文件分类 1.2 数据存储形式:文本与二进制的底层差异 二、流抽象与文件指针机制 2.1 流的概念与标准流 2.2 文件指针与FILE结构体 三、文件打开模式与IO操作规范 3.1 文件的打开与关闭 3.2 顺序读写函数族 3.3 字符串流操作&#xff1a…

2026/6/28 4:18:19阅读更多 →
哪家AI无人直播功能全

哪家AI无人直播功能全

从通用到垂直:天隐科技携繁昕科技落子AI直播细分场景从“有没有”到“好不好”,AI直播行业正在经历一轮品牌分化。一批具备技术自研能力的服务商开始走多品牌路线,用不同定位的品牌覆盖不同客群。2026年,这一趋势愈发明显。公开资…

2026/6/28 4:13:19阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/28 0:08:01阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/28 0:08:01阅读更多 →