Cell Genomics观点:人工智能如何解析人类疾病的遗传易感性
原创CellPressCellPress细胞科学
生命科学
Lifescience
为什么有的人容易得病,而有的人不容易?全基因组关联分析GWAS作为目前广泛应用的遗传易感性研究方法,已经发现了近20万个基因座与人类疾病的风险显著相关。然而,如何将GWAS的统计学发现有效转化为致病机制的理解和临床实践收益,是现阶段基因组学研究的主要瓶颈。
2023年5月4日,中国医学科学院基础医学研究所和美国国立卫生研究院合作在CellPress细胞出版社期刊CellGenomics发表了题为“Fromfunctiontotranslation:Decodinggeneticsusceptibilitytohumandiseasesviaartificialintelligence”的观点论文。该论文系统描述了人工智能在解析GWAS基因座功能机制上取得的里程碑式进展,以及临床转化方面的具体应用场景,并讨论了包括数据可用性、模型可解释度、伦理/偏见bias等方面的挑战及实际建议。
中国医学科学院基础医学研究所龙尔平研究员为本文第一兼通讯作者,美国国立卫生研究院JiyeonChoi教授为共同通讯作者,PeixingWan为共同第一作者,共同作者QingyuChen和ZhiyongLu为论文作出重要贡献。
图1.本文聚焦的两个问题:如何运用人工智能解析人类疾病的遗传易感性?如何应对人工智能在后基因组时代的挑战?
人类大多数常见病是受到个体遗传背景和环境因素共同作用的复杂性疾病。全基因组关联分析GWAS是目前主流的疾病遗传易感性研究策略,其主要原理是通过对比大样本量的患病与健康人群基因组,来确定与疾病易感性存在显著统计学关联的大致基因组区域-基因座。自GWAS研究开展15年来,已报道了近20万个基因座与疾病的遗传易感性显著相关。然而,这些GWAS基因座统计学关联背后的因果致病机制是未知的,究其主要原因有二。其一,基因座是一段特定长度的基因组区域,区域内的变异位点之间往往存在大量的强连锁不平衡现象。这些连锁位点在遗传行为上完全绑定,从而呈现出统计学上难以区分的显著性。因此,单纯从GWAS的统计结果无法指向真正致病的“功能位点”。其二,基因座内约99%的位点处于非编码区,通常调控附近基因的表达水平发挥功能。然而,基因座区域内存在多个功能相似的基因团簇,且功能位点可以通过非线性的高维折叠/卷曲调控距离较远的基因,并具有明显的组织/细胞异质性,这给明确受位点调控的“易感基因”带来了挑战。总结而言,如何将GWAS的统计学结果有效转化为致病机制的理解,是现阶段人类遗传学研究的主要瓶颈。
涵盖表达数量性状基因座eQTL、染色质互作、基因组干扰等功能组学分析技术的快速发展,能够从不同的生物学层次和尺度提供GWAS基因座的功能机制线索,为解析疾病的遗传易感性带来了新的机遇。然而,功能组学技术产生的数据也同时带来了异质性和高维度等分析上的挑战。人工智能技术,具备从海量数据中进行有效特征提取,运用网络内部的参数进行自主迭代学习等优势,能够有效处理异质高维数据集,因此在基因组学领域显示出良好的应用前景。
图2.A.GWAS发现多个基因座共同参与了人类疾病的遗传易感性;B.GWAS基因座存在连锁不平衡LinkageDisequilibrium(LD)和转录调控异质性等多重挑战;C.运用深度学习框架处理基因组学和功能组学数据集的示意图
该论文首先描述了人工智能在解析GWAS基因座功能机制上取得的里程碑式进展,包括非编码区变异位点的作用,“位点-基因”的关联,转录调控的细胞类型场景,以及预测下游可能的信号通路。
图3.D.GWAS功能位点在编码区和非编码区存在不同的作用机制;E.“位点-基因”的调控关系可以由eQTL和染色质互作等手段进行推测,但仍需进一步考虑其细胞类型等场景特异性
随后,论文列举了两个GWAS在临床转化方面的具体应用场景:药物重定向和多基因评分,并讨论了人工智能技术促进GWAS转化研究的一些实质性工作。
图4.GWAS在临床转化方面的两个具体应用场景:药物重定向(A)和多基因评分(B)
最后,论文讨论了人工智能在解析GWAS基因座和促进临床转化应用上面临的挑战,并给出了具体的建议:一、严重缺乏GWAS基因座功能基础的金标准Ground-truth数据集。如何建立高通量大规模的功能组学解析技术?如何运用生成式模型等去弥补训练数据集标签上的缺陷?二、模型缺乏可解释性,难以提供生物学机制的理解。如何灵活运用简化的模型和先验的生物学知识进行算法设计和有效解读?三、人工智能技术在后基因组时代仍存在显著的伦理风险和各层次的潜在偏见bias。如何运用更系统的多中心联邦学习机制,减少敏感信息的泄漏风险?如何发挥群医学大队列的优势,减少甚至消除目前在功能组学领域存在的组织/样本多样性缺失问题?如何在算法层面,去尽量弥补真实数据集在代表性上的不足?
作者介绍
龙尔平,中国医学科学院基础医学研究所研究员、博士生导师、北京协和医学院准长聘教职、课题组长/独立PI、国家级青年人才计划入选者。相继在中山大学、密歇根大学、美国国立卫生研究院NIH接受“临床医学-人工智能-基因组学”多学科交叉的科研训练。课题组从事人类复杂性疾病的遗传易感性研究和智慧医疗的转化应用。研究成果发表于NatureBiomedicalEngineering、NatureEcology&Evolution、NatureGenetics、NatureCommunications、CellGenomics等学术期刊,被Nature、CancerDiscovery等作为亮点研究报道,获吴瑞纪念基金会“吴瑞奖”、NIH院长创新奖DirectorInnovationAward。
课题组计划在生物信息/群体遗传、机器学习/大数据挖掘方向招聘2名助理研究员(事业编制)。同时招收硕/博研究生,博士后和研究助理,欢迎邮件联系:
erping.long@ibms.pumc.edu.cn。
课题组英文网站:https://sites.google.com/view/erping-long-lab
相关论文信息
论文原文刊载于CellPress细胞出版社旗下期刊CellGenomics上,点击“阅读原文”或扫描下方二维码查看论文
▌论文标题:
Fromfunctiontotranslation:Decodinggeneticsusceptibilitytohumandiseasesviaartificialintelligence
▌论文网址:
https://www.cell.com/cell-genomics/fulltext/S2666-979X(23)00088-5
▌DOI:
https://doi.org/10.1016/j.xgen.2023.100320
1974年,我们出版了首本旗舰期刊《细胞》。如今,CellPress已发展为拥有50多本期刊的全科学领域国际前沿学术出版社。我们坚信,科学的力量将永远造福人类。
CellPress细胞出版社
阅读原文
AI换脸骗局频现 人工智能出圈后如何监管?
转自:通信信息报
(图片来源:摄图网)(记者 卢臻)“10分钟被骗430万”,日前,包头警方发布的一起利用AI实施通信诈骗的案例冲上热搜。随着ChatGPT的火爆,关于AI技术的争论就不曾停止过,如何应对人工智能可能带来的安全问题成为各界关注点,也成为网络安全工作的下一个着力点。人工智能产业发展迅速,潜藏安全风险引担忧随着信息技术的不断进步,人工智能产业成为各大行业的“兵家必争之地”,许多企业涌入人工智能领域想“分一杯羹”。虽然资本的持续注入让人工智能产业迅速发展,但在快速发展的光环下,安全隐患也引起了许多人的担忧。自2019年“ZAO”软件应用AI换脸技术成为网络舆论焦点后,该技术也进入大众视野中。随着AI的迅速发展,AI换脸技术门槛逐渐降低,应用场景越来越多,在满足人们猎奇、美颜、社交等需求的同时,因AI换脸引发的争议乃至违法犯罪行为屡见不鲜。实际上,除了AI换脸,骗子还可以利用人工智能的其他功能来进行犯罪。例如,利用相关人员声音素材进行合成,实施语音诈骗,或者通过AI算法,对人群进行筛选,从而实施精准诈骗。未雨绸缪筑牢安全防护墙在人工智能发展过程中,要坚持安全可靠和创新发展并重,筑牢安全防护墙,应对人工智能带来的安全风险亟须未雨绸缪。随着技术的不断演进,我国相关法律和政策也在不断发展和完善。去年,国家互联网信息办公室正式公布《互联网信息服务深度合成管理规定》,对于深度合成技术在互联网中的应用作出具体说明与严格规定,对人脸生成、人脸替换、人脸操控、姿态操控等虚拟人物图像的开发与应用作出了规定,为AI换脸等深度合成技术的应用厘清底线。除了法律方面,用高新技术来防范网络安全的风险也十分重要。例如,中国电信拥有运营商级的底层数据能力及强大的数据模型团队,其已形成9000+个欺诈模型,可实现反诈预警数据的全流程数智化管理。“黑科技”防诈AI技术的发展过程中,虽然会被许多“别有用心”之人利用AI漏洞进行诈骗,然而AI技术的革新也让防诈和反诈更加容易。依托AI智能、大数据等能力技术,中国电信打造了96110“翼安反诈”云平台,包括智能预警、智能拦截、智能分析、智能外呼功能,为用户提供多形态全方位反诈治理服务。在广东,中国电信广东公司为用户提供“来电名片”和“闪信提醒”服务,在用户收到不明信息或来电时,通过闪信、电话等方式及时提醒,仅2022年,累计发送闪信提醒5642万次,挽回经济损失超过11亿元,切切实实保障广大人民群众利益。正如硬币的正反两面,每一次技术变革在带来福祉的同时,也经常伴随风险。风险促使我们深入思考,但不能因噎废食。要因势利导,使其趋利避害,应是全行业未来努力的方向。海量资讯、精准解读,尽在新浪财经APP