博舍

AI预测蛋白质结构还有哪些突破许锦波教授详解 人工智能蛋白质结构预测程序有哪些内容

AI预测蛋白质结构还有哪些突破许锦波教授详解

3月23日,由前沿科技媒体机器之心主办的“AI科技年会”上,美国芝加哥丰田计算技术研究所教授许锦波在演讲中宣布归国加入国家级实验室,并分享了AI预测蛋白质结构和功能这一新兴领域的发展沿革与最新进展。

许锦波被业界誉为“AI预测蛋白质结构全球第一人”,早在2016年,他开发的RaptorX-Contact方法,首次证明了深度学习方法预测蛋白质结构的可行性,拉开了AI蛋白质结构预测时代的序幕。谷歌DeepMind开发的AlphaFold软件也是基于许锦波团队前期研究成果。

许锦波表示,准确描述蛋白质的结构和功能,是理解生命过程的基础。蛋白质的结构和功能联系紧密,预测蛋白质的结构有助于人们在原子层面了解蛋白质的功能。近年来,随着人工智能的又一次兴起,蛋白质的结构预测从传统的物理和统计方法,快速走向最新的机器学习乃至深度学习算法。深度学习技术颠覆了蛋白质结构预测,可以正确预测90%的蛋白质形状,其中50-60%的蛋白质可以做到高分辨率预测,在此基础上,推动分子生物学界的研究范式从基于序列的研究到基于结构的研究,进而促进了基于结构的药物发现和设计,提高了蛋白质从头设计的效率。

众所周知,细胞是构成生命体的基本单位,而蛋白质则是构成细胞的重要生命物质,是生命活动的体现者和承担者。这其中,蛋白质分子的组成及其折叠结构,在很大程度上决定了蛋白质所具备并正在发挥的生物学功能。然而,如何清晰“理解”蛋白质的折叠结构,是困扰生物学界的一个“世纪难题”。一旦解开,人类对于生命的理解将迈出飞跃性的一步。

以当下火热的生物医疗产业为例,利用细胞、组织、体液等制造的一系列生物医疗制品,如单克隆抗体、重组蛋白、疫苗及基因和细胞治疗药物等大分子药物,因功效普遍较化学药更高且毒副作用小,近年来得到医疗产业界越来越多的关注,市场规模增长率远高于化学药。通过AI对蛋白质结构和功能进行预测,可以帮助人们深入了解包括癌症、遗传病等诸多顽疾的发病机理,进而找到治疗更精准的路径;同时,借助AI进行蛋白质结构优化,还可以极大地提升大分子药物的研发效率、降低成本。

而除了医疗产业以外,由于蛋白质可用作为诸如酶和激素之类的生物催化剂,在食品、化工、能源、环境工程等诸多领域有有着广泛的应用,可想而知,用AI破解蛋白质结构之谜、并在此基础上进行结构设计和优化,可以给未来社会发展带来怎样天翻地覆的变化。

过去的近六年时间里,许锦波在AI蛋白质结构预测领域做出了开创性的贡献。

2016年,许锦波开发出基于残差网络(ResNet)的RaptorX-Contact方法,其采用全局式的结构预测方式,将图像处理中的图像分割技术迁移到蛋白质结构预测领域,采用深度学习卷积网络对蛋白质结构进行整体测算,并通过距离矩阵重构蛋白质分子三维结构,从而大幅度提高了蛋白质结构预测。同年,在被称为“蛋白质结构预测领域的奥林匹克竞赛”——第十二届国际蛋白质结构预测竞赛(CASP,CriticalAssessmentofproteinStructurePrediction)中,RaptorX-Contact在蛋白质接触矩阵的预测上得分居首位。这一蛋白质结构预测的核心思想得到了谷歌DeepMind团队的重视,并应用在AlphaFold的开发中。

除了开辟AI蛋白质预测的新思路之外,许锦波团队还研发了多个著名的生物信息学软件,包括蛋白质相互作用网络分析软件IsoRank。去年以来,许锦波团队继续通过使用残差网络(ResNet),在不使用协同进化(co-evolution)信息的条件下,实现了较高的蛋白质结构预测水平,并在预测人工设计的蛋白质结构时表现得更为出色。这一研发成果对蛋白质工程和蛋白质设计都具有重要意义。

许锦波教授将加入聚焦生命科学领域、代表国家战略科技力量的北京昌平实验室,并将在此继续围绕蛋白质预测与设计开展科研攻关。

[责编:李然]

英国公司人工智能程序预测出985%的人类蛋白质结构

新华社伦敦7月22日电(记者张家伟)英国“深度思维”公司研究人员领衔的团队22日在英国《自然》杂志发表报告说,该公司的人工智能程序“阿尔法折叠”(AlphaFold)预测出98.5%的人类蛋白质结构,有助于深入理解一些关键生物学信息,从而更好开展药物研发。

人类蛋白质组是指人类基因组编码所有蛋白质的集合,考虑到理解人类蛋白质组对健康和医药的重要性,研究人员一直以来付出大量努力来确定其中的蛋白质结构,但用普通实验方法预测蛋白质结构十分耗时。人类基因组中目前只有三分之一的蛋白质3D结构已通过实验确定。

“阿尔法折叠”是“深度思维”公司开发的一款人工智能程序,可用于预测蛋白质结构。该公司研究人员利用“阿尔法折叠”确定了覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白质)的蛋白质结构,并将这些结构放入公开的数据库免费供全球科研人员使用。

氨基酸是连接起来形成蛋白质的亚单位。研究人员还让“阿尔法折叠”对人类蛋白质组58%的氨基酸结构位置给出可信预测;其中对35.7%的结构位置预测达到很高可信度。

报告作者之一、“深度思维”公司联合创始人德米斯·哈萨比斯在一篇文章中说,了解一部机器的结构之后才能清楚知道它能做什么,因此深入分析蛋白质结构有助我们理解它的功能。研究人员在寻找疾病治疗方案以及应对包括抗生素耐药性、微塑料污染和气候变化等人类社会面临的重大挑战过程中,也能从中受益。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇