博舍

“阿尔法折叠2”预测蛋白结构近原子水平 人工智能预测蛋白结构

“阿尔法折叠2”预测蛋白结构近原子水平

据英国《自然》杂志16日发表的一项结构生物学最新研究,世界著名人工智能团队深度思维(DeepMind)描述了神经网络“阿尔法折叠2”能以就计算机方法而言前所未有的准确度,根据蛋白质的氨基酸序列预测其三维结构。

蛋白质折叠问题被认为是人类在21世纪需要解决的重要科学前沿问题之一。理解蛋白质的结构有助于确定蛋白质的功能,了解各种突变的作用。截至目前,约有10万个蛋白质的结构已经用实验方法得到了解析,但这在已经测序的数10亿计的蛋白质中只占了很小一部分。在50多年的时间里,研究人员一直尝试根据蛋白质的氨基酸序列预测其折叠而成的三维结构。然而,当前使用的计算方法准确度有限,实验方法对人力和时间的要求也非常高。

此次,深度思维首席科学家约翰·詹普尔、创始人兼首席执行官戴米斯·哈萨比斯及其团队描述了“阿尔法折叠2”——一个基于神经网络的新模型,其预测的蛋白质结构能达到原子水平的准确度。研究团队在2020年5月至7月举办的第14届“蛋白质结构预测关键评估”(CASP14)大赛中验证了这种方法。

CASP14比赛要求参赛团队根据蛋白质的氨基酸序列解析它们的结构。比赛用的蛋白质会先用实验方法解析出来,但具体结果不会公开。比赛中,“阿尔法折叠2”预测的大部分结构达到了空前的准确度,不仅与实验方法不相上下,还远超解析新蛋白质结构的其他方法。将实验方法得到的蛋白质结构叠加在“阿尔法折叠2”的结构上,组成蛋白质主链骨架的叠加原子之间的距离中位数(95%的覆盖率)为0.96埃(0.096纳米)。成绩排第二的方法只能达到2.8埃的准确度。

“阿尔法折叠2”的神经网络能在几分钟内预测出一个典型蛋白质的结构,还能预测较大蛋白质(比如一个含有2180个氨基酸、无同源结构的蛋白质)的结构。该模型能根据每个氨基酸对其预测可靠性进行精确预估,方便研究人员使用其预测结果。

研究团队认为,这一精准的预测算法可以让蛋白质结构解析技术跟上基因组革命的发展步伐。

戴米斯·哈萨比斯在一份声明中表示,他们将为科学共同体提供广泛、免费的获取途径且已迈出承诺的第一步——在《自然》期刊上分享“阿尔法折叠”的开源代码,并发表了系统的完整方法论,以期待看到该方法为科学界启发出其他新的研究方法。

“阿尔法狗”转行预测蛋白质结构,交大教授建议布局AI+生物医药|新科普

美国《科学》杂志近日评选出了2020年十大科学突破,“人工智能首次精准预测蛋白质三维结构”榜上有名。上海交通大学生物医学工程学院特聘教授殷卫海认为,这一成果的科学原理并不新鲜,但确实是一个重大技术突破,有望大幅加快药物研发速度。上海可加强对“人工智能+生物医药”这个交叉领域的布局,抢占科技前沿制高点。

人工智能让蛋白质结构预测成为可能

蛋白质具有三维结构,由一系列氨基酸折叠而成。对科学家来说,氨基酸测序是比较容易完成的工作,蛋白质三维结构解析的难度却很大,耗时费力。1972年,美国科学家克里斯蒂安·安芬森因提出“蛋白质的高级空间结构由其氨基酸序列决定”而获得诺贝尔化学奖。那为什么测定氨基酸序列后,解析蛋白质三维结构仍非常困难呢?殷卫海解释说,氨基酸折叠成蛋白质的力学原理是很明确的,包括氢键、范德华力、疏水作用和离子键等相互作用,这些氨基酸折叠成的三维结构必定达到了力学最稳态。但问题在于,蛋白质中各个原子之间都有作用力,如果要根据最稳态原理预测出三维结构,必须通盘考虑上千万个乃至更多的作用力,计算量非常巨大。

长期以来,结构生物学家利用冷冻电子显微镜、X射线晶体学等技术观测并解析蛋白质三维结构。对一些重要蛋白质的结构解析成果,往往会在《细胞》《自然》《科学》等国际顶级科技期刊发表,因为这类科研成果与药物研发息息相关,只有绘制出人体内重要蛋白质的“三维地图”,才能据此找到药物作用于人体的靶点,从而研制出精准有效的新药。

无论是冷冻电子显微镜还是X射线晶体学技术,解析蛋白质三维结构的难度都很高,需要高水平科研团队耗时数月乃至数年才能完成。近年来,随着新一代人工智能技术兴起、“阿尔法狗”(AlphaGo)的问世,“根据氨基酸序列预测蛋白质结构”这一方法成了国际科技前沿热点。通过深度机器学习等技术,人工智能系统可以在几天至几个月内,完成传统计算机软件需要上百年甚至更长时间才能完成的计算量,较为精准地预测出蛋白质三维结构。

人工智能预测(蓝色)和实验测定(绿色)的蛋白质结构几乎完全吻合。来源:DeepMind

智能化药物设计可让中国“弯道超车”

去年11月30日,谷歌旗下DeepMind(深度思维)公司研发的AlphaFold(阿尔法折叠)人工智能系统,在国际蛋白质结构预测竞赛上获得冠军,其预测的蛋白质三维结构与实验方法解析的结构只有小幅差异,甚至让人怀疑差异是否源于实验结果不够精准。

“这种人工智能应用有望在新药研发中扮演重要角色,智能化药物设计可以提高效率、节省费用。”殷卫海说,比如科学家发现人体内某个蛋白质分子活性很强,会促进肿瘤生长。如何研制出针对这个分子的抑制剂?利用人工智能系统,科学家能够在很短时间内预测出它的三维结构,并在此基础上设计很多种药物分子结构,让它们进入新药研发的临床前实验阶段。

在他看来,“人工智能+生物医药”这个交叉领域很适合在上海发展,因为这是一个科技前沿制高点,人工智能和生物医药又属于上海重点发展的三大领域,上海在这两个领域拥有国内领先的科研力量和临床资源。“我国在新药研发方面长期落后于一些发达国家,随着智能化药物设计的兴起,我们有了弯道超车的机会。DeepMind目前处于国际领跑水平,我国相关部门可加强这方面的研发布局和投入,推动科研机构和企业向科技制高点进军。”

冰洲石生物科技研发的“轨道药物设计”平台来源:依图科技

值得关注的是,上海企业依图科技近日投资了人工智能药物研发公司——冰洲石生物科技(AccutarBio)。这家2015年成立的企业将深度神经网络用于药物化学性质预测,其自主研发的“轨道药物设计”平台,每天能进行数百万小分子的虚拟筛选。冰洲石生物科技首席执行官范捷博士介绍,用传统方法研发一款新药,平均耗费10亿美元、耗时10年。而利用“轨道药物设计”平台,公司近两年就获得了数个候选药物。这些靶向药物有望用于治疗多种癌症,其中针对乳腺癌和前列腺癌的药物在开发管线中推进最快,计划今年进入临床试验阶段。

人工智能里程碑突破:DeepMindI精准预测蛋白质结构

▲AlphaFold的神经网络模型构架(图片来源:DeepMindBlog)

惊人的准确性

AlphaFold的第一次运用了人工智能的方法,即深度学习来预测蛋白质中成对氨基酸之间的距离。但是试图在这种方法的基础上继续前进时,却碰壁了。因此,他们改变策略,开发了一个AI网络,该网络结合了决定蛋白质如何折叠的物理和几何约束信息,旨在用该网络来预测目标蛋白质序列的最终结构,而非氨基酸之间的关系。

CASP历时数月,预测了总共约100个蛋白质结构。其中,许多条目惊人的准确性使AlphaFold脱颖而出。AlphaFold将近三分之二的预测与实验结构相当。目前尚不清楚某些情况下AlphaFold的预测与实验结果之间的差异是预测误差还是实验的假象。在被认为中等难度的蛋白质靶标上,其他团队的最佳表现通常在100分的预测准确度上得分75,而在相同的靶标上AlphaFold得分大约90。

AlphaFold的预测与通过核磁共振成像技术确定的实验结构的匹配性较差,但是这可以归结为如何将原始数据转换成一个模型。该网络还为蛋白质复合物或组中的单个结构建模,从而与其他蛋白质的相互作用扭曲了它们的形状。

哥伦比亚大学的计算生物学家MohammedAlQuraishi是CASP的参与者,他渴望在比赛后深入研究AlphaFold的性能细节,进一步了解该系统的工作原理,他表示这有可能使蛋白质结构更容易解析,而AlphaFold在结构生物学领域可能是变革性的。

▲2006-2020年CASP比赛中最佳蛋白折叠预测系统的评分表现

(图片来源:DeepMindBlog)

更快的结构解析

AlphaFold系统已被用于解析过一种细菌蛋白结构。卢帕斯的实验室为解析该蛋白曾得到大量的蛋白晶体并且收集了很多套X单晶衍射数据用于结构解析,这些数据获取起来非常繁琐,而且成功率极低。但在使用该系统后,半小时就完成了卢帕斯团队十年的工作量。

图:DeepMind的首席执行官DemisHassabis

来源:DeepMind

现阶段AlphaFold系统可能需要几天的时间才能得出预测的结构,其中包括对蛋白质不同区域可靠性的评估。公司的联合创始人兼首席执行官DemisHassabis说,该公司才刚刚开始了解生物学家的需求。他们认为药物发现和蛋白质设计是潜在的市场,所以公司计划让AlphaFold系统有更高的实用性,以便其他科学家可以使用它。

今年年初,生物学家斯蒂芬·布罗恩已利用该系统预测了SARS-CoV-2的蛋白结构。后续的实验结果显示,AlphaFold预测的新冠病毒Orf3a蛋白结构与冷冻电镜解析的结构非常相似。这让斯蒂芬在内的科学家都为之一震。

▲AlphaFold根据氨基酸序列预测的蛋白结构与实验手段解析的结果几乎完全重合

(绿色,实验结果;蓝色,计算预测结果;

图片来源:DeepMindBlog)

对现实世界的影响

AlphaFold现阶段虽不太可能取代冷冻电镜等相关解析蛋白结构的实验手段,但它的出现意味着,生物学家们可以将计算方法预测蛋白结构作为科学研究的工具之一。另外,在现有的繁杂的基因组数据中,新一代分子生物学家如何针对数据转换为蛋白结构解析提供帮助,是AI技术在结构生物学发展中的难题。

AlphaFold的表现将是DeepMind公司发展的一个转折点。DemisHassabis表示像蛋白质结构预测这类科学难题也是其人工智能可以做出的最重要的应用之一。返回搜狐,查看更多

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇