人工智能程序预测出985%的人类蛋白质结构
新华社伦敦7月22日电(记者张家伟)英国“深度思维”公司研究人员领衔的团队22日在英国《自然》杂志发表报告说,该公司的人工智能程序“阿尔法折叠”(AlphaFold)预测出98.5%的人类蛋白质结构,有助于深入理解一些关键生物学信息,从而更好开展药物研发。
人类蛋白质组是指人类基因组编码所有蛋白质的集合,考虑到理解人类蛋白质组对健康和医药的重要性,研究人员一直以来付出大量努力来确定其中的蛋白质结构,但用普通实验方法预测蛋白质结构十分耗时。人类基因组中目前只有三分之一的蛋白质3D结构已通过实验确定。
“阿尔法折叠”是“深度思维”公司开发的一款人工智能程序,可用于预测蛋白质结构。该公司研究人员利用“阿尔法折叠”确定了覆盖几乎整个人类蛋白质组(98.5%的所有人类蛋白质)的蛋白质结构,并将这些结构放入公开的数据库免费供全球科研人员使用。
氨基酸是连接起来形成蛋白质的亚单位。研究人员还让“阿尔法折叠”对人类蛋白质组58%的氨基酸结构位置给出可信预测;其中对35.7%的结构位置预测达到很高可信度。
报告作者之一、“深度思维”公司联合创始人德米斯·哈萨比斯在一篇文章中说,了解一部机器的结构之后才能清楚知道它能做什么,因此深入分析蛋白质结构有助我们理解它的功能。研究人员在寻找疾病治疗方案以及应对包括抗生素耐药性、微塑料污染和气候变化等人类社会面临的重大挑战过程中,也能从中受益。
【纠错】【责任编辑:施歌】人工智能预测蛋白质结构
近日,人工智能企业上海天壤智能科技有限公司宣布,其自主研发的深度学习蛋白质折叠预测平台在国际蛋白质结构预测竞赛蛋白质测试集的评估中获得优异成绩,位居全球同类型团队前列。在400个氨基酸的蛋白链预测时,该预测平台仅耗时16秒。
科学家说,蛋白质是细胞中的主要功能分子,在细胞中发挥多种多样的功能。比如,作为酶发挥催化作用,参与生物体内新陈代谢的调剂作用,运输代谢物质,用于细胞骨架的形成,以及参与免疫、细胞分化、细胞凋亡等过程。作为构成生命的基本元件,破解蛋白质的功能是揭开各种生命现象的金钥匙。
据天壤创始人薛贵荣博士介绍,为了行使特定功能,蛋白质必须折叠成特定的结构,只有少数蛋白质处于天然无折叠状态但仍具有功能。蛋白质的三维结构也直接决定蛋白质的功能,一旦三维结构被破坏,蛋白质功能随之丧失。许多疾病都是由体内重要的蛋白质结构异常引起。因此,研究蛋白质结构有助于了解蛋白质的功能和作用,从而带来医疗保健、食品可持续性、创新生物技术等方面的改善,推进生命科学、药物研发、合成生物学方面的发展。
在生命科学领域,观测和解析蛋白质结构一直是个令人着迷的话题,吸引着众多科学家攻坚,但也面临着难度大、成本高、进展有限的局面。传统观测蛋白质结构的方法主要有三种:核磁共振、X射线、冷冻电镜。这些方法依赖大量试错以及昂贵的设备,每种结构的研究往往长达数年。现有的实验手段也还不足以揭示一些重要的蛋白结构,需要借助更多生物信息技术、计算生物学手段去探索。但使用普通的计算机软件来计算蛋白质结构,运算量相当惊人,连超级计算机也难以承受。为此,蛋白质结构预测成为结构生物学的重要分支,研究人员通过开发相关的人工智能算法,根据氨基酸序列来预测蛋白质的空间结构。
“从人工智能战胜围棋世界冠军,到城市交通调度,人工智能在解决复杂系统问题中显示出了惊人的智能决策能力,而蛋白质结构预测虽然是生物学课题,同时也属于复杂场景的问题,可以体现人工智能在基础科学研究中的巨大潜能,我们不愿意错过这道风景。”薛贵荣说,像这种全方位的创新项目非常珍贵,它覆盖了交叉学科的创新、行业的创新、基础科学的创新、人工智能算法和工程能力的创新。
近期的这些进展表明,将人工智能应用于蛋白质结构领域,通过预测的方式破解传统观测方法所不能解析的一些结构,且可信度比较高,十分接近事实。这种人工智能的结构预测算法,有望成为科学家的利器,加速生命科学领域的研究发展。
目前,单个蛋白质折叠预测只是一个起点,蛋白质通常以复合物的形式成对或成组发挥功能,以承担生命所需的种种功能,而许多蛋白质复合物的结构至今仍然成谜。薛贵荣认为,未来还要进一步提高人工智能算法的普适性和准确度,在揭示多个蛋白质之间的相互作用方面作出贡献,帮助人类寻找到精准的疾病治疗新方法。(记者余建斌)
[责编:武玥彤]