博舍

健康计算:人工智能赋能生命科学与生物医药研究 人工智能与生物工程的应用及展望作文

健康计算:人工智能赋能生命科学与生物医药研究

我们现在正在经历数字3.0时代,这是一个将信息与物理世界、生物世界融合的智能感知时代。健康计算就是在生物世界的数字化与智能化的大趋势下,我们可以用人工智能和数据驱动的第四科学研究范式,辅助人类探索并解决生命健康的问题。——马维英

活动介绍

北京智源大会是人工智能领域盛会,已成功举办两届。2021北京智源大会于6月1日至6月3日在线上线下同步召开。本次会议共设29个专题论坛,从AI基础研究、跨界融合、到产业应用,为各界人士提供了一个交流和碰撞想法的平台。本次会议聚集了八千余位AI领域的科学家、企业家、投资者、学界人员、业界人员,累计参与观看直播和讨论人次达200万。

2021年6月3日,清华大学智能产业研究院惠妍讲席教授、首席科学家马维英教授应邀参加2021北京智源大会AI制药论坛,并做主题为《健康计算》的演讲,向大家介绍了健康计算这一新兴研究热点中人工智能的现状、挑战及机遇,及清华大学智能产业研究院(AIR)在健康计算领域的计划与部署。

讲者介绍

马维英博士现为清华大学智能产业研究院惠妍讲席教授、首席科学家。他的研究方向包括人工智能的几个核心领域(搜索与推荐、大数据挖掘、机器学习、自然语言理解与生成、计算机视觉)以及人工智能在生命科学、生物制药、基因工程、以及个体化精准医疗等领域的跨学科研究与应用。他此前曾任字节跳动副总裁兼人工智能实验室主任、前微软亚洲研究院常务副院长。

马博士曾在世界级会议和学报上发表过逾300篇论文,并拥有160多项技术专利。他是电气电子工程师学会会士(IEEEFellow),曾任国际信息检索大会(SIGIR2011)联合主席、国际互联网大会(WWW2008)的程序委员会联合主席。他于2017年获得吴文俊人工智能科学技术奖二等奖,并曾入选TOP100科学家,全球排名第86位。

报告内容

在报告开始,马维英教授简短的介绍了健康计算的定义,回顾了数字1.0到3.0的进程,以及介绍了AI在生物医疗领域的现状和未来的发展及机遇。

1.大趋势:生物世界的数字化自动化智能科学计算

我们现在正在经历数字3.0时代,之前有内容数字化为主的1.0时期,也有信息网络化为主的2.0时期,在人工智能兴起的这一轮,数字3.0是将信息与物理世界、生物世界融合的智能感知时代。

现在有公司试图用计算的方式加入传统实验,来成为一种可以盈利的服务。AI其实已经在加速生命健康与生物医药领域的发展。开发一种新药平均需要10余年的时间以及25亿美金的资金投入,这养的每个人都可以用的平均药,还远没有到个性化医疗的程度。AI已经有很多方式来加速相关领域的发展。例如AICRISPR基因编辑来寻找靶点,以加速新靶点的开发。再例如抗体/TCR/个性化的疫苗、蛋白质结构甚至下一步功能的端到端预测。同时,也有一些研究人员在通过机器人技术来自动化湿实验。

2.健康计算:用计算的方法(人工智能、数据驱动的第四研究范式)辅助人类探索并解决生命健康的问题。

两个领域中间的知识GAP较大,相比于原来的CV/NLP等领域更需要专业知识。生物领域的数据并没有统一的标注,获取相应数据的难度也较大,迭代速度相应受到较大影响。与此同时跨界的人才也非常稀缺。这是非常大的挑战,但是这也是我们的机会。

3.推动生命科学、生物医药、基因工程、个人健康各领域从鼓励、开环向协同、闭环发展

推进这几个领域有几个策略,如对生物医疗大数据进行更深入的挖掘,如医疗知识库、文献数据库等并没有很好的被利用,如并没有专门对该领域所设计的预训练模型,而构建这样一个模型需要同时有AI以及相对应的医疗领域的专业知识。

4.清华智能产业研究院(AIR):健康计算研究在AIR有四个子方向:

AI增强个人健康与公共卫生:从测量、评估、知道、干预以及到健康管理,形成一个数据闭环,以更好的利用AI的优势。

AI医疗与生命科学:如智慧医疗、医疗相关的知识图谱与知识引擎,可能需要用到医疗相关知识以及representationlearning相对应的技术。

AI新药发现与制造:目前AIR有合作教授即将加入。我们认为现有挑战是公开优质的数据较为稀缺,我们希望在这一块利用基因编辑基因工程等手法来增强对靶点的预测;药物设计针对大分子药,相比小分子挑战更大,机会也更大;药物疗效预测闭环,能开发可解释的药物疗效模型。或基于现有药进行推荐。针对第三期失败的药,分析个性化疗效,以推荐适合的病人,增加药物使用效率和精准度。

基因组分析和编辑:数据压缩编码、基因搜索以及基因价值发现。

5.TDC数据集:

美国六所大学合作收集并整理的,能直接运用于机器学习及其他AI技术的数据库,这是一个非常有意义的工作。如果我们能创建一个类似于计算机视觉中ImageNet数据集一样意义的医疗领域的数据集,那是一个非常不得了的工作。

6.同时也有一个AI生命科学破壁计划:

a.提供一个旗舰式的数据集

b.为生命科学家广泛采用应对复杂生物医学挑战的人工智能技术奠定基础

马维英教授也表达了希望中国也有这样一个破壁计划的心愿。这样的计划也会带来更多的尖端跨界人才。

7.通过AI技术的发展,我们可以从多个方向来增强个人健康的管理和改善健康状态。

现在人一般得了病了才去看医生,技术发展到现在我们应该转变这样被动的方法,而转为主动的,AI主导的健康管理。如新一代的可穿戴式设备,能够对血糖进行更好的监控。再比如AI作为嗅觉感知器来收集健康信息。

基于个性化推荐引擎的智能健康管理系统。如慢性病的判断,如外卖公司对饮食进行统计,通过对食物全链条的数据使用AI处理和分析,能够对个人健康产生较大意义。

增强个人健康的关键技术包括支持健康计算的多模态AI、面向健康计算的知识图谱与推理、个性化推荐引擎,以及,因为相关数据较为敏感,面向隐私保护的机器学习。

8.多模态AI:

通过不同的表达和模型,来完成更好的、协同的优化学习,也是一个非常关键的技术和研究方向。

9.总结

健康计算随着数字化3.0时代的到来,也迎来了前所未有的挑战和机遇。马维英教授认为健康计算将推动生命科学、生物医药、基因工程以及个人健康等各领域从孤立、开环向协同、闭环发展。基于此,人类健康服务也将更快速、精准、安全、经济、普惠。健康计算下个十年蕴含着巨大的科学发展与产业创新的机会。

点击此处阅读原文

撰文/RuiWang

编辑排版/冼晓晴

校对责编/黄妍

新一代人工智能的发展与展望

    随着大数据、云计算等技术的飞速发展,人们生产生活的数据基础和信息环境得到了大幅提升,人工智能(AI)正在从专用智能迈向通用智能,进入了全新的发展阶段。国务院印发的《新一代人工智能发展规划》指出新一代人工智能相关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,推动经济社会各领域从数字化、网络化向智能化加速跃升。在4月10日“吴文俊人工智能科学技术奖”十周年颁奖盛典中,作为我国不确定性人工智能领域的主要开拓者、中国人工智能学会名誉理事长李德毅院士荣获“吴文俊人工智能最高成就奖”,并在大会上作题为《探索什么叫新一代人工智能》的报告,探讨了新一代人工智能的内涵和路径,引领着新一代人工智能的发展与展望。

    人工智能这一概念诞生于1956年在美国达特茅斯学院举行的“人工智能夏季研讨会”,随后在20世纪50年代末和80年代初先后两次步入发展高峰,但因为技术瓶颈、应用成本等局限性而均掉入低谷。在信息技术的引领下,数据信息快速积累,运算能力大幅提升,人工智能发展环境发生了巨大变化,跨媒体智能、群体智能成为新的发展方向,以2006年深度学习模型的提出为标志,人工智能第三次站在了科技发展的浪潮之巅。

    当前,随着移动互联网、物联网、大数据、云计算和人工智能等新一代信息技术的加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。在多源数据、多元应用和超算能力、算法模型的共同驱动下,传统以计算机智能为基础的、依赖于算力算法和数据的人工智能,强调通用学习和大规模训练集的机器学习,正逐渐朝着以开放性智能为基础、依赖于交互学习和记忆、基于推理和知识驱动的以混合认知模型为中心的新一代人工智能方向迈进。应该说,新一代人工智能的内核是“会学习”,相较于当下只是代码的重复简单执行,新一代人工智能则需要能够在学习过程中解决新的问题。其中,学习的条件是认知,学习的客体是知识,学习的形态是交互,学习的核心是理解,学习的结果是记忆……因此,学习是新一代人工智能解释解决现实问题的基础,记忆智能是新一代人工智能中多领域、多情景可计算智能的边界和约束。进而当人类进入和智能机器互动的时代,新一代人工智能需要与时俱进地持续学习,不断检视解决新的问题,帮助人机加深、加快从对态势的全息感知递进到对世界的多维认知。

    事实上,基于数据驱动型的传统人工智能,大多建立在“数据中立、算法公正和程序正义”三要素基础之上,而新一代人工智能更关注于交互能力,旨在通过设计“记忆”模块来模仿人脑,解决更灵活多变的实际问题,真正成为“不断学习、与时俱进”的人工智能。特别是人机交互支撑实现人机交叉融合与协同互动,目前已在多个领域取得了卓越成果,形成了多方面、多种类、多层次的应用。例如,在线客服可以实现全天候不间断服务,轻松解决用户咨询等问题,也可将棘手问题转交人工客服处理,降低了企业的管理成本;在智慧医疗领域,人工智能可以通过神经影像实现辅助智能诊断,帮助医生阅片,目前准确率已达95%以上,节省了大量的人力;2020年,在抗击疫情的过程中,新一代人工智能技术加速与交通、医疗、教育、应急等事务协作联动,在科技战“疫”中大显身手,助力疫情防控取得显著成效。

    未来已来,随着人工智能逐渐融入居民生活的方方面面,将继续在智慧医疗、自动驾驶、工业制造智能化等领域崭露头角。一是基于新一代人工智能的智慧医疗,将助力医院更好记录、存储和分析患者的健康信息,提供更加精准化和个性化的健康服务,显著提升医院的临床诊断精确度。二是通过将新一代人工智能运用于自动驾驶系统的感知、预测和决策等方面,重点解决车道协同、多车调度、传感器定位等问题,重新定义城市生活中人们的出行方式。三是由于我国工业向大型化、高速化、精细化、自主化发展,对高端大规模可编程自动化系统提出迫切需求,新一代人工智能将推动基于工业4.0发展纲领,以高度自动化的智能感知为核心,主动排除生产障碍,发展具备有适应性、资源效率、人机协同工程的智能工厂应运而生。总之,如何展望人工智能通过交互学习和记忆理解实现自编程和自成长,提升自主学习和人机交互的效率,将是未来研究着力发展的硬核领域,并加速新一代信息技术与智能制造深度融合,推动数字化转型走深走实,有信心、有能力去迎接下一场深刻产业变革的到来。

人工智能在药物研发和生物技术中的应用:回顾与展望

人工智能(Artificialintelligence,AI)的出现正在重新塑造整个制药和生物技术行业的发展。几乎所有大大小小的生命科学和药物发现机构,都对采用人工智能驱动的发现平台表现出浓厚的兴趣,希望通过AI来简化研发工作,减少发现时间和成本,并提高效率。

许多大的制药公司,如J&J、GSK、AstraZeneca、Novartis、Pfizer、Sanofi、EliLilly等,都对人工智能技术进行了大量投资,包括股权投资、收购或与专注于人工智能的公司合作、建立内部能力,或结合各种方法。同时,有一波新型的药物发现和生物技术公司作为以人工智能为中心的组织而建立。这些公司大多在过去十年内成立,已经建立并测试了专门的人工智能驱动的药物发现平台。已经有一批由人工智能开发的候选药物进入临床试验或即将进入临床试验。

许多人工智能公司开始使用复杂的多模态数据建立生物学模型,其规模在二十年前是无法想象的。还有一组公司开发了人工智能驱动的平台,以提高操作效率和临床试验的实验设计或现实世界的数据分析(如药物警戒)。

许多科技公司,如Alphabet、微软、亚马逊、IBM、百度、华为和腾讯等,在人工智能和大数据技术方面具有能力和专长,也在进军药物发现领域,通过投资、创办初创公司、与生命科学公司合作、实验、创新等。

最后,其他前沿技术,如量子计算、低温冷冻电镜、DNA编码化合物库等,也取得了重大进展。这些技术与人工智能趋势相融合,不仅产出了新型的工具、产品和服务,也带来了一波新的创业公司,甚至是新的商业模式。

显然,AI被广泛应用于制药行业的几乎每一个环节,从数据挖掘、生物建模、靶标发现到候选化合物确证和临床前及临床研究。它还被用于合成规划、试剂和研究消耗品的智能搜索,以及智能实验室笔记本和虚拟助手等辅助任务。

2022年人工智能药物研发投资状况

如果说2021年是生物技术行业在风险投资交易额方面异常成功的一年,那么2022年则表现出金融活动的明显降温,股票市场的表现完全不佳。

然而,药物研发领域的AI表现出一定的弹性,至少在私募股权交易领域是如此,有几家公司筹集了数亿的风险资本。一些例子包括位于北京的MegaRoboTechnologies(3亿美元的C轮融资)、位于马萨诸塞州的ConcertAI(1.5亿美元的C轮融资)、和CelsiusTherapeutics(8300万美元的A轮融资)、位于香港的InsilicoMedicine(9500万美元的D轮融资)、位于加州的BigHatBiosciences(7500万美元的B轮融资)和DeepCell(7300万美元的B轮融资)等。   

并购(M&A)方面,最近有一项引人注目的交易,涉及生物技术巨头GinkgoBioworks收购Zymergen的交易,Zymergen的估值为3亿美元。这次收购将Zymergen的机器学习和数据科学能力与Ginkgo的合成生物学平台结合起来。

人工智能驱动的生物建模和靶标发现

药物研发中,确定新的药物靶标对于开发新的first-in-class药物至关重要。过去几十年的药物发现工作,传统上是以具有适当"口袋"的特定蛋白质为靶标,配体分子结合靶标产生影响。但在所有人类蛋白质中,只有少数蛋白质被作为靶标进行探索。目前在Swiss-Prot中有20,360个人类蛋白质,根据OMIM数据库,其中约有4,600个已知参与了疾病机制,约占在疾病中发挥作用的人类蛋白质的22%。这些蛋白质是人类蛋白质组中可能包含可行的药物靶标的明显区域。然而,截至2017年,只有约890个人类和病原体衍生的生物大分子(主要是蛋白质)被现有的FDA批准的药物实际利用。这些生物大分子包括667个人类基因组衍生的蛋白质被药物用于治疗人类疾病。今天的情况没有什么不同,所以在这个池子里仍有很大的空间来确定新的靶标。基于人工智能技术的新型计算方法可以大规模地识别新的可成药蛋白质口袋,有时还可以进行全蛋白质组的虚拟筛选。但更令人兴奋的是,先进的建模工具有助于识别和调控新型靶标,如蛋白质-蛋白质相互作用、具有大接触面积的靶点、蛋白质-核酸相互作用以及下一代靶点,如利用细胞的蛋白降解机制。

很多人工智能驱动的公司专注于建立生物学模型,发现和验证新的靶标,并向其他组织提供"疾病模型服务"或"靶标发现服务"。对这种合同研究服务的需求正在上升,这反映在越来越多的靶标发现伙伴关系上。例如,2022年9月,一家位于以色列的生物建模公司CytoReason宣布与辉瑞公司扩大1.1亿美元的合作。这两家公司于2019年开始合作,当时辉瑞公司开始在研究中使用CytoReason的生物模型,旨在开发免疫介导的疾病和癌症免疫疗法的新药。2022年5月,阿斯利康宣布与英国人工智能驱动的药物发现领导者BenevolentAI的合作中收集了第二个肺纤维化靶标。仅仅几个月后,在2022年10月,BenevolentAI成功地为阿斯利康的研发提供了另外两个人工智能生成的靶标,靶标是慢性肾脏疾病和特发性肺纤维化。

2022年11月,总部位于香港的InsilicoMedicine与赛诺菲公司签署了一项价值12亿美元的潜在交易,利用InsilicoMedicine的"Pharma.AI"平台发现多达六个新靶标。

总而言之,基于人工智能的先进建模方法有助于重新定义生物靶标,因为我们试图将药物反应与遗传变异联系起来,了解分层的临床疗效和安全性,合理安排同一治疗类别的药物之间的差异,并预测药物在病人亚群中的效用。

用AI破解结构生物学难题

2022年生命科学界讨论最多的人工智能相关话题之一是Alphabet在英国的子公司DeepMind最近取得的成功,该公司因成功破解蛋白质折叠问题而受到广泛报道,这是一个有半个世纪历史的生物问题。2022年7月,DeepMind的深度学习软件AlphaFold预测并公开分享了超过2亿种蛋白质的结构,已经证明了其人工智能系统仅从其一维氨基酸序列就能准确预测三维结构的惊人能力。虽然有人认为,这一发现可能(还)不会像人们假设的那样在药物发现方面有如此大的变革作用,而且AlphaFold在预测细菌蛋白质-抗菌化合物相互作用时的表现并不比偶然性好多少,但这一发现对于结构生物学和说明人工智能在基础生物学研究中的潜力来说,无疑是改变了范式。

2022年11月,DeepMind在蛋白质组建模方面取得的突破性成功与Meta(前身为Facebook)的研究人员展开了竞争。Meta的研究人员使用AI来预测来自细菌、病毒和其他尚未表征的微生物的大约6亿种蛋白质的结构。Meta的科学家们使用了一种完全不同的人工智能方法——“大型语言模型”,这是一种可以根据几个字母或单词预测文本的人工智能。自然语言模型(NLP)通常在大量文本上进行训练。然而,一维蛋白质序列本质上是字母串,因此NLP可以像处理人类语言一样应用于此类问题。 

有趣的是,蛋白质折叠方面的这种重大技术飞跃可能会被证明对新的蛋白质设计更有用,而不是简单地对现有蛋白质的结构进行建模以发现药物。时间会告诉我们影响最大的地方,但DeepMind和Meta的上述成功并不是2022年结构生物学家唯一令人兴奋的发展。在上月举办的CASP15大赛中,已经有相当一部分计算机软件,如密歇根大学的D-I-TASSER等,在预测精度方面,已经明显超过AlphaFold。

最近,冷冻电镜的快速发展,加上人工智能技术,诞生了新一波生物技术初创企业,如GandeevaTherapeutics、Septerna和MOMATherapeutics。冷冻电镜领域正在升温,生物技术初创公司吸引了众多投资者的关注,从小型风险机构到TikTok的所有者和互联网技术巨头ByteDance,都在投资水木生物科学。这种兴趣不仅是由革命性的诺贝尔奖技术推动的,也是由积极招募人工智能参与这一过程推动的。最近发表的"用于细胞提取物结构研究的人工智能辅助低温电镜管线"强调了人工智能在复杂的低温电镜管线中不可替代的作用,包括人工智能驱动的原子模型预测,以快速和同时研究多个蛋白质的结构。机器学习不仅有助于加快和优化低温电镜管线,而且还能避免用户偏见的陷阱。

利用AI开发小分子药物

疾病建模和靶标发现之后,分子设计是将人工智能应用于药物发现的第二大用例。 人工智能驱动的药物设计主要分为三大类:从头药物设计、现有数据库的虚拟筛选和药物再利用。从头药物设计主要由深度生成学模型实现。生成式AI平台的一些示例包括InsilicoMedicine的Chemistry42软件、Iktos的Makya和Ro5的DeNovoPlatform。此类别中的其他参与者包括RecursionPharmaceuticals、DeepCure、Standigm等。 

应用人工智能赋能的超大规模虚拟筛选,从数十亿分子中筛选出成功的苗头化合物。2022年8月,赛诺菲与Atomwise合作进行了一项价值可能高达12亿美元的药物设计交易。这笔交易将使赛诺菲预付2000万美元,重点是利用这家美国公司的AtomNet平台研究赛诺菲选定的多达五个药物靶标的小分子。根据公告,基于卷积神经网络的AtomNet擅长基于结构的药物设计,能够“快速、人工智能地搜索Atomwise的超过3万亿种可合成化合物的专有库”。  

最后,许多公司正在使用再利用策略来发现支持AI的药物。这一类别的公司,包括Healx、BenevolentAI、BioXcelTherapeutics,主要使用自然语言处理(NLP)模型和机器学习,并通过分析大量非结构化文本数据——研究文章和专利、电子健康记录(EHR)、以及其他数据类型——构建和搜索“知识图谱”。这种支持AI的可搜索本体允许为先前已知的候选药物甚至批准的药物选择新的适应症或患者群体。  

最后,一些公司正在使用再利用策略进行人工智能药物发现。这一类的公司,包括Healx、BenevolentAI、BioXcelTherapeutics,主要使用NLP模型和机器学习,通过分析大量的非结构化文本数据:研究文章和专利、电子健康记录(EHR)以及其他数据类型来建立和搜索"知识图谱"。

人工智能与DNA编码化合物库的结合

一个有点独特的药物设计方法是使用DNA编码化合物库(DELs)作为新分子的来源来进行搜索。由于DEL技术提供了对市场上最大化学空间的访问,这种大数据技术自然适合基于人工智能的工具。

2020年发生了一笔引人注目的交易,当时由DaphneKoller创立的机器学习药物发现应用的著名企业之一Insitro收购了HaystackSciences。Haystack基于机器学习平台结合了他们DEL技术的多个要素,包括合成广泛、多样的小分子集合的能力,执行迭代跟进的能力,以及一种名为nDexer™的专有半定量筛选技术,产生更高分辨率的数据集。

反过来,ZebiAI在2021年被另一家著名的人工智能药物发现平台开发商收购,这是一家处于临床阶段的生物技术公司RelayTherapeutics,Relay支付了8500万美元的预付款。这次收购让Relay将ZebiAI基于机器学习的DEL技术纳入他们的蛋白质靶向平台Dynamo。 

超越小分子的人工智能驱动的药物设计

考虑到应用于药物发现的现代人工智能工具在化学信息学和上个世纪早期基于机器学习的QSAR模型中有着深厚的历史渊源,药物发现领域的绝大多数人工智能初创公司都专注于小分子也就不足为奇了。

然而,生物大分子药物(又称"生物制品")和新型化学模式在制药领域越来越丰富,应用基于人工智能的方法来发现这些的新生物技术公司也是如此。2003年科学家破解了人类基因组后,可成药和可开发性空间迅速发展。在上个世纪,Lipinski’s五项规则(Ro5)曾经作为"传统"类药性目标空间中口服给药的类药分子设计的"指路明灯"。相比之下,新类型的靶点,如蛋白质-蛋白质相互作用、具有大接触面积的靶点、蛋白质-核酸相互作用,以及下一代靶点,如利用细胞的蛋白质降解机制,正在推动各种新兴分子模式的出现。即超越Ro5(bRo5)的小分子、PROTACs、单克隆抗体(mAbs)、肽和拟肽剂以及基于核酸的方式(RNA和DNA),已成为药物发现的重点。 

第一波AI开发的候选药物进入临床阶段

虽然现在说人工智能在制药业的应用彻底改变了药物发现,可能还为时过早,但一些"人工智能原生"公司确实设法在快速建立其治疗管线方面获得了显著的效率。这些公司的一个共同特点是什么?每个人都建立了一个专门的、高度集成的人工智能平台,包括许多模型和数据源。一些平台还可以作为软件即服务提供给外部研发伙伴,如Chemistry42。

业界看到的受益于"数字优先"战略的最生动的例子之一是ModernaTherapeutics公司,它不仅设法将尖端的人工智能分析纳入其研究,而且将其研发工作流程的每个方面都数字化和集成化,包括生产和分销。当COVID-19大流行病在2020年初袭击世界时,Moderna是第一批能够在短短2天内拿出高效的基于mRNA的疫苗并在一年内将其推向市场的公司之一。由人工智能促成的一波疗法发现的成功表明,人工智能公司有能力比过去类似项目所需的时间更快提出候选药物。

未来的AI和机器人化的实验室

深度学习模型极度“数据饥渴”,这意味着无论AI有多好,数据的质量和大小对于有意义的研究预测同样重要。生成高质量生物学数据的最有效方法是使用机器人技术。如果我们将现代人工智能驱动的药物发现转型视为一个循序渐进的过程,那么广泛可用且相对具有成本效益的机器人将是人工智能驱动的制药和生物技术研究产业化的最后一块关键。

一些公司正在建设标准化、高度自动化、可扩展且兼容性越来越强的实验室设施,这些设施以基于人工智能的实验控制系统为指导,并辅以人工智能驱动的数据挖掘和分析能力。这种“下一代”实验室设施正变得可供临床前药物研究实验人员远程使用,使临床前实验成为更具可扩展性和标准化的程序。该空间正在吸引风险投资和客户。例如,2022年2月,总部位于英国的AutomataLabs筹集了5000万美元以实现实验室研究过程的自动化。2021年7月,Strateos筹集了5600万美元,用于进一步改进其SmartLab平台及其远程机器人化、自动化技术,可供全球临床前研究人员使用。CultureBiosciences总共筹集了超过1亿美元的资金,最新的B轮融资是在2021年11月宣布的8000万美元。总部位于旧金山的EmeraldCloudLabs(ECL)多年来筹集了超过9000万美元。ECL的remove机器人平台的早期用户报告了300%到700%的改进在研究生产力方面。2022年6月,总部位于北京的MegaRobo筹集了3亿美元,以扩大其多样化的自动化AI驱动远程实验室服务和机器人化设施。 

远程机器人化实验室的兴起是一个长期的行业趋势,这是一种提供合同研究服务的新方式,对于长期采用以数据为中心的“AI优先”研究策略极为有利。一些领先的人工智能药物发现公司,如Exscientia和InsilicoMedicine,现在也在建立内部机器人化实验室,以建立其内部数据生成"肌肉"。

用AI解决临床试验的瓶颈

临床试验是药物开发工作流程的关键阶段,从Phase1到批准的候选药物的平均成功率估计约为11%。即使候选药物安全有效,临床试验也可能因资金不足、入组人数不足或研究设计不佳而失败。 

人工智能(AI)越来越被视为提高临床试验运营效率和最小化临床开发成本的机会来源。通常,人工智能供应商在三个主要领域提供服务和专业知识。第一个领域的AI初创企业通过应用自然语言处理(NLP),帮助从不同的数据源(如科学论文、医疗记录、疾病登记,甚至医疗索赔)中解锁信息。这可以支持患者招募和分层、地点选择,并改进临床研究设计和对疾病机制的理解。

临床试验成功的另一个方面是改善患者分层。由于试验患者的费用昂贵——2017年招募一名患者的平均费用为15,700-26,000美元——因此必须能够预测哪些患者将从治疗中获得更大的益处或风险。AI驱动的公司使用多种数据类型,例如电子健康记录(EHR)、组学和成像数据,以减少人口异质性并提高临床研究能力。供应商可以使用语音生物标志物来识别神经系统疾病的进展,使用成像分析来跟踪治疗进展,或使用遗传生物标志物来识别症状更严重的患者。

人工智能还在简化临床试验的操作流程。人工智能供应商帮助在家中跟踪患者的健康状况、监测治疗反应以及患者对试验程序的依从性。通过这样做,人工智能公司降低了患者退出的风险,平均占30%。通常,3期临床研究阶段需要1000-3000名参与者,其中一部分服用安慰剂。工智能模型可以取代个体的安慰剂对照组,从而减少临床试验所需的个体数量,可能成为一种新趋势。

尽管生物技术领域的整体投资环境冷淡,但对支持AI的临床试验平台的需求以及该领域的投资仍然很高。

CRO中的人工智能

临床前和临床领域新型AI原生合同研究公司的出现挑战了主要成熟合同研究组织(Contractresearchorganizations,CRO)的现状。他们通过将AI纳入他们向制药公司提供的服务或与AI公司合作来补充他们的研究能力。

IQVIA多年来一直投资于AI,以增加其为客户提供的临床试验和商业活动的价值。例如,为了改进临床试验,IQVIA于2020年推出了AvacareClinicalResearchNetwork™,该网络允许站点更快、更有效地为试验匹配患者。该平台由AI算法提供支持,可以在19个疾病领域运行。此前,IQVIA的另一款Linguamatics自然语言处理(NLP)平台获得了Questex的2019FierceInnovationAwards。该平台可以在医疗保健和生命科学领域拥有广泛的应用,包括靶标识别、基因定位、预测患者结果等。

临床研究行业的一个重要趋势是运行虚拟临床试验,这是一个价值80亿美元的市场。COVID-19大流行迫使制药公司转向远程监控、改进患者登记、跟踪患者参与度的应用程序、远程医疗、权力下放以及其他保持试验运行的措施。由于对此类解决方案的需求显着增长,CRO急于为其服务产品添加虚拟和去中心化功能。事实证明,人工智能技术在创建和运行此类项目以帮助合成数据和加快临床试验过程方面具有无可估量的价值。 

科技巨头追捧药物研发和生物技术

 前面提到的Alphabet的DeepMind和Meta在解决基础生物学研究难题方面的成功,例如使用深度学习和语言模型大规模预测蛋白质结构,只是冰山一角:几乎每个领先的技术巨头现在都在生命科学行业倾注力量。 

Alphabet(谷歌母公司)投资了数十个生命科学项目,包括基于人工智能的试剂搜索引擎BenchSci、个人基因组学公司23andMe,以及人工智能驱动的药物开发独角兽OWKIN等。2021年,Alphabet联合DeepMind推出IsomorphicLabs,专注于应用人工智能破解基础生物学和药物发现。除了药物研究和生物技术领域的多个其他项目和活动外,Alphabet还拥有一个全面的实体Verily,致力于生命科学和MedTech。 

微软是一家全球软件开发商,在生命科学领域有着深厚的影响力,与大型制药公司进行了数十项研究合作,提供其基础设施以使用大规模机器学习模型处理大数据。微软的最新举措包括MoLeR模型,这是该公司的生成化学团队与诺华公司合作开发的一种新工具。与其他生成工具不同,MoLeR模型使用深度学习根据给定的骨架提出新结构,该骨架充当生成过程的初始基础。另一个例子是AI4Science,微软的一项新事业结合了计算化学、量子物理学、机器学习、分子生物学、流体动力学和软件工程,以实现所谓的科学“第五范式”的愿景。 

这方面特别活跃的公司是游戏行业和个人电脑的硬件生产商NVIDIA。这家科技公司推出了ClaraDiscovery,它是框架、应用程序和AI模型的集合,支持GPU加速药物发现,支持基因组学、蛋白质组学、显微镜、虚拟筛选、计算化学、可视化、临床成像和自然语言处理(NLP)。2022年3月,该公司推出了ClaraHoloscanMGX™,这是一个供医疗设备行业在边缘开发和部署实时AI应用程序的平台,专为满足所需的监管标准而设计。ClaraHoloscan旨在提供一体化的医疗级参考架构以及长期软件支持,以加速医疗设备行业的创新。

AI在药物发现中的未来:所有东西都是"量子"

大多数用于药物发现和生物学研究的软件工具都依赖于分子力学——分子的简化表示,本质上将它们简化为“球棒”:原子和它们之间的键。这样,计算起来更容易,但准确性会受到很大影响。为了获得足够的准确性,必须考虑原子和分子的电子行为,即考虑亚原子粒子——电子和质子。这就是量子力学(QM)方法的全部意义所在——该理论并不新鲜,可以追溯到20世纪初期。 然而,量子方法的计算成本异常高——而且直到最近几十年,它一直是量子理论影响事物实际方面的一个令人望而却步的障碍。由于可用计算能力呈指数级增长,量子方法终于成为科学家手中有价值的工具。 

另一个更具未来感的技术趋势,利用量子理论,涉及创建量子计算机。随着量子理论几十年的进步以及多个软件和硬件领域的同步进步,我们终于进入了量子计算机变得实用的时代。当我们处于量子计算的早期阶段时,一些公司已经将量子计算的元素整合到计算药物发现中。 

参考文献:

https://www.biopharmatrend.com/post/615-pharmaceutical-artificial-intelligence-key-developments-in-2022/

人工智能在生物医药领域的应用

图2:基于AI开发的黄斑变性和糖尿病性黄斑水肿诊疗系统CC-Cruiser

图3:与现有的计算机分析方案(中)相比,新型人工智能(右)能更准确地找到肿瘤(图片来源:谷歌)

二.人工智能辅助新药研发

新药研发涉及到从上游到下游的几个环节:药物靶标的确定,先导化合物的筛选,先导化合物的优化,以及最终的临床实验。其具有研发周期长、资金投入大、失败率高等特定,一直是制药界的痛点。之前,计算机辅助药物设计(computeraideddrugdesign,CADD)的引入虽然给制药业带来了一些成功的案例,但依然没有根本的改观。而人工智能技术的崛起,则为新药研发带来了新的曙光[5]。自2017年以来,人工智能在制药领域的应用可谓如火如荼,国际制药巨头纷纷部署自己的AI系统,用于提高新药的研发效率,如Merck,Novatis,Roche,Pfizer,Johnson&Johnsone等。国内的晶泰科技(XtalPi)是一家以计算驱动创新的药物研发初创公司,其基于人工智能与云计算等技术,结合计算物理、量子化学、分子动力学等,旨在提高药物发现与发展这一关键环节的效率与成功率,从而降低研发成本。

三.人工智能辅助基因数据分析

二代测序技术产生了大量的测序数据,AI在基因大数据的分析上亦表现出良好的应用趋势。谷歌子公司Deepmind的科学家发表了一篇论文,提出一个名为DeepVariant[6]的检测工具,使用深度神经学习中的卷积神经网络(CNN)来检查基因组上的单碱基突变(SNP)和小的插入缺失(Indel),其准确性超越了当前主流的生物信息学软件GATK。传统的基因组关联分析(GWAS)大多只能检测单个点突变(SNP)与所研究疾病的关系,而DeepWAS[7],这一新提出的框架则能够根据功能单元,选择出一组SNP的集合,来更加综合地研究致病的基因突变,并能直接寻找调控区域的基因突变。在一项针对抑郁症的研究中,使用DeepWAS框架的研究发现了一个新的控制抑郁症的主要基因MEF2C。此外,人工智能分析基因组数据还可以实现对多种肿瘤的精确诊断。

结语:

目前,人工智能在医药领域的科研和产业发展均表现的可圈可点。毫无疑问,人工智能和生物医药领域的融合必将不断的深化和广化,更多的成功案例将不断涌现。但是也可以预见,AI应用的落地,仍需面对和解决许多问题,不仅仅是技术问题,还有伦理问题和社会问题。

参考文献

1.GulshanV,PengL,CoramM,StumpeMC,WuD,NarayanaswamyA,VenugopalanS,WidnerK,MadamsT,CuadrosJetal:DevelopmentandValidationofaDeepLearningAlgorithmforDetectionofDiabeticRetinopathyinRetinalFundusPhotographs.Jama2016,316(22):2402-2410.

2.LongE,LinH,LiuZ,WuX,WangL,JiangJ,AnY,LinZ,LiX,ChenJ:Anartificialintelligenceplatformforthemultihospitalcollaborativemanagementofcongenitalcataracts.NatureBiomedicalEngineering2017,1:0024.

3.EstevaA,KuprelB,NovoaRA,KoJ,SwetterSM,BlauHM,ThrunS:Dermatologist-levelclassificationofskincancerwithdeepneuralnetworks.Nature2017,542(7639):115-118.

4.XuT,ZhangH,XinC,KimE,LongLR,XueZ,AntaniS,HuangX:Multi-featurebasedbenchmarkforcervicaldysplasiaclassificationevaluation.PatternRecognition2017,63:468-475.

5.JingY,BianY,HuZ,WangL,XieXS:DeepLearningforDrugDesign:anArtificialIntelligenceParadigmforDrugDiscoveryintheBigDataEra.TheAAPSjournal2018,20(3):58.

6.PoplinR,NewburgerD,DijamcoJ,NguyenN,LoyD,GrossSS,McLeanCY,DePristoMA:CreatingauniversalSNPandsmallindelvariantcallerwithdeepneuralnetworks.bioRxiv2016:092890.

7.EraslanG,ArlothJ,MartinsJ,IuratoS,CzamaraD,BinderEB,TheisFJ,MuellerNS:DeepWAS:DirectlyintegratingregulatoryinformationintoGWASusingdeeplearningsupportsmasterregulatorMEF2Casriskfactorformajordepressivedisorder.bioRxiv2016:069096.

转自生信草堂公众号,已授权

生信草堂

浙大生信博士团队倾力打造的一个科研人员学习交流的公众微信平台。我们致力于科研社区服务,分享前沿的科技进展,提供生信分析方法,解读经典分析案例,公众数据库的挖掘和临床数据统计分析。在此我们欢迎各位的加入!

加微信bioinformatics88拉您进生信交流群返回搜狐,查看更多

新一代人工智能的发展与展望

随着大数据、云计算等技术的飞速发展,人们生产生活的数据基础和信息环境得到了大幅提升,人工智能(AI)正在从专用智能迈向通用智能,进入了全新的发展阶段。国务院印发的《新一代人工智能发展规划》指出新一代人工智能相关学科发展、理论建模、技术创新、软硬件升级等整体推进,正在引发链式突破,推动经济社会各领域从数字化、网络化向智能化加速跃升。在4月10日“吴文俊人工智能科学技术奖”十周年颁奖盛典中,作为我国不确定性人工智能领域的主要开拓者、中国人工智能学会名誉理事长李德毅院士荣获“吴文俊人工智能最高成就奖”,并在大会上作题为《探索什么叫新一代人工智能》的报告,探讨了新一代人工智能的内涵和路径,引领着新一代人工智能的发展与展望。

人工智能这一概念诞生于1956年在美国达特茅斯学院举行的“人工智能夏季研讨会”,随后在20世纪50年代末和80年代初先后两次步入发展高峰,但因为技术瓶颈、应用成本等局限性而均掉入低谷。在信息技术的引领下,数据信息快速积累,运算能力大幅提升,人工智能发展环境发生了巨大变化,跨媒体智能、群体智能成为新的发展方向,以2006年深度学习模型的提出为标志,人工智能第三次站在了科技发展的浪潮之巅。

当前,随着移动互联网、物联网、大数据、云计算和人工智能等新一代信息技术的加速迭代演进,人类社会与物理世界的二元结构正在进阶到人类社会、信息空间和物理世界的三元结构,人与人、机器与机器、人与机器的交流互动愈加频繁。在多源数据、多元应用和超算能力、算法模型的共同驱动下,传统以计算机智能为基础的、依赖于算力算法和数据的人工智能,强调通用学习和大规模训练集的机器学习,正逐渐朝着以开放性智能为基础、依赖于交互学习和记忆、基于推理和知识驱动的以混合认知模型为中心的新一代人工智能方向迈进。应该说,新一代人工智能的内核是“会学习”,相较于当下只是代码的重复简单执行,新一代人工智能则需要能够在学习过程中解决新的问题。其中,学习的条件是认知,学习的客体是知识,学习的形态是交互,学习的核心是理解,学习的结果是记忆……因此,学习是新一代人工智能解释解决现实问题的基础,记忆智能是新一代人工智能中多领域、多情景可计算智能的边界和约束。进而当人类进入和智能机器互动的时代,新一代人工智能需要与时俱进地持续学习,不断检视解决新的问题,帮助人机加深、加快从对态势的全息感知递进到对世界的多维认知。

事实上,基于数据驱动型的传统人工智能,大多建立在“数据中立、算法公正和程序正义”三要素基础之上,而新一代人工智能更关注于交互能力,旨在通过设计“记忆”模块来模仿人脑,解决更灵活多变的实际问题,真正成为“不断学习、与时俱进”的人工智能。特别是人机交互支撑实现人机交叉融合与协同互动,目前已在多个领域取得了卓越成果,形成了多方面、多种类、多层次的应用。例如,在线客服可以实现全天候不间断服务,轻松解决用户咨询等问题,也可将棘手问题转交人工客服处理,降低了企业的管理成本;在智慧医疗领域,人工智能可以通过神经影像实现辅助智能诊断,帮助医生阅片,目前准确率已达95%以上,节省了大量的人力;2020年,在抗击疫情的过程中,新一代人工智能技术加速与交通、医疗、教育、应急等事务协作联动,在科技战“疫”中大显身手,助力疫情防控取得显著成效。

未来已来,随着人工智能逐渐融入居民生活的方方面面,将继续在智慧医疗、自动驾驶、工业制造智能化等领域崭露头角。一是基于新一代人工智能的智慧医疗,将助力医院更好记录、存储和分析患者的健康信息,提供更加精准化和个性化的健康服务,显著提升医院的临床诊断精确度。二是通过将新一代人工智能运用于自动驾驶系统的感知、预测和决策等方面,重点解决车道协同、多车调度、传感器定位等问题,重新定义城市生活中人们的出行方式。三是由于我国工业向大型化、高速化、精细化、自主化发展,对高端大规模可编程自动化系统提出迫切需求,新一代人工智能将推动基于工业4.0发展纲领,以高度自动化的智能感知为核心,主动排除生产障碍,发展具备有适应性、资源效率、人机协同工程的智能工厂应运而生。总之,如何展望人工智能通过交互学习和记忆理解实现自编程和自成长,提升自主学习和人机交互的效率,将是未来研究着力发展的硬核领域,并加速新一代信息技术与智能制造深度融合,推动数字化转型走深走实,有信心、有能力去迎接下一场深刻产业变革的到来。

作者:徐云峰

catalogs:13000076;contentid:7688970;publishdate:2021-06-11;author:黄童欣;file:1623414511328-aff718d9-3742-46b0-b08c-e56bdd1ed8c8;source:29;from:中华读书报;timestamp:2021-06-1120:28:23;[责任编辑:]

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。

上一篇

下一篇