人工智能在现代制药和化学领域的应用瓶颈、创新与发展|《AI+科学汇编》
//引
///
AI+化学与医药
//编者按——翁经科
///
AI+化学与医药
伴随着计算机科学在二十世纪初的诞生,人类在信息存储及运用领域步入了一个崭新的时代。早期算法主要致力于解放重复繁琐的数学和逻辑运算。而随着计算机科学在生产生活中扮演的角色越来越重要,机器学习以及更广义范畴的人工智能的概念孕育而生。在之后几十年间中,相关机器学习的理论基础和各类算法已得到了长足的发展。特别是进入互联网时代后,大数据、算法和算力的有机结合让人工智能在诸多领域中的运用有了井喷式发展。
化学是自然科学的一门经典学科,旨在研究分子、原子层面物质的组成、性质、结构和变化规律。化学与人类的生产生活息息相关,在能源、材料、制药等领域都起到了至关重要的作用。传统化学研究和化学品生产很大程度上依赖理论指导下的实验,需要投入大量的人力物力,而且实践中的盲目性与未知性非常大,在很大程度上依赖于实践者的经验和水平。而在现代工业高速发展的大背景下,如何将人工智能领域的前沿成果运用在化学领域以提高生产力便成为一个必然的趋势。随之产生的AI+化学的交叉学科也给广大科研工作者和创业者提供了多维度广阔的探索空间。一系列新兴课题有待研究:化学分子结构和理化性质的数字化、化合物化学全合成或生物全合成途径的自动预测、化合物工业生产及纯化过程的优化、药物分子高通量计算筛选、药物分子与蛋白质靶点结合的预测与优化、药物分子在体内的毒理及代谢过程的预测。用人工智能辅助上述相关课题可以大大提高研发及生产效率。相比信息技术产业,人工智能在化学领域的应用也存在一系列挑战有待攻克:比如说,可用于训练的数据量少并难以集成使用;在基础研究层面上如何用数字语言表述化合物空间结构及理化性质;药物分子与人体的互作的机理及普适规律复杂程度远高于现有认知。
这次YOSIAWebinar活动,我们有幸邀请到了五位海内外AI化学领域的专家,一起畅谈这个新兴交叉学科的发展现状及未来展望,致力于用科学务实的态度来认识这个快速发展的新兴学科。嘉宾们通过分享自己的成长经历,来激励年轻一代根据自己的特点及兴趣来投身于新型交叉学科的创新与发展。
翁经科
麻省理工学院生物系副教授
白头生物医学研究所成员
未来论坛青创联盟成员
▍跨学科讨论
人工智能如何在制药和化学领域发挥作用
翁经科:讨论一下人工智能在制药化学的运用,以及能帮助解决哪些传统手段不能解决或者很难解决的问题。
杨庆怡:说到传统计算方法,我们一般会联想到量子力学计算方法或者分子动力学等方面的模拟计算方法。相对于经典的量子力学计算方法来说,AI模型能够覆盖更多的数据,从更多的数据里面获取信息,传统科学计算很难捕捉到这些信息,这是AI很大的优势。
比如上面提到的,深度学习模型能够通过对大数据的训练和学习提供更好的预测以及产生新的分子结构,这是以前经典的科学计算不能做到的。
杨东:现阶段AI的发展带来的最大帮助还是在新药研发,新药研发是一个系统工程,包括了很多环节。这些环节实际上都是非常耗时耗力的,以前都是以低效的方式进行,成本也非常高。一项新药的研发费用高、研发周期长、研发成功率低。随着AI技术的应用以及不断发展和成熟,可以为新药研发减负。值得一提的是,AI技术在药物靶点的设计上也有应用,可以利用自然语言处理技术让AI阅读海量文献,总结科学家的研究成果,来设计被人们忽略的药物靶点。
李成涛:我了解到科学计算由于计算复杂度的限制,所以计算过程中都会应用近似,这些近似可能会引入系统性的误差,这种误差很多都是没有办法除去的。相对于传统的计算方法,AI在数据量足够多的情况下,某种程度上可以减少或者去除系统性误差。这一现象有相关的理论支持,即当数据量足够的情况下深度学习网络可以拟合任意一个函数。从AI角度来讲,最核心的问题是研发规模。之前研发一款药可能几百个人一起讨论,可能最后设计出成百上千种分子。AI使我们能一次性模拟几百万种药物。只要模型是合适的,完全可以解决规模的问题。
AI在化学和制药领域的应用瓶颈
翁经科:人工智能在现代制药和化学领域的应用瓶颈在哪里?
裴剑锋:第一个瓶颈是数据问题。在药物研发应用场景下,数据很难自动产生。比如说,做天然产物的合成,数据不够,可能需要人来打标签,那可能十几轮跌代后就做不下去了,如果用模型来生成数据,精度和准度也是有限制的。另外,在药物研发里,很多数据没有阴性数据,但是作为机器学习的模型,负样本非常重要。没有这个负样本,数据就不平衡。这个问题始终存在,需要很大的数据系统来支持。
第二个瓶颈在于人工智能本身。药物研发就是人工智能的一个应用,也存在一些局限。因为药物系统本身很复杂,将一个前沿的东西应用到复杂系统,这里面就会出现瓶颈。比如药物专家的经验的学习和传承,人工智能很难处理。第三个瓶颈是人才,因为这是很强的交叉学科。
申威峰:在化工数据中,比如环境方面的物性数据是非常难收集的,这也是制药模型预测能力的非常重要因素。我们团队大部分工作都在做数据收集,数据收集的好坏直接影响模型预测能力。刚才裴剑锋教授提到药物的无效数据不好获取,但是化工厂内无效数据很多,因为我们化工厂一般都有一个DCS自动控制系统,它可以把所有数据都采集下来,但是有一个问题是很多数据是重复的、无效的,导致处理工作量非常大。
另一个比较大的问题是,人工智能技术大多是基于概率模型的,所以对一些现象和结果不能提供充分解释。所以无论制药行业还是化学领域,都有一定的特有知识、机理或者机制为标准,并不是所有问题都可以单纯用人工智能技术来解决。如何将基于人工智能技术的黑箱模型与化工领域的白箱模型(比如能量守恒、物料守恒等)结合,形成一套完善的研究方法,是目前化学和制药领域都面临的难题。
交叉学科的成才之路
翁经科:各位嘉宾走到今天进入了人工智能和化学制药领域,肯定都有自己独特的故事,所以想请大家分享一下,你们是怎么样进入到现在的职业轨道的?
杨庆怡:我的职业轨道比较简单,主要是幸运。我本科毕业以后就到美国读博士,博士毕业后就在GSK制药公司工作几年,然后来到辉瑞,一直从事计算化学工作。我们团队对AI非常感兴趣,也投入了很多研究,想发掘AI在制药上的潜力。
杨东:我本身是做生物信息学的,我的导师的课题组主要是做癌症研究。癌症非常复杂,每个人的肿瘤几乎完全不相同的,因为携带有不同的基因突变。科学家近几十年针对这些不同的突变开发出了上百种抗癌药物,但是癌症对症下药的问题到现在也不令人满意。
传统的办法是利用生物标记物判断病人是否适合某种药物。到现在为止,这个效果也不是特别令人满意。我最早接触到人工智能,是2016年AlphaGo战胜世界冠军的时候。
我发现AlphaGo能处理非常复杂的模式,当时就想可以通过人工智能的办法学习人类不同肿瘤基因组,实现对肿瘤患者的个性化用药。
于是我开始学习人工智能的知识,也开始写代码来实现人工智能的算法。研究过程中我发现光有病人肿瘤信息是不够的,还要把抗癌药物化合物的信息也融入进来。所以我又想办法学习了化学,把抗癌药物化合物的信息整合收入到人工智能体系里面,希望药效预测能做得更加准确。
所以我为了自己科研的目标,学习了不是自己主专业的知识。我一开始觉得人工智能离生物特别远,其实当真正投入到科研当中,感受到想要实现一个目标的时候,就不要考虑太多,就把自己的精力专注在知识里,哪怕不是这个领域的,认真学习还是能够慢慢的掌握。并且AI现在还是起步阶段,没有特别多知识需要积累。我建议大家不需要害怕,大胆去尝试,认真读文献,亲自做实现,最终还是能达到自己研究的目标。
李成涛:我从本科到博士一直在从事人工智能领域的研究,在博士期间萌生了创业的思想,后来才转向人工智能和化学这个交叉领域,然后创立了星药科技。我本科一直在学计算机,化学基础有限。为了多了解领域知识,上过课,看过书,现在对人工智能+新药研发领域有了对框架的整体了解。
2019年初,我提前毕业然后做了这家公司,到现在也就摸爬滚打了一年半,还在不断学习和进步中。作为原本是人工智能专业的人,要进入化学领域或者制药领域其实是有一定门槛的,当时花了很多时间,但我觉得这件事情确实很有意义也很有意思。就我个人经历而言,假如你是做AI的人,对其它领域感兴趣,不妨多花一些时间了解,坚持去做。
申威峰:我过去的科研方向是计算机辅助化工生产,对化工生产过程进行模拟、优化和控制,这和人工智能还是比较接近的。2016年回国后,我们团队开始进入人工智能方向。化工行业很多高端产品需要国外进口,因为国内的技术比国外差很多。但是现在我们可以通过更智能的工具来辅助精准决策,从而提高产品质量。
关于化工领域的人才培养,这个方向是交叉学科,需要同时学习两个学科的知识和技能。我呼吁国内高校开办相应的交叉专业,目前有人工智能专业兴起,但是交叉的专业还没有,所以开设交叉专业,配置相应的课程和教学计划。在学生学习化学知识的同时,可以加强数学理论、化学信息、软件开发相关课程的学习,这样才可以适应未来对交叉学科领域人才的需求。
裴剑锋:我是学生物出身,当时比较喜欢计算机,自学了很多计算机的知识,博士的时候转到计算机辅助设计,我一直在这个方向上走。关于交叉人才培养,有药学和化学基础的可以多学习一些人工智能的知识。关于交叉人才培养,无论是学药学、学化学,可以先在专业方向打好基础,再学习人工智能知识。
北大前沿学科研究院是国内第一家专业以交叉学科为主的研究院,注重培养各方面的交叉人才。如果想进入这个行业,希望同学们多开发一些底层的算法或者代码,少在别人基础上发展,这对于中国的学科发展非常重要。
制药、化学和AI的未来十年
翁经科:请各位预测,十年以后制药、化学、人工智能的未来发展前景。
杨庆怡:未来很重要的一个发展方向是数据变得越来越多,化学数据库平台可以给化学家和生物化学家提供很大的便利。在化学信息学的基础上,如果AI技术能够从信息里面探索出真正的知识,更一步将数据变成知识,相信能够带来更大的突破。比如,更准确地预测分子结构,更高效率地找到初始小分子候选清单,这对小分子和靶点识别的研发非常有用。
杨东:现在化学新药的研发已经开始运用计算机的算法来辅助药物设计进行虚拟的筛选模式。目前可供计算的范围或者预测能力还比较有限,还是要大量依靠人工做实验去验证。
十年以后,很可能人们还是以计算机结合实验验证的模式进行,唯一不同是人工智能技术的不断成熟以及数据的积累,二者的占比会发生很大变化。可能未来进行大量模拟计算预测将成为主要部分,包括靶点发现、药物筛选、优化都是由AI来完成。经过若干轮的严格模拟筛选,只剩下很少的分子,我们才会人工做实验来合成,然后验证安全性和有效性。
李成涛:十年之后,人工智能的发展主要在三个方面,分别是算法、数据和算力。算法就不用说了,也很难预测,但是相信会有长足发展。第二是数据,我们现在有很多方式积累数据,比如实验室做的实验数据可以作为积累,当然也有高通量的实验平台,这也为积累数据提供了便利。
数据量足够之后,机器学习模型可以拟合到和自然更贴切,这样输出结果相对就会更好。第三是算力,尤其是专有芯片。比如说,现在摩尔定律暂时失效了,但是专有芯片发展还是很快的。相信十年之后人工智能会对整个制药和化学领域产生非常深远影响,具体就体现它能算的更快、规模更大、算的更准。
裴剑锋:如果GeneralIntelligence未来十年发展的很好的话,场景就非常乐观。比如在计算化学和化学机制的预测上,可以看到机器学习,量化和密度泛函理论结合的很好,数据量足够的时候,计算精度已经接近那个精度了,并且它的速度很快。
如果采用不断迭代的方法,也许我们可以推动量化计算或者模拟它的体系的增大,对理论化学,这是非常有用的。另外,可能更多的数据大家会去注意积累,中国要成立国家数据中心,这也是非常重要的。可能十年后真的会产生一些比较大的突破。
General的东西,我最希望它在自然语言处理上产生巨大突破,这样真的是能够帮我们读文献,把这么多散乱的非结构化的信息,组织成有用的知识。这无论对哪个行业,对制药行业都是非常重要。
申威峰:以后基于人工智能的化学产品的开发软件或者是化工辅助决策软件会大量出现,科技工作者可以利用这些工具快速筛选想要的分子结构、产品配方、合成路线等,大大提高合成效率,保证高纯度产品。
同时,做化学合成或者药物合成的一些重复劳动力的科研工作者可能会减少,并将人才转移到从事人工智能和化工药物结合的方向上。人工智能技术不仅可以加速研究的进程,同时可以向着更绿色、更健康、更便捷的方向发展。
AI如何和制药、化工产业对接
翁经科:人工智能如何和制药、化工产业对接,以及学术界如何与工业界对接?
申威峰:对于化工方向,首先可以开发人工智能辅助的软件,帮助企业合成和分离过程的决策。另一方面,化工是一个质控系统,可以借助人工智能和化工制造系统结合,形成自优化、自诊断的智慧化工系统。
我们要基于人工智能大数据、物联网,化工厂的设备监测技术融合,来构建一个智慧化工决策系统,开发能够分析化工厂企业的在线数据,开发适用于物联网的传感器,开发质控系统和人工智能的交互平台,形成决策软件包,这样可以帮助企业在化工过程中化工厂里面优化生产效益、减少能耗,控制生产风险,同时提高产品质量,我认为可以通过这种方式来对接。
李成涛:关于人工智能如何和现有的制药或者化工产业对接,分两个方面,第一个方面从人工智能角度来讲,很多做人工智能的毕竟不是出身于药物研发或者化工产业,所以他对化工产业、药物研发的了解相对有限,需要多交流。比如说产业的痛点,人工智能能解决的问题,能提供什么产品,这对于企业非常重要。另外,从制药和化工产业角度来讲,多交流也非常有益。现在对人工智能了解相对比较少的领域专家,他们可能对其期待不高或不切实际。
杨东:人工智能现在存在可解释性问题,这个问题涉及医药、健康领域时,人们往往会比较谨慎。当人工智能预测一个药物没有副作用、没有毒性,虽然数据测试正确率很高,但是如果不能说明为什么没有毒性,大部分人都会持有保守态度,可能还需要时间检验,因为只要有1%的差错率都会带来严重后果。另一方面,学术界关心如何把化合物更好地进行表征,即使图神经网络比之前的分子指纹方法要好很多,已经能表征一些结构信息,但是也损失了一些化合物的信息,因为它只表征了二维信息甚至局部信息。要把整个化合物的结构以及影响生物活性的属性更好的表征成为数字化的信息输入神经网络,需要学术界进一步的开发和研究,可能会进一步提高化学合成的的预测准确度。
人工智能正在解放化学家的双手
原标题:人工智能正在解放化学家的双手近日,香山科学会议聚焦绿色生态与化学化工,除了各种前沿化学化工技术之外,人工智能在该领域的应用成为被关注的新议题。
“合成化学过程中的变数太多确实给通量制备和通量反应条件筛选增加了难度。但是在大数据与人工智能时代,这样的状况将会大大改变。”中科院上海有机化学研究所副所长马大为在会议上介绍,人工智能有望助力合成化学研究迈上新的台阶。
“劳动密集型”将成过去
“在有机合成领域,合成化学家在上个世纪就号称给予足够的学生和经费资助,可以合成任何复杂的有机小分子。但是直到今天,无论是新药开发还是新材料发展,人们发现过程的决速步骤往往还是化合物的合成。”马大为介绍。
马大为解释说,这是因为,尽管化合物性质的评估大部分已进入通量筛选阶段,但化学合成仍然停留在手工操作阶段。
在化学合成领域,由于不同化学反应条件下的无穷变化,研究人员设计化学合成路线基本上还是依靠手工――在药物分子合成领域尤其突出。这就让化学合成更像一种“劳动密集型”工作。
但在人工智能时代,这种状况将逐渐成为过去。基于大数据与人工智能的计算机程序在辅助研究人员进行化学合成路线设计方面开始变得越来越成熟实用。
去年4月,一个德国研究团队在《自然》期刊发表论文称,他们可以凭借人工智能系统以前所未有的速率进行化学合成分析,这将大大提升科研人员研发新药和其他化合物的效率。
根据这篇论文的内容,研究人员利用人工智能系统设计一个分子的合成路线,只需要5秒钟。马大为感叹说,人工去设计的话,5秒钟都来不及把分子结构看清楚,5分钟都不一定能把分子设计出来。
南京大学化学化工学院副教授李承辉了解到人工智能算法推荐分子的合成路线后,获得不少启发。他目前也在考虑如何用人工智能帮助他做化学研究。
李承辉前不久发现一种新的分子内成环反应,希望了解这种反应是否在其他分子内也存在。按照以前的研究方式,他的工作量会非常大。因为要检测这种反应是否具有普适性,需要用不同的分子做大量的实验才行。“如果有人工智能的帮助,就可以有针对性地去做这件事。”李承辉说。
开始扮演得力助手
“小通量的反应条件筛选设备已经在一些公司和大学变成常规武器,大通量的大型反应矩阵机器人已经诞生。”马大为认为,这些设备的普及化有可能为将来的合成化学研究带来巨大变化,在很大程度上解放了合成化学家的双手,让研究人员花更多的时间进行数据分析和反应的顶层设计。
马大为在接受科技日报记者采访时介绍,人工智能程序用于预测普通的化学小分子合成路线已趋于成熟。即使一些复杂的有机小分子比如药物分子,由于结构单元比较单一,合成反应并不是很多,人工智能程序可以直接辅助设计出合成路线。这对于初级的研究人员而言,会提供很大帮助。
“现在做药物合成研究,假如知道一个药物分子的结构,人工智能系统可以根据它的结构分析出很多种合成路线,并且推荐一个最佳路线。”李承辉说,如果是以前,这样的研究需要非常有经验的有机化学专家才能实现,但是将来在人工智能的帮助下,从事无机化学的研究人员也可以做到。
而在合成结构比较复杂的目标分子时,比如需要20多个步骤才能合成出来的天然界存在的复杂分子,人工智能程序可以预测出很多条不同的路线。
“研究人员可能只能想出20多个合成路线,而这些程序可能会提供上百条可能的合成路线,这对于研究人员来说非常有帮助,因为有些路线可能从未想过。”马大为说。
马大为告诉科技日报记者,根据人工智能程序提供的预测路线,有经验的研究人员可以从中判断出哪些路线是好的,哪些是有提示意义的,进而帮助研究人员思考一些问题。这可以为化学合成提供更多的机会。因为根据人工智能程序的提示,再加上人脑进一步深度思考,可能会设计出更好的化学合成路线。
未来只需“照药开方”
马大为认为,上述变化对化学合成来说,意义非常重大。因为将来人工智能程序可能像“傻瓜机”一样,科研人员在进行化学合成时只需按照它的推荐“照药开方”。
过去,了解一个化学反应条件是否可行,就是不断试错的过程。需要人工一个一个去测试,包含大量的重复性劳动。如今,可以利用人工智能对化学反应数据进行快速检测,然后在机器上进行通量的反应条件测试,整个系统一天可以做上千个反应条件的测试。换成人工,一个实验室里每天做20个化学反应测试就已经很不错了。
马大为告诉科技日报记者,一些大型制药公司已经将人工智能用于辅助设计化学合成路线,成为此类技术的第一批用户。除了药物研发,新材料研发等包含化合物合成的领域都可利用人工智能进行化学合成路线推荐。
“将来,合成以往不存在的分子就像盖房子一样,先让人工智能把蓝图描绘出来,研究人员只要按着蓝图去搭建就行。”马大为说。
李承辉也认为,人工智能在化学领域将大有可为。在他看来,未来化学领域的人工智能应用将像人工智能医生一样,它能够掌握和消化海量合成方法、合成路线、材料结构和性能等,科研人员做化学合成研究时,它可以帮助分析和解决很多问题。
不过总的来说,人工智能扮演的角色仍是辅助性的。它可以将化学研究人员从繁重的手工劳动中解放出来,并为他们的研究提供一些参考和借鉴。但其推荐的结果也需要研究人员利用专业知识和经验去判断,哪些是真正可行的。
此外,人工智能推荐化学合成路线目前仍处于模型机阶段。马大为认为,化学研究人员需要不断地为人工智能提供一些创新策略,推动人工智能系统不断优化,后者再反过来推动化学研究人员进行更深入的研究。
相关链接
人工智能机器人助力快速发现新分子
早在去年,英国格拉斯哥大学的化学家们已经讨论了如何训练一个人工智能有机化学合成机器人来自动探索大量的化学反应。
这种“自我驱动”的系统以机器学习算法为基础,可以发现新的反应和分子,允许利用数字化学数据驱动的方法来定位感兴趣的新分子,而不是局限于一个已知的数据库和常规的有机合成规则。其结果可能降低发现新的药物分子、新化学产品(包括材料)、聚合物及用于高科技应用(如成像)分子的成本。
研究小组通过使用18种不同的起始化学物质的组合来模拟大约1000种反应,展示了该系统的潜力。在探索了大约100种的可能反应后,机器人能够以超过80%的准确率预测出哪些初始化学物质的组合应该被探索以产生新的反应和分子。通过探索这些反应,他们发现了一系列以前不为人知的新分子和反应。研究人员发现了4个新反应,其中一个反应被归入已知最独特反应的前1%。
研究者表示,这种方法是化学数字化的关键一步,它将允许对化学空间(chemicalspace)进行实时检索,从而帮助新药物的发现,并削减成本,节省时间,提高安全性,减少浪费,帮助化学进入一个新的数字时代。(刘园园)
(责编:王小艳、王珩)分享让更多人看到
人工智能教育的现状与前景分析
人工智能和教育的关系越来越密切,因为它可能革新我们的教学方式。相关数据表明,全球大约有2.65亿儿童不能上学,还有约6亿儿童的小学数学、写作、阅读等都不熟练,而人工智能作为新兴技术,已经剧烈改变了孩子们的教育模式。
人工智能可以让声音转换成文字,能通过拍照的方式将纸上的文字全部转换为电子文档,数学、物理等学科都可以通过人工智能来进行批改。也可以帮助说方言的孩子学习普通话和外语。技术的提升和机器的运算处理不断升级,都为人工智能的发展提供了极大的动力支持,也为教育带来了更加便捷的方式。
未来AI+教育应用场景
01
教育环境
利用计算技术实现物理空间和虚拟空间的融合、基于人工智能技术作为智能引擎,建立支持多样化学习需求的智能感知能力和服务能力。
02
学习过程
在各类人工智能技术的支持下,构建认知模型、知识模型、情境模型,并在此基础上针对学习过程中的各类场景进行智能化支持,实现学习者和学习服务的交流、整合、重构、协作、探究和分享。
03
教育评价
在试题生成、自动批阅、学习问题诊断等方面发挥重要的评价作用,还可以对学习者学习过程中知识、身体、心理状态的诊断和反馈,在学生综合素质评价中发挥不可替代的作用,包括学生问题解决能力的智能评价、心理健康检测与预警、体质健康检测与发展性评估,学生成长与发展规划等。
04
教师助理
替代教师日常工作中重复的、单调的、规则的工作,还可以增强教师的其他工作能力,使得教师能够处理以前无法处理的复杂事项。对学生提供以前无法提供的个性化、精准的支持,传授知识效率大幅度提升,有更多的时间与精力来关注每个学生的身心全面发展。
05
管理与服务
通过大数据的收集和分析建立起智能化的管理手段,形成人机协同的决策模式,洞察教育系统运行过程中问题本质与发展趋势,有效提升教育质量并促进教育公平。
人工智能在传统教育领域的广泛应用,为传统的教育模式注入了新的活力。推动了教学与管理模式的变革,也使教育在一次又一次的变革中不断探索新的方向。未来,在人工智能时代,全智能化、个性化的优质教育或许离我们并不遥远。返回搜狐,查看更多
智能化工:人工智能在化学材料合成的应用 AI加速化学材料合成
在化工领域,对化合物性质的评估(分子诊断)已经进入通量筛选阶段,但是化学合成这一步骤仍停留在手工操作阶段。研究人员需要投入大量的时间精力,才能分析出正确的化学合成路径,但是人工合成产率较低、试错成本过高,导致合成化学技术在药物、材料领域中的商业应用价值不足。因此,引入AI+化学合成尤为重要,利用人工智能的逆合成分析、机器学习、神经网络等技术,预测合成路径,通量筛选,快速寻找到最有潜力的合成路径。
作者|王柳茜、陆少游
一、化学材料合成产业及市场情况
合成化学技术在合成材料和合成药物领域中应用较广,但由于不同化学反应条件下的无穷变化,该领域慢慢成为劳动密集型行业。分析过程中需要大量经验积累,才有可能打通正确的合成路径,而合成步骤太多、产率太低或者成本过高,使很多分析结果止步于论文发表,真正能够实现商业化,成为一种材料、制药工业方法的则更是凤毛麟角。
随着大数据和人工智能的发展,AI+化学合成刚刚起步,以上痛点正逐渐被解决。目前在整个化学合成应用领域中,上游市场关注于合成路线的设计,包括辅助研究人员逆向合成预测、路线筛选等;而中游市场囊括了自动化仪器和机器人平台的开发;下游市场集中于医药企业及材料平台的实验室分析服务、企业集成解决方案等。上游市场依旧占主体,但下游市场的研究与应用才是这个行业商业价值的实际产出。来自于企业的需求,既能丰富中游产品的产出,同时也能够为上游研究的优化提供建议,从而活化整个市场行业。
二、化学材料合成中的人工智能技术
机器学习:典型的监督性机器学习模型指利用规律对数据进行预测分析的算法。该项技术在化学合成领域中主要应用于根据已有的化学物的结构分析出多种合成路线,预测材料化学性质、谱图模拟以及路线的算法优化。
神经网络:在蒙特卡洛树步骤中引入深度神经网络能够提高计算精度与效率。该项技术在化学合成领域中既可用于寻找路径,也可对可能的逆合成路线进行初步筛选,用于训练神经网络的测试集包括了所有过往的有机化学反应。
计算机视觉:计算机视觉指机器代替人眼对目标进行识别、跟踪和测量。该项技术在化学合成领域中主要应用于分子合成中的结构块形态、反应的起始点和节点的识别。
推荐系统:推荐系统是信息过滤系统的一个子类,它根据系统所设定的条件,借助自身云计算的能力所实现。该项技术能够帮助化学家在多种合成路径当中筛选出简洁高效的最优方法。
大数据技术:其基础技术包括数据采集、数据预处理及数据库等。该项技术应用在化学合成领域中包括识别关联的数据集和数据流,创建分子感知的数据结构,并生成、细化和验证模型,并根据数据化的模型结果来提出建议。
机器人技术:在化学合成行业中,机器人技术主要应用于以机器人执行的自动化合成平台,机器人辅助执行所有合成操作流程,组装连续流动路径,实现自动化合成。包括自动检测机器人、自动控制机器人、自动合成机器人。
三、人工智能在化学材料合成领域的应用分布
四、人工智能技术在化学材料合成领域的应用案例
创腾科技(人工智能与分子模拟平台):平台主要分为材料模拟计算平台和药物发现与生物大分子计算模拟平台,用“虚拟实验”替代耗时费力的“试错实验”,把握正确的创新方向,为企业极大降低研发投入和风险。其中的MaterialsStudio材料模拟软件以可视化视窗界面为核心,涵盖多学科模块;DiscoveryStudio是基于PipelinePilot构建的分子模拟平台,它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白质结构功能研究,以及药物发现。
Wiley(Chemplanner):Wiley开发了一款建立在“大数据”和“机器学习”基础上的化学合成软件Chemplanner。作为计算机辅助有机合成设计系统,它可以通过云计算帮助化学家在多种合成路径中筛选出简洁高效的最优方法,更重要的是,它能完成从目标产物到可获取的起始原料间的逆合成分析。此外,Chemplanner还可以根据需要(如成本控制,有无催化剂等)重新设计路线。
美国麻省理工学院(ASKCOS):这一套可用于化学合成反应的开源软件套件,可以根据训练数据来确定反应的转变和条件是否适合构筑新的化合物,在系统流程的最后一步中,配方被加载进入机器人平台,机器人操作臂将模块式反应器、分离器和其他处理单元等组装成连续的合成路径进行反应。新系统能够处理的反应类型从12种上升为30种,最简单的合成过程只需两个小时。
Citrine(智能材料平台):Citrine通过定制培训内容,培养企业客户自主使用Citrine平台,以便他们可以不断从该技术中获得最大的商业价值,寻找范围适合的第一批项目,识别关联的数据集并传输到Citrine平台,团队可共建一个模型,使用模型结果来建议应该合成和测试哪些候选材料。
德国马克斯-普朗克胶体与界面研究所(自动化径向合成设备):该设备用于小分子自动化合成,集循环合成和线性合成的优势于一身,不需要在不同工艺之间进行费时费力的手动调整,该系统确保了反应的可重复性,只要输入相同质量的物料,给定的合成指令将在另一个相同系统上以完全相同的方式执行。反应数据将返回给设备,以便进行深度学习。
五、人工智能在化学材料合成领域应用的局限性
高端人工智能人才缺口:在AI+化学合成领域中,底层方案的鉴别和筛选可以由初级研究人员完成,但是预测路径的开发、定向合成的优化等步骤,往往需要更高级的技术人员作为总设计师,目前企业和高校缺乏体系化的材料/药物+信息学人才培养方案。
缺乏完善的商业机制:目前,人工智能+化学合成的开发更多停留在实验室阶段,市场并未形成清晰的产业链合作方式,数据共享机制不足、设备接口不统一。这造就来自不同化学合成市场层级的商业模式不统一,发展速度较缓。
六、人工智能在化学材料合成领域的发展趋势
绿色合成:未来的合成化学将更加强调原子的经济性,实现绿色合成的目标,这将主要依赖对反应机制的深入研究。通过对反应目标在基元步骤和原子层面的认识,寻找合适的催化剂,通过特定化学键的选择性活化,实现原子水平的精准操控,AI在该领域的深度发展将需要底层学科的助力。
化学合成与生物合成的结合:生物合成利用基因剪接构建遗传密码,让细胞来完成设计人员设想的各种任务,以期利用合成研究人员所需的生物材料、新药和改进的药物。合成化学与合成生物学相比较而言,前者的主要优势在于结构的可变性,而后者的主要优势在于过程的经济性。两个学科融合可综合两方优势,使物质合成具有更高的效率与更多样的结构。
*本文为「智周」系列报告「核心版」,相应「深度版」的推出计划将在后续公布,敬请大家关注。针对「人工智能在化学材料合成领域中的应用」这一主题,有哪些方向或主题,你希望在报告深度版中读到详细的阐述与分析,欢迎留言,这将成为我们制作报告深度版的重要参考
关于「智周」系列报告
机器之心「智周」人工智能技术应用报告系列重点关注现有人工智能技术应用较成熟且应用潜力较大的正在进行智慧升级的传统行业及场景,逐行业、逐场景为产业用户高效而不失深度地呈现不同人工智能技术的产业落地现状、企业案例、技术应用趋势等。「智周」人工智能技术应用报告系列包含核心版及深度版两个版本:
核心版浓缩精华分析内容至2页内,覆盖重要数据、分析结论及案例简述,以供使用者高效系统地了解人工智能技术在自身所关注产业内的潜在机会。
深度版在核心版的基础上,包含详尽的行业或场景痛点分析、技术解读、落地案例详解及资料附录等,以供有深度研究需求的使用者进行深入探究。
责任编辑:PSY