行业图谱——人工智能在药物发现与研发中的应用
「行业图谱系列」是清华大学国家金融研究院资本市场与公司金融研究中心基于科技成果转化研究的一项子课题,聚焦于科技成果这一核心要素,从技术链视角切入展开的研究项目。通过行业图谱的研究,既为科技成果转化提供了专业性知识体系支撑,也有助于指导城镇产业化发展布局、推动产业链融通创新、引导创业投资基金对“硬科技”的积极性及鼓励金融支持创新体系的建设。本报告为行业图谱的第一个系列——生物医药领域:人工智能在药物发现与研发中的应用。
药物发现和研发是制药企业和化学科学家的重要研究领域。人工智能和机器学习技术使制药领域实现了现代化。机器学习和深度学习算法已被应用于多肽合成、虚拟筛选、毒性预测、药物监测和释放、药效团建模、定量构效关系、药物重定位、多药理和生理活性等药物发现过程。
新药研发存在周期长、费用高和成功率低等特点,人工智能作为药物研发领域的一个热点方向,已被应用到药物研发的各个阶段。本研究从人工智能在药物发现与研发中的应用出发,剖析人工智能在药物发现与研发中的应用技术和方法流程,并探讨该领域下国内外的市场竞争情况和最新研究成果。
人工智能在药物发现与研发中的应用
人工智能(ArtificialIntelligence,AI),指的是计算机系统从输入或过去的数据中学习的能力。根据《人工智能:现代方法》中的讨论,人工智能有七种分类(图1-1)。
图1-1人工智能的分类
如图1-2所示,在新药研发中,第一步也是最重要的一步是确定与疾病病理生理学有关的适当靶点(如基因、蛋白质),然后找到可以干扰这些靶点的药物或类药物分子。人工智能的发展可以帮助提取这些大型生物医学数据集中存在的有用特征、模式和结构。在确定和验证了合适的靶点之后,下一步是寻找合适的药物或类药物分子,这些分子可以与靶点相互作用并引起所需的反应。在大数据时代,通过支配海量的大型化学数据库,协助寻找针对特定靶点的完美药物。
图1-2大数据在药物设计和发现中的应用
人工智能在药物发现与研发中的应用技术和方法流程
在新药研发过程中,常遇到的瓶颈问题有:①寻找合适的、具有生物活性的药物分子;②药物分子难以通过第二阶段临床试验和其他监管批准。利用基于人工智能的工具和技术,提升药物研发的效率,解决上述所面临的药物研发问题。为此,下面将详细介绍人工智能在药物发现与研发中的应用技术和方法流程,如图2-1所示。
图2-1人工智能在药物发现与研发中的应用
肽合成与小分子设计
多肽是一种由大约2至50个氨基酸组成的生物活性小链,由于它们具有跨越细胞屏障的能力并可以到达所需的靶点,因此越来越多地被用于治疗。深度学习于肽合成与小分子设计的应用概念图如图2-2所示。
图2-2人工智能在肽合成与小分子设计的应用
分子通路的鉴定与多重药理学
人工智能和最大似然算法在药物发现和开发中的重要成果之一是预测和估计疾病网络、药物—药物相互作用和药物—靶点关系的总体拓扑和动力学。如图2-3所示,数据库如DisGeNET、STRTCH、STRING分别被用于确定基因—疾病关联、药物—靶标关联和分子途径。
图2-3人工智能在分子通路的鉴定与多重药理学的应用
蛋白质折叠和蛋白质相互作用的预测
分析蛋白质—蛋白质相互作用(Protein-ProteinInteraction,PPI)对于药物开发和发现至关重要,如图2-4所示。比如使用贝叶斯网络(BayesianNetwork,BN)预测PPI,其本质是利用基因共表达、基因本体(GeneOntology,GO)和其他生物过程相似性,集成数据集产生精确的PPI网络。
图2-4人工智能在蛋白质折叠和蛋白质相互作用的预测
基于结构和基于配体的虚拟筛选
在药物设计和药物发现中,虚拟筛选(VirtualScreening,VS)是CADD的重要方法之一,是从化合物库中筛选出有前景的治疗化合物的有效方法(如图2-5所示),以针对目标筛选具有所需活性的化合物。
图2-5人工智能在药物虚拟筛选的应用
药物重定位
在新药研发中,先导化合物的筛选是至关重要的,人工智能在识别新的和潜在的先导化合物方面发挥着巨大的作用。在化学空间中有大约1.06亿个化学结构,他们来自不同的研究,如基因组研究、临床和临床前研究、体内分析和微阵列分析。利用机器学习模型,根据活性位点、结构和靶结合能力可以筛选出这些化学结构。
定量构效关系建模与药物再利用
在药物设计和开发中,研究化学结构和理化性质与生物活性之间的关系是至关重要的。定量构效关系(QuantitativeStructure-ActivityRelationship,QSAR)建模是一种计算方法,通过它可以在化学结构和生物活性之间建立定量的数学模型,并针对其他疾病情况进行重新定位(如图2-6所示)。
图2-6人工智能在定量构效关系建模与药物再利用的应用
化合物的作用方式和毒性预测
药物毒性是指化学分子由于化合物的作用方式或新陈代谢方式而对生物体产生的不利影响。如图2-7所示,人工智能可以预测药物分子与靶点结合和未结合时的效应,以及体内安全性分析。
图2-7人工智能在化合物的作用方式和毒性预测的应用
理化性质和生物活性的预测
众所周知,每一种化合物都与溶解度、分配系数、电离度、渗透系数等物理化学性质有关,这可能会阻碍化合物的药代动力学特性和药物靶向结合效率。因此,在设计新的药物分子时,必须考虑化合物的物理化学性质。为此,已经开发了不同的基于人工智能的工具来预测这些性质(如图2-8所示),包括分子指纹、SMILES格式、库仑矩阵(Coulombmatrices)和势能测量,这些都用于深度神经网络(DeepNeuralNetworks,DNN)训练阶段。
图2-8人工智能在理化性质和生物活性的预测的应用
药物剂量和给药效果的识别
给病人任何不适当剂量的药物都可能导致不良和致命的副作用,多年来,确定能够以最小毒副作用达到预期效果的药物的最佳剂量一直是一个挑战。随着人工智能的出现,许多研究人员正在借助ML和DL算法来确定合适的药物剂量,如图2-9所示。
图2-9人工智能在药物剂量和给药效果的识别应用
生物活性物质预测与药物释放监测
最近研究已经开发了多种在线工具来分析药物释放,以及选定的生物活性化合物作为载体的可行性,其概念图如图2-10所示。利用人工智能研究人员可以确定用于与疾病相关的特定靶点的生物活性化合物。
图2-10人工智能在生物活性物质预测与药物释放监测的应用
病毒疫苗的制备及抗体检测
由于数据量巨大,并且需要自动抽象特征学习,人工智能在疫苗发现领域有着重大贡献(图2-11)。COVID-19冠状病毒疾病疫苗的深度学习和机器学习模型主要集中在人工神经网络、梯度提升决策树和深度神经网络等预测算法模型中。
图2-11人工智能在病毒疫苗的制备及抗体检测的应用
人工智能在制药行业开发新药中的应用
最近对药物开发人工智能的大量投资意味着这些初创公司拥有开发技术的人力和资源。与医疗成像领域的人工智能相比,总投资已经增长了四倍多,尽管两个行业的初创企业数量相当。图3-1显示了基于人工智能的新药研发所需要的条件及关键性技术竞争点。
人工智能成为国际竞争的新焦点。针对基于人工智能的新药研发,企业必须把人工智能发展放在企业战略层面系统布局,打造竞争新优势、开拓市场新空间。
图3-1基于人工智能的新药研发所需要的条件及关键性技术竞争点
①数据质量:构建有效且可解释的药物发现模型的方法之一是使用与药物相关的实体来构建神经网络模型。
②算法设计:大多数研究中使用的低水平穷举对接算法在寻找具有局部最小值的受体—配体相互作用时遇到困难,导致高度的亲和力可变性。因此,对接算法的选择、算法结构的设计和评价标准的设置都需要系统地改进。
③临床试验:药物或疫苗开发与临床应用的计算工作之间的转化差距是计算生物学和医学领域的一个主要且被广泛认可的瓶颈。许多预测的药物和疫苗尚未进入临床试验。
④硬件设施:目前,云端和边缘设备在各种人工智能应用中通常是配合工作的,随着边缘设备能力不断增强,越来越多的计算工作负载将在边缘设备上执行。新型人工智能芯片主要包括神经形态芯片、近内存计算芯片等,目前仍处于探索研发阶段。
国际顶级医疗公司在人工智能新药研发的最新研究成果
全球已上市的制药企业见下表3-1,重点关注美国、德国、英国和中国。
表3-1全球已上市或进入临床的人工智能制药企业
国外相关技术早在2000年左右即开始进行院校的科技成果转化。相对而言,我国该领域的研发跟随国际,在新冠疫情之后研究团队开始增加,并注重成果转化的同步进行。基于中国国内院校学者的调研及文献报道,国内学者的研究重点同样集中在递送系统上,如表3-2所示:
表3-2AI制药中国学者定位
作者
朱雅姝清华大学国家金融研究院资本市场与公司金融研究中心高级研究专员
安砾清华大学五道口金融学院副教授、清华大学国家金融研究院资本市场与公司金融研究中心副主任
邮箱rccmcf@pbcsf.tsinghua.edu.cn
感谢资本市场与公司金融研究中心的实习生许喜远(清华大学医学院2022级博士生)对本报告的助研工作。
点击“阅读原文”获取报告全文
人工智能前沿——深度学习热门领域(确定选题及研究方向)
近年来,人工智能发展迅猛,其主要动力来自深度学习。深度学习的炙手可热源自于它对人工智能技术发展的整体促进和在广泛应用场景中的巨大应用价值。毫无疑问,深度学习仍旧是当今时代人工智能前沿技术的核心。目录一、计算机视觉(CV)1.图像分类2.目标检测3.目标分割二、自然语言处理(NLP)1.文本分类2.生成式任务3.语音识别YOLO算法改进可关注并留言博主的CSDN/QQ>>>一起交流!互相学习!共同进步!一起交流!互相学习!共同进步!智能化工:人工智能在化学材料合成的应用 AI加速化学材料合成
在化工领域,对化合物性质的评估(分子诊断)已经进入通量筛选阶段,但是化学合成这一步骤仍停留在手工操作阶段。研究人员需要投入大量的时间精力,才能分析出正确的化学合成路径,但是人工合成产率较低、试错成本过高,导致合成化学技术在药物、材料领域中的商业应用价值不足。因此,引入AI+化学合成尤为重要,利用人工智能的逆合成分析、机器学习、神经网络等技术,预测合成路径,通量筛选,快速寻找到最有潜力的合成路径。
作者|王柳茜、陆少游
一、化学材料合成产业及市场情况
合成化学技术在合成材料和合成药物领域中应用较广,但由于不同化学反应条件下的无穷变化,该领域慢慢成为劳动密集型行业。分析过程中需要大量经验积累,才有可能打通正确的合成路径,而合成步骤太多、产率太低或者成本过高,使很多分析结果止步于论文发表,真正能够实现商业化,成为一种材料、制药工业方法的则更是凤毛麟角。
随着大数据和人工智能的发展,AI+化学合成刚刚起步,以上痛点正逐渐被解决。目前在整个化学合成应用领域中,上游市场关注于合成路线的设计,包括辅助研究人员逆向合成预测、路线筛选等;而中游市场囊括了自动化仪器和机器人平台的开发;下游市场集中于医药企业及材料平台的实验室分析服务、企业集成解决方案等。上游市场依旧占主体,但下游市场的研究与应用才是这个行业商业价值的实际产出。来自于企业的需求,既能丰富中游产品的产出,同时也能够为上游研究的优化提供建议,从而活化整个市场行业。
二、化学材料合成中的人工智能技术
机器学习:典型的监督性机器学习模型指利用规律对数据进行预测分析的算法。该项技术在化学合成领域中主要应用于根据已有的化学物的结构分析出多种合成路线,预测材料化学性质、谱图模拟以及路线的算法优化。
神经网络:在蒙特卡洛树步骤中引入深度神经网络能够提高计算精度与效率。该项技术在化学合成领域中既可用于寻找路径,也可对可能的逆合成路线进行初步筛选,用于训练神经网络的测试集包括了所有过往的有机化学反应。
计算机视觉:计算机视觉指机器代替人眼对目标进行识别、跟踪和测量。该项技术在化学合成领域中主要应用于分子合成中的结构块形态、反应的起始点和节点的识别。
推荐系统:推荐系统是信息过滤系统的一个子类,它根据系统所设定的条件,借助自身云计算的能力所实现。该项技术能够帮助化学家在多种合成路径当中筛选出简洁高效的最优方法。
大数据技术:其基础技术包括数据采集、数据预处理及数据库等。该项技术应用在化学合成领域中包括识别关联的数据集和数据流,创建分子感知的数据结构,并生成、细化和验证模型,并根据数据化的模型结果来提出建议。
机器人技术:在化学合成行业中,机器人技术主要应用于以机器人执行的自动化合成平台,机器人辅助执行所有合成操作流程,组装连续流动路径,实现自动化合成。包括自动检测机器人、自动控制机器人、自动合成机器人。
三、人工智能在化学材料合成领域的应用分布
四、人工智能技术在化学材料合成领域的应用案例
创腾科技(人工智能与分子模拟平台):平台主要分为材料模拟计算平台和药物发现与生物大分子计算模拟平台,用“虚拟实验”替代耗时费力的“试错实验”,把握正确的创新方向,为企业极大降低研发投入和风险。其中的MaterialsStudio材料模拟软件以可视化视窗界面为核心,涵盖多学科模块;DiscoveryStudio是基于PipelinePilot构建的分子模拟平台,它服务于生命科学领域的实验生物学家、药物化学家、结构生物学家、计算生物学家和计算化学家,应用于蛋白质结构功能研究,以及药物发现。
Wiley(Chemplanner):Wiley开发了一款建立在“大数据”和“机器学习”基础上的化学合成软件Chemplanner。作为计算机辅助有机合成设计系统,它可以通过云计算帮助化学家在多种合成路径中筛选出简洁高效的最优方法,更重要的是,它能完成从目标产物到可获取的起始原料间的逆合成分析。此外,Chemplanner还可以根据需要(如成本控制,有无催化剂等)重新设计路线。
美国麻省理工学院(ASKCOS):这一套可用于化学合成反应的开源软件套件,可以根据训练数据来确定反应的转变和条件是否适合构筑新的化合物,在系统流程的最后一步中,配方被加载进入机器人平台,机器人操作臂将模块式反应器、分离器和其他处理单元等组装成连续的合成路径进行反应。新系统能够处理的反应类型从12种上升为30种,最简单的合成过程只需两个小时。
Citrine(智能材料平台):Citrine通过定制培训内容,培养企业客户自主使用Citrine平台,以便他们可以不断从该技术中获得最大的商业价值,寻找范围适合的第一批项目,识别关联的数据集并传输到Citrine平台,团队可共建一个模型,使用模型结果来建议应该合成和测试哪些候选材料。
德国马克斯-普朗克胶体与界面研究所(自动化径向合成设备):该设备用于小分子自动化合成,集循环合成和线性合成的优势于一身,不需要在不同工艺之间进行费时费力的手动调整,该系统确保了反应的可重复性,只要输入相同质量的物料,给定的合成指令将在另一个相同系统上以完全相同的方式执行。反应数据将返回给设备,以便进行深度学习。
五、人工智能在化学材料合成领域应用的局限性
高端人工智能人才缺口:在AI+化学合成领域中,底层方案的鉴别和筛选可以由初级研究人员完成,但是预测路径的开发、定向合成的优化等步骤,往往需要更高级的技术人员作为总设计师,目前企业和高校缺乏体系化的材料/药物+信息学人才培养方案。
缺乏完善的商业机制:目前,人工智能+化学合成的开发更多停留在实验室阶段,市场并未形成清晰的产业链合作方式,数据共享机制不足、设备接口不统一。这造就来自不同化学合成市场层级的商业模式不统一,发展速度较缓。
六、人工智能在化学材料合成领域的发展趋势
绿色合成:未来的合成化学将更加强调原子的经济性,实现绿色合成的目标,这将主要依赖对反应机制的深入研究。通过对反应目标在基元步骤和原子层面的认识,寻找合适的催化剂,通过特定化学键的选择性活化,实现原子水平的精准操控,AI在该领域的深度发展将需要底层学科的助力。
化学合成与生物合成的结合:生物合成利用基因剪接构建遗传密码,让细胞来完成设计人员设想的各种任务,以期利用合成研究人员所需的生物材料、新药和改进的药物。合成化学与合成生物学相比较而言,前者的主要优势在于结构的可变性,而后者的主要优势在于过程的经济性。两个学科融合可综合两方优势,使物质合成具有更高的效率与更多样的结构。
*本文为「智周」系列报告「核心版」,相应「深度版」的推出计划将在后续公布,敬请大家关注。针对「人工智能在化学材料合成领域中的应用」这一主题,有哪些方向或主题,你希望在报告深度版中读到详细的阐述与分析,欢迎留言,这将成为我们制作报告深度版的重要参考
关于「智周」系列报告
机器之心「智周」人工智能技术应用报告系列重点关注现有人工智能技术应用较成熟且应用潜力较大的正在进行智慧升级的传统行业及场景,逐行业、逐场景为产业用户高效而不失深度地呈现不同人工智能技术的产业落地现状、企业案例、技术应用趋势等。「智周」人工智能技术应用报告系列包含核心版及深度版两个版本:
核心版浓缩精华分析内容至2页内,覆盖重要数据、分析结论及案例简述,以供使用者高效系统地了解人工智能技术在自身所关注产业内的潜在机会。
深度版在核心版的基础上,包含详尽的行业或场景痛点分析、技术解读、落地案例详解及资料附录等,以供有深度研究需求的使用者进行深入探究。
责任编辑:PSY